最佳实践 | Chinese InterSystems Developer Community

文章

Qiao Peng · 三月 17 阅读大约需 12 分钟

生成式大语言模型和检索增强生成

近来生成式大语言模型掀起了革命性的AI浪潮。生成式大语言模型是什么原理？我们怎么在业务中利用它？

一. 大语言模型的工作原理

生成式大语言模型是生成式人工智能底层的机器学习模型，是一种用于自然语言处理的深度学习模型。

人工智能、机器学习与大语言模型的关系如下图：

1.1 为什么我们称之为大语言模型？

大语言模型的“大”体现在多个方面：

#数据库 #最佳实践 #InterSystems IRIS #InterSystems IRIS for Health

2 0

0 312

文章

Qiao Peng · 十二月 4, 2023 阅读大约需 8 分钟

通用RESTful 业务服务和业务操作

1. 通用RESTful业务服务和业务操作

InterSystems IRIS 提供了一组通用的RESTful 业务服务和业务操作类，用户无需开发自定义的业务服务和业务操作类，就可以直接向外提供RESTful服务和调用外部的RESTful API。

#业务服务 #业务运营 #工具 #提示和技巧 #新手 #最佳实践 #HealthShare #InterSystems IRIS #InterSystems IRIS for Health

0 0

2 78

文章

Qiao Peng · 六月 11, 2023 阅读大约需 7 分钟

统一语义数据平台

数据平台一直在进化：从数据中心到数据中台，离散的数据资产得到进一步梳理和整合、按业务封装数据和操作数据的方法，并逐步提供了企业统一的访问、更新、检索、查询等数据服务。

然而市场上不乏听到数据平台的成功案例，却鲜见这些案例得到大规模推广。原因是什么呢？

一. 传统数据平台建设的挑战

传统数据平台的数据模型基于各自厂商的理解，缺乏统一行业数据模型和行业语义。可供参考的国内卫生信息数据元、数据集标准并非完整的行业语义，例如没有业务实体模型和数据元关系定义。传统的数据平台建设通常根据业务域，围绕数据应用需求组织数据。经常看到按业务域划分为CDR（临床数据中心）、ODR（运营数据中心）、RDR（科研数据中心）......

这造成了几个挑战：

1. 按业务域、而非业务实体来划分数据，虽然方便相应的业务域数据分析，但跨业务域重叠的业务实体数据，例如患者，需要跨数据中心同步。这些同步由于数据模型上的差异，往往非全息拷贝。随着同步次数越多，跨数据中心的数据越失真，造成数据资产多源不统一、数据资产一致性问题和时效性问题。

2. 数据平台产品语义表达上参差不齐，业务用户依赖数据工程师对数据理解和操作，无论是统计分析还是机器学习，海量的实施工作无法满足业务敏捷性要求；

#大数据 #最佳实践 #InterSystems IRIS for Health

3 0

3 573