#InterSystems IRIS for Health

0 关注者 · 924 帖子

InterSystems IRIS for Health™ 是全球第一个也是唯一一个专门为医疗应用程序的快速开发而设计的数据平台,用于管理全世界最重要的数据。它包括强大的开箱即用的功能:事务处理和分析、可扩展的医疗保健数据模型、基于 FHIR 的解决方案开发、对医疗保健互操作性标准的支持等等。所有这些将使开发者能够快速实现价值并构建具有突破性的应用程序。了解更多信息

新增
文章 姚 鑫 · 15 小时 前 2m read

大家好!

我很高兴与大家分享一下,在深入研究InterSystems IRIS数据平台数年之后,我终于将自己的项目经验总结成了一本新书:《IRIS编程技术指南》。

撰写这本书对我来说是一项重大的工程挑战。

我的目标是弥合"理解语法 "与 "构建可投入生产的项目 "之间的差距。

为了庆祝本书的发布并为社区做出贡献,我想与大家分享书中的两个具体的技术见解,我相信每个IRIS开发人员都会发现这些见解非常有用。

💡 技术洞察 1:为初学者揭秘 Global 结构

许多新开发者往往把 IRIS 仅仅看作另一个 SQL 数据库。在我的书中,我强调:要真正掌握 ObjectScript,关键在于理解 Globals——即底层的多维存储机制。

核心要点:我会详细讲解 IRIS 是如何将类属性映射到 Global 节点上的。一旦初学者意识到,‘保存一个对象’本质上就是‘设置一个带下标的 Global’,那么性能调优和数据索引背后的逻辑就会豁然开朗。这正是每一位 IRIS 新手都会经历的‘顿悟时刻’。

💡技术洞察 2:%Persistent 类的最佳实践

对于从 Java 或 C# 转向 IRIS 的开发人员来说,适应 IRIS 处理持久化的方式往往是一个常见的挑战。

核心要点:在书中,我深入浅出地讲解了 IRIS 内部的对象关系映射(ORM)概念。

0
0 6
新增
文章 Kelly Huang · 五月 7 5m read

持续训练(CT)流水线将基于特定时间点可用数据,通过数据科学实验开发出的机器学习(ML)模型规范化。它不仅为模型部署做好准备,还支持在新数据可用时进行自主更新,同时具备用于审计目的的稳健性能监控、日志记录和模型注册功能。

InterSystems IRIS 已经提供了支持此类流水线所需的几乎所有组件。然而,缺少一个关键要素:标准化的模型注册工具。在本文中,我将介绍一种结合 IRIS 优势与开源 AI 工程平台 MLflow 的方法。它们共同作为构建有效持续训练(CT)流水线的互补工具。

本仓库中的实现利用了 MLflow 的内置配置来存储 SHAP 解释器,以提供对相应模型预测结果的解释,包括随机森林(Random Forest)、XGBoost、神经网络等“黑盒”复杂模型。

**演示视频**:https://youtu.be/qLdc4jhn83c

---

CT 流水线组件

该 CT 流水线模块背后的理论基于 Google 在相关文章中定义的 MLOps 1 级行业标准。每个组件的实现都利用了 IRIS 和 MLflow 的最佳特性(如下图所示,红色部分突出显示):

对于那些刚接触 CT 流水线的人来说,上图描述了数据科学项目中传统的实验阶段(上半部分“实验/开发/测试”,通常在 Jupyter Notebook 中进行)如何转化为生产级模型部署。

0
0 6