#Artificial Intelligence (AI)

0 关注者 · 48 帖子

人工智能 (AI) 是通过机器(尤其是计算机系统)对人类智能过程进行的模拟。这些过程包括学习(获取信息和使用信息的规则)、推理(使用规则得出近似或确定的结论)和自我纠正。

了解更多信息

新增
文章 Kelly Huang · 五月 7 5m read

持续训练(CT)流水线将基于特定时间点可用数据,通过数据科学实验开发出的机器学习(ML)模型规范化。它不仅为模型部署做好准备,还支持在新数据可用时进行自主更新,同时具备用于审计目的的稳健性能监控、日志记录和模型注册功能。

InterSystems IRIS 已经提供了支持此类流水线所需的几乎所有组件。然而,缺少一个关键要素:标准化的模型注册工具。在本文中,我将介绍一种结合 IRIS 优势与开源 AI 工程平台 MLflow 的方法。它们共同作为构建有效持续训练(CT)流水线的互补工具。

本仓库中的实现利用了 MLflow 的内置配置来存储 SHAP 解释器,以提供对相应模型预测结果的解释,包括随机森林(Random Forest)、XGBoost、神经网络等“黑盒”复杂模型。

**演示视频**:https://youtu.be/qLdc4jhn83c

---

CT 流水线组件

该 CT 流水线模块背后的理论基于 Google 在相关文章中定义的 MLOps 1 级行业标准。每个组件的实现都利用了 IRIS 和 MLflow 的最佳特性(如下图所示,红色部分突出显示):

对于那些刚接触 CT 流水线的人来说,上图描述了数据科学项目中传统的实验阶段(上半部分“实验/开发/测试”,通常在 Jupyter Notebook 中进行)如何转化为生产级模型部署。

0
0 12
文章 Lilian Huang · 四月 30 7m read

我们一开始并没有大的人工智能战略。

我们有一个传统的 InterSystems Caché 2018 应用程序、大量老旧的业务逻辑和一个实际需求:构建一个新的用户界面并改进已运行多年的代码。起初,我认为人工智能编码代理只能帮助完成一小部分工作。也许是一些模板、系统周围的一些 REST 工作,以及帮助阅读旧的 ObjectScript。

但实际上,它的作用远不止这些。

当我们开始认真使用它时,我们意识到它可以跨越庞大的代码库,理解模式,提出重构建议,并帮助我们以比我预期快得多的速度实现 Caché 的现代化。但这只是在开始时经历了一段令人沮丧的时期之后才发生的。

真正的挑战不是获得代码建议。而是教会代理我们的 Caché 环境如何实际运行。

我们为什么能使用它

在进行任何技术工作之前,我们必须回答一个安全问题。

我们不能将企业资源规划代码和内部业务逻辑直接发送给公共人工智能服务,并寄希望于最好的结果。这样做永远无法通过严格的安全审查。

亚马逊 Bedrock 改变了我们的想法。我们的服务器、数据和开发环境已经在 AWS 中,因此 Bedrock 可以很自然地融入我们已经信任和管理的云环境。我们可以使用该模型,同时将流量、访问控制和周边安全控制保持在我们已经在使用的 AWS 框架内。

0
0 15
文章 Lilian Huang · 四月 15 8m read

关键词 氛围编码(Vibe coding), Windsurf, IRIS, TIE

为什么不呢? "氛围编码 "从来都与氛围无关!( "Vibe coding" is never about the vibe!)

迄今为止,有人没有尝试过 "氛围编码(vibe coding) "吗?

即使仅仅在三年前,如果有人问

  • "我可以用英语、西班牙语或只用中文为 NHS TIE 实施 IRIS 吗?"或
  • "我能否用英语指示 TIE 建立自己的 e2e 路由,获取 PDF 报告,然后将其转化为 ORU/MDM 信息并提交到 PAS?
  • "我们能否只用英语查询 IRIS 数据库,并根据英语指令建立仪表板或我自己的特别报告?

你可能会大笑一声,尽量不生气,找把椅子坐下来,开始计算光是这些分析/SoW/需求/设计/测试/服务文档就需要多少人*日或人*周,以及实际工程工作。

然而,随着基础模型的飞跃和进步,今天的情况肯定会变得更加现实。

我也希望了解其他人是如何使用它的。 以下只是我自己匆忙写下的随笔。

范围

  • IDE:**Windsurf (是的,它还在那里) **或 Cursor 等(现在大约有 20 多个流行/强大的),或者只是带有此类扩展的 VSCode。
0
0 139