#Vector Search

0 关注者 · 20 帖子

向量搜索是一种用于信息检索和机器学习的方法，它根据作为向量的数学表示来查找相似的条目。在这种方法中，每个条目被表示为一个高维向量，每个维度对应于该条目的一个特征或特性。然后，向量搜索算法比较这些向量，以找到相似条目，例如具有相似特征或在向量空间中靠得很近的条目。点击这里阅读更多内容。

全部

热帖

按更新时间

文章 Nicky Zhu · 三月 20 10m read

iris-pgwire：借助AI与规范，理性构建软件

陷入困境

直到今年年初，我几乎没怎么做过编程工作——我已经厌倦了它。

在担任多年一线软件工程师和数据科学家后，我在2015年左右陷入了职业倦怠。我转而从事以“外部创新”为主的业务拓展角色，并于2019年加入InterSystems担任产品经理。我怀念编程的创造性，但并不怀念其中的枯燥乏味。无休止的样板代码编写、调试和上下文切换让我创意枯竭。就像电影《好好先生》（Yes Man)中金·凯瑞饰演的角色一样，我发现自己对新项目总是说“不”——以至于我换了职业！

然后，AI编程助手出现了。而我，成了对机器人说“好”的“好好先生”。

第一幕：狂热（“对一切都说好！”）

当我刚开始使用AI编程助手（先是Windsurf，然后是Cline，接着是Roo Code，现在是Claude Code，还尝试过opencode）时，感觉就像变魔术一样。自然语言 → 可运行的代码。我对每个建议、每个重构、几乎每个疯狂的想法都说“好”。

我第一个主要的AI辅助项目是几个月前启动的一个内部项目——为IRIS开发的一系列Python脚本和管道。我兴奋不已，让机器人尽情发挥： “添加这个功能！”——好！“重构那个模块！”——好！“让它可配置！”——好！“添加更多集成！”——好！

创意的能量回来了。代码如泉涌。我又感到自己高效了起来。

然后，我的实习生——一名软件工程专业的学生——查看了代码库。

他并不满意。

#InterSystems IRIS #Docker #GitHub #JDBC #Python #SQL #Vector Search #兼容性 #工具 #性能

0 0

0 97

文章 Lilian Huang · 三月 8 2m read

人工智能助力临床匹配：基于InterSystems IRIS for Health的人工智能患者匹配引擎

在现代医疗保健领域，寻找临床上相似的患者往往感觉像大海捞针。传统的关键字搜索往往会失败，因为医学语言具有高度的细微差别；搜索 "心力衰竭 "可能会漏掉包含 "充血性心力衰竭 "的记录。

我很高兴与大家分享 iris-medmatch，这是一个基于InterSystems IRIS for Health的人工智能患者匹配引擎。通过利用矢量搜索（vector search），该工具能够理解临床意图，而不仅仅是匹配字面字符串。
## 核心创新：语义临床搜索

iris-medmatch "在原始FHIR数据和可操作的人工智能洞察力之间架起了一座桥梁。该引擎利用 "all-MiniLM-L6-v2 "模型，将临床条件转化为数学向量。

标准搜索查找的是准确的单词，而该引擎能理解**临床上下文**。例如，它可以使用数学向量相似性将 "高血压 "患者与 "高血压 "搜索匹配起来。

✨ 主要技术特点

核心：InterSystems IRIS、嵌入式 Python、InterSystems FHIR 服务器、矢量搜索
人工智能：Python、ONNX 运行时、HuggingFace 变换器
前端Angular 18+

技术架构

该解决方案的优势在于其架构效率。通过嵌入式 Python 运行 Transformers，我们消除了 "数据重力 "问题。数据留在 IRIS 中，人工智能处理在数据所在的地方进行。

🚀应用演练

#HealthShare #InterSystems IRIS #InterSystems IRIS for Health ##嵌入式 Python #Angular #FHIR #GitHub #Python #Vector Search #性能

Open Exchange

0 0

0 211

文章 Jeff Liu · 二月 11 1m read

将IRIS用作向量数据库

InterSystems IRIS的嵌入式向量搜索功能使我们能够搜索非结构化和半结构化数据。数据被转换为向量（也称为 "嵌入"），然后存储在 InterSystems IRIS 中并编制索引，用于语义搜索、检索增强生成（RAG）、文本分析、推荐引擎和其他用例。

这是一个将 IRIS 用作向量数据库和在 IRIS 上进行相似性搜索的简单演示。

先决条件：

Python

InterSystems IRIS for Health - 因为它将用作向量数据库

存储库： https://github.com/piyushisc/vectorsearchusingiris

操作步骤

clone软件仓库。

打开 VS Code，连接到所需的 IRIS 实例和命名空间并编译类。

打开 IRIS 终端，调用 do ##class(vectors.vectorstore).InsertEmbeddings() 命令，从文件 text.txt 中读取文本，生成嵌入并将其存储在 IRIS 中。

调用 do ##class(vectors.vectorstore).VectorSearch("search_terms") 命令，输入所需的单词以执行相似性搜索。IRIS 将返回最匹配的前三个词：

#InterSystems IRIS #Vector Search

1 0

0 45

公告 Claire Zheng · 一月 19

InterSystems IRIS新手教程：免费在线实践教程

大家好，社区成员们：

对于刚接触InterSystems IRIS的开发者而言，这有个好消息！我们现已在Instruqt平台上推出了实操互动教程！这些教程非常适合希望快速上手、在真实环境中演练，并建立对基于IRIS的开发信心的开发者。（译者注：国内需要🪜）

以下是可用教程列表：

Full Stack Tutorial - 体验 IRIS 如何支持全栈系统架构。
InterSystems Interoperability - 探索用于连接和集成系统的 IRIS 互操作性工具。
IRIS for Health Interoperability学习如何使用 IRIS for Health 功能与 EHR（电子病历）数据进行应用程序集成。
REST + Angular Application- 练习使用 IRIS REST 服务构建应用程序。
RAG using IRIS Vector Search- 探索 IRIS 向量搜索在人工智能驱动的应用程序中的功能。

#InterSystems IRIS #InterSystems IRIS for Health #开发者社区官方 #Angular #REST API #Vector Search #互操作性 #教程 #新手

0 0

0 84

文章 Lilian Huang · 十二月 11, 2025 2m read

轻松创建问卷——借助IRIS、FHIR SQL构建器与向量搜索

在当今的医疗数据领域，FHIR 已成为结构化临床数据交换的标准。然而，虽然 FHIR 擅长互操作性，但其 JSON 格式却给分析带来了挑战——包括FHIR QuestionnaireResponse数据。

本项目演示了如何将 FHIR QuestionnaireResponse 数据从嵌套 JSON 转换为关系 SQL 表和向量嵌入。通过集成 InterSystemsIRIS FHIR SQL 生成器和向量搜索，我们揭开了患者回答背后的语义。

构建的三个步骤

1.设计和收集问卷

首先使用美国国家医学图书馆（NLM）表格生成器。该工具有助于设计符合 FHIR 标准的结构化临床表格。在本项目中，收集了 100 份合成患者回复，并将其保存为 FHIR QuestionnaireResponse JSON 文件，准备导入 FHIR 服务器。

2.通过 SQL 转换和查询问卷数据

将 FHIR QuestionnaireResponse 资源加载到服务器后，使用InterSystems IRIS FHIR SQL 生成器自动创建关系 SQL 表。这将使嵌套的 JSON 结构扁平化，从而能够使用标准 SQL 轻松分析问卷数据——所有配置只需点击几下即可完成。

有关 FHIR SQL 生成器的完整配置，请参阅README。

#InterSystems IRIS for Health #Open Exchange #FHIR #SQL #Vector Search #教程

Open Exchange

1 0

0 179

文章 Lilian Huang · 十月 24, 2025 14m read

构建 AI 智能体：从小白到大神

学习如何使用 LangGraph 设计结合了推理、矢量搜索和工具集成的可扩缩自主 AI 智能体。

cover

概括

AI 智能体是一种超越简单的聊天机器人的自主系统，它结合了记忆库、上下文，并具有自动完成任务的主动性。
LangGraph 是一种框架，它使我们能够利用具有内置状态管理的节点（任务）和边缘（连接），构建复杂的 AI 工作流。
本指南将指导您构建 AI 赋能的客户支持智能体，该智能体可以划分优先级，识别相关主题，并确定是上报还是自动回复。

那么，AI 智能体究竟是什么？

让我们直面它吧 —“AI 智能体”听起来就像可以接管会议室的机器人。实际上，它们是您得力的助手，可以简化复杂的工作流，消除重复性任务。您可以把它们看作是聊天机器人的下一个进化阶段：它们不只是简单地等待提示；它们可以发起行动，协调多个步骤，并随时进行调整。

过去，打造一个“智能”系统意味着兼顾语言理解、代码生成、数据查找等各种不同的模型，然后将它们粘合在一起。您的一半时间花在了集成上，另一半时间则花在了调试上。

智能体彻底颠覆了这一切。它们将上下文、主动性和适应性融合在一个精心编排的流程中。它们不仅实现了自动化，更是肩负使命的智者。借助 LangGraph 之类的框架，我相信，组建一支自己的智能体团队实际上会很有趣。

LangGraph 究竟是什么？

#InterSystems IRIS #Python #Vector Search #工具 #框架

Open Exchange

0 0

0 215

文章 Lilian Huang · 九月 19, 2025 5m read

使用 FHIRInsight 洞察验血结果的含义：将 FHIR 转化为清晰的见解

您知道当您拿到验血结果时一切看起来都像天书的那种感觉吗？这就是 FHIRInsight 要解决的问题。它最初的理念是，医疗数据不应该令人恐惧或困惑 – 它应该是我们所有人都能使用的东西。验血是健康检查中十分常见的检查，但说实话，大多数人都很难理解它们，有时甚至对不擅长实验室工作的医务人员来说也是如此。 FHIRInsight 希望整个过程能够变得更简单，信息更富有实用价值。

FHIRInsight logo

🤖我们为什么要构建 FHIRInsight

这一切都始于一个简单而有力的问题：

“为什么验血结果仍然很难读懂 — 有时甚至对医生来说也是如此？”

如果您看过化验结果，您可能会看到一大堆数字、隐晦的缩写和“参考范围”，这些可能适用于您的年龄、性别或身体状况，也可能不适用。毫无疑问，它是一种诊断工具，但如果没有背景信息，它就变成了一个猜谜游戏。即使是经验丰富的医疗保健专业人员有时也需要交叉参考指导方针、研究论文或专家意见才能理解所有内容。

这正是 FHIRInsight 的用武之地。

我们不只是为患者而构建，也为一线医护人员而构建。为轮流值班的医生，为捕捉生命体征细微变化的护士，为每一位试图在有限的时间和巨大的责任下做出正确决定的医护人员而构建。我们的目标是让他们的工作简单一点，将密集的临床 FHIR 数据转化为清晰、有用、以真正的医学科学为基础的东西，讲人类语言的东西。

#HealthShare #InterSystems IRIS #InterSystems IRIS for Health #FHIR #Prompt Engineering #Python #Vector Search #业务运营 #互操作性

Open Exchange

0 0

0 123

InterSystems 官方 Claire Zheng · 六月 20, 2025

InterSystems IRIS、InterSystems IRIS for Health 和 HealthShare Health Connect 2025.1 正式发布

InterSystems 宣布 InterSystems IRIS、InterSystems IRIS for Health 和 HealthShare Health Connect 2025.1 正式发布

2025.1 版的 InterSystems IRIS® 数据平台、InterSystems IRIS^® for Health^TM 和 HealthShare^® Health Connect 现已正式发布 (GA)。这是扩展维护 (EM) 版本。

版本亮点

在这个激动人心的版本中，用户可以期待一些新功能和增强，包括：

高级向量搜索功能
- 新的基于磁盘的近似最近邻 (ANN) 索引显著提高了向量搜索查询速度，在数百万个向量上产生亚秒级响应。请访问以下练习，了解更多信息 - 使用 InterSystems SQL 对文本进行向量化和搜索。
增强的商业智能
- IRIS BI 多维数据集构建和同步中的自动依赖项分析，确保复杂多维数据集依赖项中的一致性和完整性。
改进的 SQL 和数据管理
- 引入了标准 SQL 分页语法 (LIMIT... OFFSET..., OFFSET... FETCH...)。
- 新的 LOAD SQL 命令，可以简化 DDL 语句的批量导入。

#InterSystems IRIS #Health Connect #InterSystems IRIS for Health #InterSystems 官方 #文档 ##嵌入式 Python #SQL #Vector Search #版本

0 0

0 214

文章 Lilian Huang · 四月 10, 2025 6m read

如何构建代理人工智能 RAG 应用程序：分步指南

社区朋友们好，

传统的基于关键词的搜索方式在处理具有细微差别的领域特定查询时往往力不从心。而向量搜索则通过语义理解能力，使AI智能体能够根据上下文（而非仅凭关键词）来检索信息并生成响应。

本文将通过逐步指导，带您创建一个具备代理能力的AI RAG（检索增强生成）应用程序。

实现步骤:

添加文档摄取功能：
- 自动获取并建立文档索引（例如《InterSystems IRIS 2025.1版本说明》）
- 实现向量搜索功能
构建向量搜索智能体
移交至主智能体（分流处理）
运行智能体

1. Create Agent Tools 添加文档摄取功能

Implement Document Ingestion: Automated ingestion and indexing of documents

1.1 - 以下是实现文档摄取工具的代码：

    def ingestDoc(self):
        #Check if document is defined, by selecting from table
        #If not defined then INGEST document, Otherwise back
        embeddings = OpenAIEmbeddings()	
        #Load the document based on the fle type
        loader = TextLoader("/irisdev/app/docs/IRIS2025-1-Release-Notes.txt", encoding='utf-8')      
        
        documents = loader.load()        
        text_splitter = RecursiveCharacterTextSplitter(chunk_size=400, chunk_overlap=0)
        
        texts = text_splitter.split_documents(documents)
                       
        #COLLECTION_NAME = "rag_document"
        db = IRISVector.from_documents(
            embedding=embeddings,
            documents=texts,
            collection_name = self.COLLECTION_NAME,
            connection_string=self.CONNECTION_STRING,
        )

        db = IRISVector.from_documents(embedding=embeddings,documents=texts, collection_name = self.COLLECTION_NAME, connection_string=self.CONNECTION_STRING,)

向量搜索智能体（Vector Search Agent）能够自动完成文档的摄取（ingest）与索引构建（index），该新功能在InterSystems IRIS 2025.1的数据资源文件夹里）至 IRIS 向量存储，只有当数据尚未存在时，才执行该操作。

运行以下查询以从向量存储中获取所需数据：

SELECT
id, embedding, document, metadata
FROM SQLUser.AgenticAIRAG

1.2 - 实现向量搜索功能

以下代码为智能体提供了搜索能力：

 def ragSearch(self,prompt):
        #Check if collections are defined or ingested done.
        # if not then call ingest method
        embeddings = OpenAIEmbeddings()	
        db2 = IRISVector (
            embedding_function=embeddings,    
            collection_name=self.COLLECTION_NAME,
            connection_string=self.CONNECTION_STRING,
        )
        docs_with_score = db2.similarity_search_with_score(prompt)
        relevant_docs = ["".join(str(doc.page_content)) + " " for doc, _ in docs_with_score]
        
        #Generate Template
        template = f"""
        Prompt: {prompt}
        Relevant Docuemnts: {relevant_docs}
        """
        return template

分流代理处理传入的用户查询，并将其委托给矢量搜索代理，后者执行语义搜索操作，以检索最相关的信息。

#InterSystems IRIS for Health #Open Exchange ##嵌入式 Python #Artificial Intelligence (AI) #ChatGPT #Large Language Model (LLM) #Vector Search

Open Exchange

0 0

0 168

InterSystems 官方 Michael Lei · 一月 5, 2025

InterSystems 宣布 InterSystems IRIS、InterSystems IRIS for Health 和 HealthShare Health Connect 2024.3 正式发布

2024.3 版 InterSystems IRIS^® 数据平台、InterSystems IRIS^® for Health 和 HealthShare^® Health Connect 现已正式发布 (GA)。

版本亮点

在此版本中，您可以期待一系列激动人心的更新，包括：

数据库和 WIJ 文件的扩展速度大大提高
能够通过 Visual Trace 重新发送消息
增强的规则管理器功能
向量搜索增强功能
等等。

请通过开发者社区分享您的反馈，与我们共同打造更好的产品。

文档

请访问以下链接了解所有亮点功能的详细信息：

InterSystems IRIS 2024.3 文档、版本说明和升级检查核对清单。
InterSystems IRIS for Health 2024.3 文档、版本说明和升级检查核对清单。
Health Connect 2024.3 文档、版本说明和升级检查核对清单。

此外，请查看此版本的升级信息。

抢先体验计划 (EAP)

目前提供多个 EAP。请查看此页面并注册您感兴趣的计划。

如何获取软件？

像往常一样，持续交付 (CD) 版本包含适用于所有受支持平台的经典安装包，以及 Docker 容器格式的容器镜像。

#InterSystems IRIS #Health Connect #InterSystems IRIS for Health #InterSystems 官方 #文档 #Docker #Vector Search #平台 #持续交付 #版本

0 0

0 277

InterSystems 官方 Michael Lei · 十月 7, 2024

通过近似最近邻索引（已在向量搜索抢先体验计划中实现）加快向量搜索速度

我们最近在向量搜索抢险体验计划中提供了新版的 InterSystems IRIS，新版本采用了新的基于分层可导航小世界 (HNSW) 索引算法的近似最近邻索引。这一新增功能可对大型向量数据集进行高效的近似最近邻搜索，从而显著提高查询性能和可扩缩性。

HNSW 算法旨在通过构建基于图形的结构来优化高维数据的向量搜索，从而更快地在大型向量集合中找到近似邻。无论您使用的是推荐系统、自然语言处理，还是其他机器学习应用，HNSW 都能显著缩短搜索时间，同时允许您调整准确度水平，但准确度提高的代价是查询时间变慢。

HNSW 的主要优点包括：

    •    即使数据集规模不断扩大，也能加快搜索速度
    •    减少内存占用，同时保持高准确度
    •    与现有的 IRIS 向量搜索功能无缝集成

如何开始使用

最新版本现已通过向量搜索抢先体验计划提供。要参与，请在此处注册，下载新版本并开始测试。我们正在持续增强向量搜索的功能，因此您的反馈至关重要！

我们鼓励您探索性能改进方法，并与社区分享您的想法。如果您在抢先体验阶段遇到任何问题或有任何反馈，请联系我。

祝您编码愉快！

#InterSystems IRIS #InterSystems IRIS for Health #InterSystems 官方 #Natural Language Processing #Vector Search #图形 #性能 #抢先体验计划（EAP） #测试 #索引

0 0

0 127

公告 Claire Zheng · 九月 11, 2024

报名参会 | 面向未来的InterSystems IRIS数据平台：五大亮点提速数据潜力挖掘与AI应用

HI 各位开发者们，

📅2024年9月23日🕑14:00-15:30🕞，InterSystems将举办线上研讨会，点击🔔此处🔔报名参会。

此次研讨会以“面向未来的数据平台——InterSystems IRIS五大亮点提速数据潜力挖掘与AI应用”为主题，帮助您了解InterSystems IRIS数据平台的五大亮点：

使用InterSystems IRIS for Health进行FHIR开发
使用Python进行互操作Production开发
InterSystems IRIS列存储
InterSystems IRIS外部表(Foreign Table)
InterSystems IRIS向量和基于向量检索的患者相似度匹配

#InterSystems IRIS #InterSystems IRIS for Health ##嵌入式 Python #FHIR #Python #Vector Search #互操作性

0 2

0 315

文章 Michael Lei · 八月 1, 2024 4m read

d[IA]gnosis：借助 IRIS for Health 开发 RAG 应用程序

随着 IRIS 中向量数据类型和向量搜索功能的引入，应用程序的开发正在开启一个充满各种可能性的全新世界，其中一个应用程序示例是我最近在巴伦西亚卫生局的一次公开竞赛中看到的应用程序，他们要求提供一种工具，能够使用 AI 模型协助进行 ICD-10 编码。

我们如何实现与所要求的应用程序类似的应用程序？我们来看看需要什么：

ICD-10 代码列表，我们将使用它作为 RAG 应用程序的上下文，在纯文本中搜索诊断结果。
经过训练的模型，它会将文本向量化，我们将在其中查找 ICD-10 代码中的对应项。
Python 库，用于对 ICD-10 代码和文本进行摄取和向量化。
一个支持文本的友好前端，我们会在其中查找可能的诊断结果。
从前端接收的请求的编排。

IRIS 为我们提供哪些功能来满足上述需求？

CSV 导入，可以使用 RecordMapper 功能，也可以直接使用嵌入式 Python。
嵌入式 Python 使我们能够实现使用所选模型生成向量所需的 Python 代码。
发布将从前端应用程序调用的 REST API。
互操作性生产，以允许在 IRIS 中跟踪信息。

我们只需要看看开发的示例：

d[IA]gnosis

在本文中，您可以访问开发的应用程序，在后续文章中，我们将详细了解如何实现每个功能，包括模型的使用、向量的存储和向量搜索的使用。

#InterSystems IRIS for Health ##嵌入式 Python #Angular #Artificial Intelligence (AI) #Vector Search

Open Exchange

0 0

0 156

文章 Louis Lu · 七月 1, 2024 2m read

新数据类型 VECTOR 的限制

在 OEX 最近一次编程竞赛之后，我有一些令人惊讶的发现。
几乎所有的应用程序都是基于人工智能与预制 Python 模块的结合。
但深入研究后发现，所有示例都使用了 IRIS 的相同技术组件。

从 IRIS 的角度来看，无论是搜索文本还是搜索图像或其他模式都是一样的。其底层基本都是一样的。

这让我想起了我家里的情况。我的妻子和女儿对家里的大量裙子、衬衫和其他衣服的信息进行了整理。
但无论如何进行整理、分类、归档，我依然通过和我的妻子和女儿说话，来确定我的穿着。
无论怎样包装，其结果都是如此。

回到这次竞赛比赛：
同样的 IRIS 技术内容，却有很多花哨的包装。
每个人都在同一条高速公路上奔跑。没有人提到它有什么限制。

于是我试着深入挖掘，找出新数据类型 VECTOR 的使用限制。
所有向量都有两个基本参数
- 静态 DATATYPE："整型integer"（或 "int"）、"double"、"十进制decimal"、"字符串 "和 "时间戳"。
- 半动态 LEN(gth)： > 0 通常也称为 POSITION；纯整数。

这个 LEN/POSITION 参数就相当于vector的数学维度。
当然，在爱因斯坦的宇宙中，根据他的相对论，你可能只需要 4 个维度或更少。
即使是 60 年代提出的宇宙弦理论也没有超过 11.

#InterSystems IRIS #Python #Vector Search

0 0

0 133

文章 Louis Lu · 七月 1, 2024 4m read

在InterSystems ObjectScript中使用 VECTORs

迄今为止，我看到的大多数使用向量vector的示例，将它只作为 SQL 中的一种功能，尤其是围绕 VECTOR_Search 的 3 个函数。
* TO_VECTOR()
* vector_dot_product ()
* vector_cosine ()

在 iris-vector-search 演示包中隐藏着一个非常有用的摘要。
从那里，你可以通过多个链接找到所需的一切。

我还缺少更多的 VECTOR 方法，于是在 Idea Portal 上提出了相关请求。

接着，我想起每个 SQL 方法或存储过程都有一堆 ObjectScript 代码。
于是我开始搜索，下面就是我的研究的一些总结：

%Library.Vector 是对新数据类型的核心描述
这是一种复杂的结构，就像对象或 %DynamicObjects 或 $Bit Expressions 一样，需要特定的方式去访问。
我们还可以看到 2 个必备参数：
* DATATTYPE - 一旦设置就不能更改。可接受的类型： "整数integer"（或 "int"）、"双精度浮点double"、"十进制decimal"、"字符串 "和 "时间戳"。
* LEN >0 时，可以增长，但绝对不能缩小

$vector() / $ve() 是矢量访问的基本方法
* 设置矢量数据 >>> SET $VE(. . .

#InterSystems IRIS #ObjectScript #SQL #Vector Search

0 0

0 152

文章 Louis Lu · 六月 11, 2024 8m read

使用 IRIS 以及 langchain 构建问答聊天机器人

这篇文章介绍了使用由支持 langchain 框架的IRIS来实现问答聊天机器人，其重点介绍了检索增强生成（RAG）。

文章探讨了IRIS中的向量搜索如何在langchain-iris中完成数据的存储、检索和语义搜索，从而实现对用户查询的精确、快速的响应。通过无缝集成以及索引和检索/生成等流程，由IRIS驱动的RAG应用程序使InterSystems开发者能够利用GenAI系统的能力。

为了帮助读者巩固这些概念，文章提供了Jupyter notebook和一个完整的问答聊天机器人应用程序，以供参考。

什么是RAG以及它在问答聊天机器人中的角色

RAG，即检索增强生成，是一种通过整合超出初始训练集的补充数据来丰富语言模型（LLM）知识库的技术。尽管LLM在跨不同主题进行推理方面具有能力，但它们仅限于在特定截止日期之前训练的公共数据。为了使AI应用程序能够有效处理私有或更近期的数据，RAG通过按需补充特定信息来增强模型的知识。这是一种替代微调LLM的方法，微调可能会很昂贵。

在问答聊天机器人领域，RAG在处理非结构化数据查询中发挥着关键作用，包括两个主要组成部分：索引和检索/生成。

索引从数据源摄取数据开始，然后将其分割成更小、更易于管理的块以进行高效处理。这些分割的块随后被存储和索引，通常使用嵌入模型和向量数据库，确保在运行时能够快速准确地检索。

#InterSystems IRIS #API #JSON #ObjectScript #Python #Vector Search #命名空间

1 0

0 538

文章 Claire Zheng · 三月 28, 2024 3m read

InterSystems通过向量搜索扩展了InterSystems IRIS数据平台，支持下一代人工智能应用

2024年3月26日，InterSystems数据平台全球主管Scott Gnau发文，宣布InterSystems IRIS数据平台新增了向量搜索（vector search）功能。

本文作者为Scott Gnau，InterSystems数据平台全球主管。

#InterSystems IRIS #InterSystems IRIS for Health #Artificial Intelligence (AI) #SQL #Vector Search

1 0

0 409

文章 Michael Lei · 三月 21, 2024 2m read

IRIS 向量搜索

这是在 IRIS 中完全运行向量搜索演示的尝试。
没有外部工具，您需要的只是终端/控制台和管理门户。
特别感谢Alvin Ryanputra作为他的软件包iris-vector-search的基础
灵感和测试数据的来源。
我的软件包基于 IRIS 2024.1 版本，需要注意您的处理器功能。

我尝试用纯 ObjectScript 编写演示。
仅描述向量的计算是在嵌入式Python中完成的
计算 2247 个记录的 384 维向量需要时间。
在我的 Docker 容器中，它正在运行 01:53:14 来完全生成它们。

然后被警告了！
所以我将这一步调整为可重入，以允许暂停向量计算。
每 50 条记录，您就会收到一次停止的提议。
该演示如下所示：

用户>做^A.DemoV

 测试向量搜索
=============================
1 - 初始化表
2 - 生成数据
3 - VECTOR_余弦
4 - VECTOR_DOT_产品
5 - 制作苏格兰威士忌
6 - 加载 Scotch.

#InterSystems IRIS #InterSystems IRIS for Health ##嵌入式 Python #CSV #Docker #GitHub #ObjectScript #Python #Vector Search

Open Exchange

1 1

0 119

文章 Michael Lei · 二月 18, 2024 11m read

向量搜索和 RAG（检索增强生成）模型

1. IRIS RAG Demo

IRIS RAG Demo

这是 IRIS 与 RAG（检索增强生成）示例的一个简单演示。后端是使用 IRIS 和 IoP用 Python 编写的，LLM 模型是 orca-mini 并由 ollama 服务器提供。前端是用 Streamlit 编写的聊天机器人。

1. IRIS RAG 演示](#1-iris-rag-demo)
- 1.1. 什么是 RAG](#11-what-is-rag)
- 1.2. 如何工作？
- 1.3. 安装演示](#13-installation-the-demo)
- 1.4. 使用方法
- 1.5. 演示如何运行](#15-演示如何运行)
  - [1.5.1. 前端]（#151-前端）
  - 1.5.2. 后台
    - [1.5.2.1. 业务服务]（#1521-业务服务）
    - [1.5.2.2. 业务流程]（#1522-业务流程）
    - [1.5.2.3. LLM 操作]（#1523-the-llm-operation）
    - 1.5.2.4. 矢量操作](#1524-the-vector-operation)
- 1.6. 一般性说明](#16-一般性说明)

1.1. 什么是 RAG？

RAG 是 Retrieval Augmented Generation（检索增强生成）的缩写，它带来了使用带有知识库的 LLM 模型（GPT-3.

#InterSystems IRIS #Artificial Intelligence (AI) #CSP #Docker #Git #Python #Vector Search #互操作性 #命名空间 #多模型

Open Exchange

0 1

0 661

文章 Michael Lei · 九月 18, 2023 6m read

开发者作品展示--几乎实现的向量支持

如今，关于大语言模型、人工智能等的消息不绝于耳。向量数据库是其中的一部分，并且已经有非IRIS的技术实现了向量数据库。

为什么是向量？

相似性搜索：向量可以进行高效的相似性搜索，例如在数据集中查找最相似的项目或文档。传统的关系数据库是为精确匹配搜索而设计的，不适合图像或文本相似性搜索等任务。
灵活性：向量表示形式用途广泛，可以从各种数据类型派生，例如文本（通过 Word2Vec、BERT 等嵌入）、图像（通过深度学习模型）等。
跨模态搜索：向量可以跨不同数据模态进行搜索。例如，给定图像的向量表示，人们可以在多模式数据库中搜索相似的图像或相关文本。

还有许多其他原因。

因此，对于这次 pyhon 竞赛，我决定尝试实现这种支持。不幸的是我没能及时完成它，下面我将解释原因。

#InterSystems IRIS ##嵌入式 Python #Docker #Git #JDBC #ObjectScript #ODBC #Python #SQL #Vector Search

Open Exchange

0 0

0 209

开发者社区资源

InterSystems 资源

我们的社会网络

#Vector Search

陷入困境

第一幕：狂热（“对一切都说好！”）

✨ 主要技术特点

技术架构

以下是可用教程列表：

构建的三个步骤

1.设计和收集问卷

2.通过 SQL 转换和查询问卷数据

概括

那么，AI 智能体究竟是什么？

LangGraph 究竟是什么？

🤖我们为什么要构建 FHIRInsight

实现步骤:

版本亮点

文档

抢先体验计划 (EAP)

如何获取软件？

如何开始使用

d[IA]gnosis

1. IRIS RAG Demo

1.1. 什么是 RAG？

热门应用

数字化的社区