文章 Kelly Huang · 三月 13 4m read

IRIS IO 工具:VS 代码中的智能导入完全指南

大家好! 👋
欢迎来到IRIS IO 工具系列的第二部分。这个扩展是我提交给InterSystems 2025 年 "将想法变为现实 "竞赛的作品,它为您提供了一个直观而强大的界面,可直接在 VS 代码中导入和导出数据

如果你觉得这个扩展有用,请考虑在竞赛中为我投票!


在上一篇文章中,我们介绍了

  • 扩展概述
  • ODBC 驱动程序配置
  • 导出功能

现在是时候深入了解导入引擎(Import Engin)了_它旨在支持

  • CSV
  • TXT(任意分隔符)
  • JSON
  • XLSX

该扩展具有智能推理层,可分析输入文件并自动建议最佳的 IRIS 表格数据格式,提供有指导的辅助数据建模。


导入模式--两种不同的工作流程

该扩展支持两种不同的方案

  • 创建新表
  • 加载到现有表格

选项 A - 导入新表

在以下情况下,这是理想的选择

  • 加载新数据集
  • 您希望从头开始,使用全新的表和模式
  • 处于原型设计或探索阶段

会发生什么?

  • 扩展会读取文件数据并自动推断列类型
  • 您可以根据需要自定义类型
  • 选择模式和表名
  • 可选择定义索引
  • 然后导入数据--所有这些都是安全的原子操作

选项 B - 导入现有表

非常适合

  • 更新表
  • 添加新行
  • 替换过时数据

有两种操作可供选择

  • 添加- 从文件中添加新行
  • 替换- 清除当前表格数据并用新数据替换

在导入之前,扩展程序会验证文件的列是否与目标表的结构相匹配。如果存在不匹配的情况,它会发出通知并终止导入,以防止模式漂移或数据损坏。


使用 IRIS IO 工具创建新表

第 1 步 - 打开导入视图并选择文件

连接到 IRIS 实例后:

  1. 点击云向上箭头图标
  2. 单击 "创建新表 "选项卡
  3. 选择要导入的文件

支持的格式有 CSV、JSON、TXT 和 XLSX。

第 2 步 - 文件分析和类型推断

加载文件后,导入引擎会自动

  • 采样文件值以猜测列类型
  • 确定最可能的 SQL 类型
  • 将它们转换为有效的 IRIS SQL 类型
  • 在每一列下显示样本数据
  • 如果需要,可让你手动覆盖类型

检测到的类型包括

  • INTEGER
  • 大点数
  • 数字
  • 二进制
  • VARCHAR(255 或 4000 个字符)
  • CLOB
  • 日期
  • TIMESTAMP

分析结果显示在导入网页视图底部的"列类型映射(Column Type Mapping)"部分。

你可以更改数据类型并查看数据样本:

第 3 步 - 创建自定义索引

扩展支持在创建新表时创建索引。

对于每一列,你都可以

  • 勾选 "索引 "复选框,如果你知道你将经常通过该列进行查询或筛选的话
  • 选择索引类型。可用类型有
    • INDEX
    • BITSLICE
    • BITMAP
    • COLUMNAR (IRIS Analytics)
  • 可以编辑索引名称--如果留空,扩展程序会自动生成索引名称
  • 可以指定索引是否唯一
  • 可以指定某个字段是否应作为新表的主键

第 4 步 - 选择模式

为新表选择模式时,可以选择使用以前存在的模式或创建新模式。

在使用先前存在的模式时:

  • 可以指定模式过滤器(可选),或者点击 "加载模式(Load Schemas) "按钮加载所选命名空间内的所有可用模式。

创建新模式时:

  • 可指定新模式名称,格式为 MySchemaName_SubSchemaName

步骤 5 - 选择表名

选定模式后,就可以指定新的表名。如果已经存在具有相同模式和表名的表,则将中止导入,以防止意外覆盖。

步骤 6 - 创建表格和导入

单击 "创建(Create)"按钮创建新表并导入数据。

扩展会在输出面板中记录进度,并在完成后弹出通知。


使用 IRIS IO 工具将数据加载到现有表中

将新数据注入现有表格:

  1. 切换到 "加载到现有表格(Load into Existing Table)"选项卡
  2. 选择文件
  3. 选择目标模式和表名
  4. 选择导入操作:附加替换(Append or Replace)

扩展程序会验证文件列是否与现有表模式一致,如果存在不匹配,则会终止导入,从而保护数据完整性。


TXT 文件的特殊情况:定义正确的分隔符

导入 TXT 文件时,扩展程序允许你指定自定义分隔符,以确保正确解析文件。这在处理非常规分隔符(如管道 (|)、分号 (;)、制表符或多字符分隔符)时尤其有用。选择正确的分隔符可确保正确的列检测,并防止在导入过程中出现数据错位或损坏。


最后的思考

导入引擎将 IRIS IO Utility 从一个简单的辅助工具转变为真正的数据工程工具

它可以处理

  • 类型推断
  • 模式构建
  • 创建索引
  • 数据加载
  • 诊断日志

所有这些都在 VS 代码中实现_简洁、可发现、方便。

与导出引擎一起,IRIS IO Utility 为 InterSystems IRIS 提供了一个完整、现代、开发人员友好的 IO 工作流程

如果您喜欢此功能并认为 IRIS IO Utility 有用,请在 InterSystems 竞赛中为其投票!🚀 🚀