IRIS IO 工具:VS 代码中的智能导入完全指南
大家好! 👋
欢迎来到IRIS IO 工具系列的第二部分。这个扩展是我提交给InterSystems 2025 年 "将想法变为现实 "竞赛的作品,它为您提供了一个直观而强大的界面,可直接在 VS 代码中导入和导出数据。
- 您可以在我的 GitHub 页面找到该扩展:pietrodileo/iris_io_utility。
- 在 VSCode 上安装扩展的 VSIX 文件可在相关发布页面找到:releaseases: iris-io-utility
如果你觉得这个扩展有用,请考虑在竞赛中为我投票!
在上一篇文章中,我们介绍了
- 扩展概述
- ODBC 驱动程序配置
- 导出功能
现在是时候深入了解导入引擎(Import Engin)了_它旨在支持
- CSV
- TXT(任意分隔符)
- JSON
- XLSX
该扩展具有智能推理层,可分析输入文件并自动建议最佳的 IRIS 表格数据格式,提供有指导的辅助数据建模。
导入模式--两种不同的工作流程
该扩展支持两种不同的方案:
- 创建新表
- 加载到现有表格
选项 A - 导入新表
在以下情况下,这是理想的选择
- 加载新数据集
- 您希望从头开始,使用全新的表和模式
- 处于原型设计或探索阶段
会发生什么?
- 扩展会读取文件数据并自动推断列类型
- 您可以根据需要自定义类型
- 选择模式和表名
- 可选择定义索引
- 然后导入数据--所有这些都是安全的原子操作
选项 B - 导入现有表
非常适合
- 更新表
- 添加新行
- 替换过时数据
有两种操作可供选择
- 添加- 从文件中添加新行
- 替换- 清除当前表格数据并用新数据替换
在导入之前,扩展程序会验证文件的列是否与目标表的结构相匹配。如果存在不匹配的情况,它会发出通知并终止导入,以防止模式漂移或数据损坏。
.png)
使用 IRIS IO 工具创建新表
第 1 步 - 打开导入视图并选择文件
连接到 IRIS 实例后:
- 点击云向上箭头图标
- 单击 "创建新表 "选项卡
- 选择要导入的文件
支持的格式有 CSV、JSON、TXT 和 XLSX。.png)
第 2 步 - 文件分析和类型推断
加载文件后,导入引擎会自动
- 采样文件值以猜测列类型
- 确定最可能的 SQL 类型
- 将它们转换为有效的 IRIS SQL 类型
- 在每一列下显示样本数据
- 如果需要,可让你手动覆盖类型
检测到的类型包括
- INTEGER
- 大点数
- 数字
- 二进制
- VARCHAR(255 或 4000 个字符)
- CLOB
- 日期
- TIMESTAMP
- 位
分析结果显示在导入网页视图底部的"列类型映射(Column Type Mapping)"部分。
你可以更改数据类型并查看数据样本:
.png)
第 3 步 - 创建自定义索引
扩展支持在创建新表时创建索引。
对于每一列,你都可以
- 勾选 "索引 "复选框,如果你知道你将经常通过该列进行查询或筛选的话
- 选择索引类型。可用类型有
- INDEX
- BITSLICE
- BITMAP
- COLUMNAR (IRIS Analytics)
- 可以编辑索引名称--如果留空,扩展程序会自动生成索引名称
- 可以指定索引是否唯一
- 可以指定某个字段是否应作为新表的主键
第 4 步 - 选择模式
为新表选择模式时,可以选择使用以前存在的模式或创建新模式。
在使用先前存在的模式时:
- 可以指定模式过滤器(可选),或者点击 "加载模式(Load Schemas) "按钮加载所选命名空间内的所有可用模式。
.png)
创建新模式时:
- 可指定新模式名称,格式为
MySchemaName_SubSchemaName
.png)
步骤 5 - 选择表名
选定模式后,就可以指定新的表名。如果已经存在具有相同模式和表名的表,则将中止导入,以防止意外覆盖。
步骤 6 - 创建表格和导入
单击 "创建(Create)"按钮创建新表并导入数据。
扩展会在输出面板中记录进度,并在完成后弹出通知。
.png)
使用 IRIS IO 工具将数据加载到现有表中
将新数据注入现有表格:
- 切换到 "加载到现有表格(Load into Existing Table)"选项卡
- 选择文件
- 选择目标模式和表名
- 选择导入操作:附加或替换(Append or Replace)
扩展程序会验证文件列是否与现有表模式一致,如果存在不匹配,则会终止导入,从而保护数据完整性。
.png)
TXT 文件的特殊情况:定义正确的分隔符
导入 TXT 文件时,扩展程序允许你指定自定义分隔符,以确保正确解析文件。这在处理非常规分隔符(如管道 (|)、分号 (;)、制表符或多字符分隔符)时尤其有用。选择正确的分隔符可确保正确的列检测,并防止在导入过程中出现数据错位或损坏。
.png)
.png)
最后的思考
导入引擎将 IRIS IO Utility 从一个简单的辅助工具转变为真正的数据工程工具。
它可以处理
- 类型推断
- 模式构建
- 创建索引
- 数据加载
- 诊断日志
所有这些都在 VS 代码中实现_简洁、可发现、方便。
与导出引擎一起,IRIS IO Utility 为 InterSystems IRIS 提供了一个完整、现代、开发人员友好的 IO 工作流程。
如果您喜欢此功能并认为 IRIS IO Utility 有用,请在 InterSystems 竞赛中为其投票!🚀 🚀