对于有海量数据运算场景的机器学习项目来说,IRIS 是一个很好的选择,原因包括:
- 与 MongoDB 一样,支持使用分片扩展数据存储库。
- 支持创建分析型多维数据集,与分片关联可提高性能。
- 支持使用各种数据适配器选项按计划或实时收集数据。
- 允许使用 Python 或 ObjectScript 中的逻辑自动化整个重复数据删除过程。
- 允许使用可视流 (BPL) 和数据转换器 (DTL) 协调并自动化到存储库的数据流。
- 通过 docker (IaC) 和 Cloud Manager 脚本提供高级自动扩展支持。
- 支持通过 ZPM 在配置中加载 ObjectScript 库。
- 与 Python 和 R 的互操作性支持实时执行机器学习。
- 允许使用 AutoML 引擎、IntegratedML 对所指向的数据集执行最佳算法。
- 允许创建执行后分析,例如 AutoML 预测和分类、Python 和 R 认知处理的输出、BI 数据透视表,并且都带有自己的视图或第三方视图。
- 允许使用 JReport 创建高级视图和报告。
- 可以通过 API 管理实现最大限度的重用和获利能力。