作者

Sales Engineer at InterSystems

MOD

文章 Jingwei Wang · 七月 28, 2022 8m read

InterSystems SQL 的使用 - 第八部分 - 存储和使用流数据（BLOBs和CLOBs）

InterSystems SQL支持在InterSystems IRIS数据平台数据库中将流数据存储为BLOB（Binary Large Objects 二进制大对象）或CLOB（Character Large Objects字符大对象）的能力。

InterSystems SQL支持两种流字段：

字符流：用于大量的文本。
二进制流：用于图像、音频或视频。

BLOBs和CLOBs可以存储多达4GB的数据（JDBC和ODBC规范规定的限制）。除了在通过ODBC或JDBC客户端访问时如何处理字符编码转换（如Unicode到多字节）外，BLOB和CLOB的操作在各方面都是相同的：BLOB中的数据被视为二进制数据，决不转换为其他编码，而CLOB中的数据被视为字符数据，在必要时进行转换。

如果一个二进制流文件（BLOB）包含单一的非打印字符$CHAR(0)，它被认为是一个空的二进制流。它相当于""空二进制流值：它存在（不是空的），但长度为0。

从对象的角度来看，BLOB和CLOBs被表示为流对象。更多信息请参见定义和使用类中的 "与流合作 "一章。

定义流数据字段

InterSystems SQL支持流字段的各种数据类型名称。这些InterSystems的数据类型名称是对应于以下的同义词。

字符流：数据类型LONGVARCHAR，映射到%Stream.GlobalCharacter类和ODBC/JDBC数据类型-1。
字符流：数据类型LONGVARBINARY，映射到%Stream.GlobalBinary类和ODBC/JDBC数据类型-4。

下面的例子定义了一个包含两个流字段的表。

CREATE TABLE Sample.MyTable (
  Name VARCHAR(50) NOT NULL,
  Notes LONGVARCHAR,
  Photo LONGVARBINARY)

流字段的限制：

一个流字段可以被定义为NOT NULL。
一个流字段可以取一个DEFAULT值，一个ON UPDATE值，或者一个COMPUTECODE值。
一个流字段不能被定义为UNIQUE，一个主键字段，或一个IdKey。试图这样做会导致一个SQLCODE -400的致命错误，并带有%msg，如以下。ERROR #5414: 无效的索引属性。Sample.MyTable::MYTABLEUNIQUE2::Notes, Stream属性在唯一/主键/idkey索引中是不允许的 > ERROR #5030: 在编译'Sample.MyTable'类时发生错误。
不能用指定的COLLATE值定义一个流字段。试图这样做会导致一个SQLCODE -400的致命错误，并带有%msg，如以下。ERROR #5480: 属性参数没有声明。Sample.MyTable:Photo:COLLATION > ERROR #5030: 在编译'Sample.MyTable'类时发生错误。

在流数据字段中插入数据

有三种方法可以将数据插入到流字段。

%Stream.GlobalCharacter字段：你可以直接插入字符流数据。例如：

INSERT INTO Sample.MyTable (Name,Notes)
   VALUES ('Fred','These are extensive notes about Fred')

%Stream.GlobalCharacter和%Stream.GlobalBinary字段：你可以使用OREF插入流数据。你可以使用Write()方法将一个字符串追加到字符流中，或者使用WriteLine()方法将一个带有行终止符的字符串追加到字符流中。默认情况下，行结束符是$CHAR(13,10)（回车/换行）；你可以通过设置LineTerminator属性改变行结束符。在下面的例子中，第一部分创建了一个由两个字符串和它们的终止符组成的字符流，然后使用嵌入式SQL将其插入到一个流字段中。例子的第二部分返回字符流的长度并显示字符流数据，显示终止符。
```
ClassMethod CreateAndInsertCharacterStream()
{
Set gcoref = ##class(%Stream.GlobalCharacter).%New()
DO gcoref.WriteLine("First Line")
Do gcoref.WriteLine("Second Line")
&sql(INSERT INTO Sample.MyTable(Name, Notes)
VALUES('Fred',:gcoref))
IF SQLCODE<0 {WRITE "SQLCODE ERROR:"_SQLCODE_" "_%msg QUIT}
ELSE {WRITE "Insert successful",!}

do ..DisplayTheCharacterStream(gcoref)
}

ClassMethod DisplayTheCharacterStream(gcoref As %Stream.GlobalCharacter)
{
KILL ^CacheStream
WRITE gcoref.%Save(),!
ZWRITE ^CacheStream
}
```

%Stream.GlobalCharacter和%Stream.GlobalBinary字段：你可以通过从文件中读取数据来插入流数据。比如说

ClassMethod InsertDataFromImage()
{
Set myf = "C:\Temps\IMG.png"
OPEN myf:("RF"):10
USE myf:0
READ x(1):10
&sql(INSERT INTO Sample.MyTable (Name,Photo) VALUES ('George',:x(1)))
      IF SQLCODE <0 {WRITE "INSERT Failed:"_SQLCODE_" "_%msg  QUIT}

CLOSE myf
}

作为DEFAULT值或计算值插入的字符串数据将以适合于流字段的格式存储。

查询流字段数据

二进制流字段返回字符串<binary>。

SELECT Name,Photo,Notes 
FROM Sample.MyTable WHERE Photo IS NOT NULL

DISTINCT, GROUP BY, 和 ORDER BY

每个流数据字段的OID值都是唯一的，即使数据本身包含重复的内容。这些SELECT子句对流的OID值进行操作，而不是数据值。因此，当应用于查询中的流字段时。

DISTINCT子句对重复的流数据值没有影响。DISTINCT子句将流字段为NULL的所有记录记录减少到一个NULL记录。DISTINCT对流字段的OID进行操作，而不是它的实际数据。
GROUP BY子句对重复的流数据值没有影响。GROUP BY子句将流字段为NULL的所有记录数减少到一个NULL记录。GROUP BY StreamField的操作对象是一个流字段的OID，而不是它的实际数据。
ORDER BY子句根据流数据值的OID值，而不是数据值来排序。ORDER BY子句在列出有流字段数据值的记录之前，先列出流字段为NULL的记录。

predicate 条件和流

IS [NOT] NULL 可以应用于流字段的数据值，如下面的例子中所示。
```
SELECT Name,Notes 
FROM Sample.MyTable WHERE Notes IS NOT NULL
```
BETWEEN, EXISTS, IN, %INLIST, LIKE, %MATCHES, 和 %PATTERN谓词可以应用于流对象的OID值，如下面的例子所示。
```
SELECT Name,Notes 
FROM Sample.MyTable WHERE Notes %MATCHES '*1[0-9]*GlobalChar*' 。
```

试图在一个流字段上使用任何其他的predicate条件会导致SQLCODE -313错误。

聚合函数和流

COUNT聚合函数接收一个流字段，并对包含该字段非空值的记录进行计数，如下面的例子所示:

SELECT COUNT(Photo) AS PicRows,COUNT(Notes) AS NoteRows
FROM Sample.MyTable

然而，COUNT(DISTINCT)不支持流字段。对流字段不支持其他聚合函数。试图用任何其他聚合函数来使用流字段会导致SQLCODE -37错误。

标量函数和流

除了%OBJECT、CHARACTER_LENGTH（或CHAR_LENGTH或DATALENGTH）、SUBSTRING、CONVERT、XMLCONCAT、XMLELEMENT、XMLFOREST和%INTERNAL函数外，InterSystems SQL不能将任何函数应用到流字段。试图使用流字段作为任何其他SQL函数的参数会导致SQLCODE -37错误。

%OBJECT函数打开一个流对象（接受一个OID），并返回oref（对象引用），如以下例子所示:
```
SELECT Name,Notes,%OBJECT(Notes) AS NotesOref
FROM Sample.MyTable WHERE Notes IS NOT NULL
```
CHARACTER_LENGTH，CHAR_LENGTH和DATALENGTH函数取一个流字段，并返回实际的数据长度，如下面的例子所示。
```
SELECT Name,DATALENGTH(Notes) AS NotesNumChars
FROM Sample.MyTable WHERE Notes IS NOT NULL
```
SUBSTRING函数接收一个流字段，并返回流字段实际数据值的指定子串，如下面的例子所示。
```
SELECT Name,SUBSTRING(Notes,1,10) AS Notes1st10Chars
FROM Sample.MyTable WHERE Notes IS NOT NULL
```
当从管理门户的SQL执行界面发出时，SUBSTRING函数最多返回流字段数据的100个字符的子串。如果指定的流数据子串长于100个字符，会在第100个字符后面用省略号（...）表示。
CONVERT函数可以用来将流数据类型转换为VARCHAR，如下面的例子所示。
```
SELECT Name,CONVERT(VARCHAR(100),Notes) AS NotesTextAsStr
FROM Sample.MyTable WHERE Notes IS NOT NULL
```
CONVERT(datatype,expression)语法支持流数据转换。如果VARCHAR精度小于实际流数据的长度，它将返回值截断为VARCHAR精度。如果VARCHAR精度大于实际流数据的长度，返回值就有实际流数据的长度。不进行填充。

{fn CONVERT(expression,datatype)}语法不支持流数据转换；它发出SQLCODE -37错误。

%INTERNAL函数可以在流字段上使用，但不执行任何操作。

流字段并发锁定

InterSystems IRIS通过在流数据上加锁来保护流数据值不受另一个进程的并发操作。

InterSystems IRIS在执行写操作之前会拿出一个独占锁。写操作完成后，独占锁会立即释放。

InterSystems IRIS在第一次读操作发生时取出一个共享锁。只有在实际读取流时才会获得共享锁，并且在整个流从磁盘读入内部临时输入缓冲区后立即释放。

在InterSystems IRIS方法中使用流字段

你不能在InterSystems IRIS方法中直接使用嵌入式SQL或动态SQL来使用BLOB或CLOB值；而是要使用SQL来找到BLOB或CLOB的流标识符，然后创建%AbstractStream对象的实例来访问数据。

从ODBC使用流字段

ODBC规范没有为BLOB和CLOB字段提供任何识别或特殊处理。

InterSystems SQL在ODBC中表示CLOB字段为LONGVARCHAR (-1)类型。BLOB字段被表示为LONGVARBINARY类型（-4）。

从JDBC使用流字段

在一个Java程序中，你可以使用标准的JDBC BLOB和CLOB接口从BLOB或CLOB中检索或设置数据。比如说

Statement st = conn.createStatement()。
ResultSet rs = st.executeQuery("SELECT MyCLOB,MyBLOB FROM MyTable")。
rs.next(); // 取出Blob/Clob

java.sql.Clob clob = rs.getClob(1);
java.sql.Blob blob = rs.getBlob(2);

// Length
System.out.println("Clob length = " + clob.length())。
System.out.println("Blob length = " + blob.length())。

// ...

注意:当完成对BLOB或CLOB的处理时，你必须明确地调用free()方法来关闭Java中的对象，并向服务器发送消息以释放流资源（对象和锁）。

讨论 (0)1

登录或注册以继续

添加回复