文章

姚鑫 · 六月 29, 2021 阅读大约需 9 分钟

第二十二章计算XPath表达式

XPath(XML路径语言)是一种基于XML的表达式语言，用于从XML文档获取数据。使用类中的%XML.XPATH.Document，可以轻松地计算XPath表达式(给定提供的任意XML文档)。

注意：使用的任何XML文档的XML声明都应该指明该文档的字符编码，并且文档应该按照声明的方式进行编码。如果未声明字符编码，InterSystems IRIS将使用本书前面的“输入和输出的字符编码”中描述的默认值。如果这些默认值不正确，请修改XML声明，使其指定实际使用的字符集。

IRIS中XPath表达式求值概述

要使用InterSystems IRIS XML支持使用任意XML文档计算XPath表达式，请执行以下操作：

创建%XML.XPATH.Document的实例。为此，请使用以下类方法之一：CreateFromFile()、CreateFromStream()或CreateFromString()``。使用这些方法中的任何一种，都可以将输入XML文档指定为第一个参数，并接收%XML.XPATH.Document的一个实例作为输出参数。

这一步使用内置的XSLT处理器解析XML文档。

使用%XML.XPATH.Document实例的EvaluateExpression()方法。对于此方法，需要指定节点上下文和要计算的表达式。

节点上下文指定要在其中计算表达式的上下文。这使用XPath语法来表示到所需节点的路径。例如：

"/staff/doc"

要计算的表达式还使用XPath语法。例如：

"name[@last='Marston']"

可以将结果作为输出参数(作为第三个参数)接收。

注意：如果要迭代一大组文档并计算每个文档的XPath表达式，建议在处理完文档后，在打开下一个文档之前将该文档的OREF设置为NULL。这绕过了第三方软件的一个限制。在循环中处理大量文档时，此限制会导致CPU使用率略有增加。

创建XPath文档时的参数列表

若要在创建%XML.XPATH.Document的实例，请使用该类的CreateFromFile()、CreateFromStream()或CreateFromString()类方法。对于这些类方法，完整的参数列表按顺序如下：

PSource、pStream或pString-源文档。

- 对于CreateFromFile()，此参数是文件名。
- 对于CreateFromStream()，此参数是二进制流。
- 对于CreateFromString()，此参数是一个字符串。

PDocument-作为输出参数返回的结果。这是%XML.XPATH.Document的实例。
PResolver-解析源时使用的可选实体解析器。
PErrorHandler-一个可选的自定义错误处理程序。
PFlags-控制SAX解析器执行的验证和处理的可选标志。
PSchemaSpec-可选的架构规范，用于验证文档源。此参数是一个字符串，其中包含以逗号分隔的命名空间/URL对列表：

"namespace URL,namespace URL"

这里，Namespace是用于模式的XML名称空间，URL是提供模式文档位置的URL。名称空间和URL值之间有一个空格字符。
7. PPrefix Mappings-可选的前缀映射字符串。

CreateFromFile()、CreateFromStream()和CreateFromString()方法返回应检查的状态。例如：

 Set tSC=##class(%XML.XPATH.Document).CreateFromFile("c:\sample.xml",.tDocument)
 If $$$ISERR(tSC) Do $System.OBJ.DisplayError(tSC)

为默认命名空间添加前缀映射

当XML文档使用默认名称空间时，这会给XPath带来问题。请考虑以下示例：

<?xml version="1.0"?>
<staff xmlns="http://www.staff.org">
  <doc type="consultant">
    <name first="David" last="Marston">Mr. Marston</name>
    <name first="David" last="Bertoni">Mr. Bertoni</name>
    <name first="Donald" last="Leslie">Mr. Leslie</name>
    <name first="Emily" last="Farmer">Ms. Farmer</name>
  </doc>
</staff>

在本例中， <staff> 元素属于名称空间，但没有名称空间前缀。XPath不提供访问 <staff> 元素的简单方法。

可以设置%XML.XPATH.Document实例的Prefix Mappings属性。该属性旨在为源文档中的每个默认名称空间提供唯一的前缀，以便XPath表达式可以使用这些前缀，而不是使用完整的名称空间URI。

PrefixMappings 属性是一个由逗号分隔的列表组成的字符串；每个列表项都是一个前缀，后跟一个空格，后跟一个命名空间URI。

调用CreateFromFile()、CreateFromStream()或CreateFromString()时，可以指定PrefixMappings参数。此字符串的格式必须与前面描述的相同。

然后以与使用任何名称空间前缀相同的方式使用这些前缀。

例如，假设将前面的XML读入%XML.XPATH.Document的实例时，按如下方式指定了前缀映射：

"s http://www.staff.org"

在本例中，可以使用"/s:staff/s:doc"访问<doc> 元素。

请注意，可以使用实例方法GetPrefix()来获取先前为文档中的给定路径指定的前缀。

计算XPath表达式

要计算XPath表达式，请使用%XML.XPATH.Document实例的EvaluateExpression()方法。对于此方法，请按顺序指定以下参数：

PContext-节点上下文，指定在其中计算表达式的上下文。指定一个字符串，该字符串包含指向所需节点的路径的XPath语法。例如：

"/staff/doc"

PExpression-选择特定结果的谓词。指定包含所需XPath语法的字符串。例如：

"name[@last='Marston']"

注意：对于其他技术，通常的做法是将谓词连接到节点路径的末尾。类中的%XML.XPATH.Document不支持此语法，因为基础XSLT处理器需要节点上下文和谓词作为单独的参数。

PResults-作为输出参数返回的结果。

EvaluateExpression()方法返回应该检查的状态。例如：

 Set tSC=tDoc.EvaluateExpression("/staff/doc","name[@last='Smith']",.tRes)
 If $$$ISERR(tSC) {Do $System.OBJ.DisplayError(tSC)}

使用XPath结果

XPath表达式可以返回XML文档的一个子树、多个子树或标量结果。在%XML.XPATH.Document的EvaluateExpression()方法旨在处理所有这些情况。具体地说，它返回一个结果列表。该列表中的每个项目都有一个Type属性，该属性具有下列值之一：

$$$XPATHDOM-指示该项包含XML文档的子树。此项目是%XML.XPATH.DOMResult实例，提供导航和检查子树的方法。
$$$XPATHVALUE-指示该项是单个标量结果。此项目是%XML.XPATH.ValueResult实例。

这些宏在%occXSLT.inc包含文件中定义。

检查XML子树

本节介绍如何导航由%XML.XPATH.DOMResult表示的XML子树，以及如何获取有关您在该子树中当前位置的信息。

导航子树

要导航%XML.XPATH.DOMResult的实例，可以使用该实例的以下方法：Read()、MoveToAttributeIndex()、MoveToAttributeName()、MoveToElement()和Rewind()。

要移动到文档中的下一个节点，请使用read()方法。Read()方法返回TRUE值，直到没有更多节点可读为止(即，直到到达文档末尾)。

导航到某个元素时，如果该元素具有属性，则可以使用以下方法导航到这些属性：

使用MoveToAttributeIndex()方法按索引(属性在元素中的序号位置)移动到特定属性。此方法只有一个参数：属性的索引号。请注意，可以使用AttributeCount属性来了解给定元素有多少个属性。
使用MoveToAttributeName()方法按名称移动到特定属性。此方法有两个参数：属性名称和命名空间URI(可选)。

完成当前元素的属性后，可以通过调用其中一个导航方法(如read())移动到文档中的下一个元素。或者，可以调用MoveToElement()方法返回到包含当前属性的元素。

这里描述的所有方法都在文档中前进，但Rewind()方法除外，它导航到文档的开头并重置所有属性。

节点的属性

除Type属性外，%XML.XPATH.DOMResult的以下属性还提供有关当前位置的信息。

AttributeCount

如果当前节点是元素，则此属性指示元素的属性数。

EOF

如果读取器已到达源文档的末尾，则为true；否则为false。

HasAttributes

如果当前节点是一个元素，则如果该元素具有属性，则此属性为true(如果没有属性，则为false)。如果当前节点是属性，则此属性为true。

对于任何其他类型的节点，此属性为False。

HasValue

如果当前节点是具有值的节点类型(即使该值为空)，则为True。否则，此属性为false。

LocalName

对于属性或元素类型的节点，这是当前元素或属性的名称，不带命名空间前缀。对于所有其他类型的节点，此属性为NULL。

Name

当前节点的完全限定名称，视节点类型而定。

NodeType

当前节点的类型，如下之一:attribute, chars, cdata, comment, document, documentfragment, documenttype, element, entity, entityreference, notation，或处理指令。

Path

对于元素类型的节点，这是到元素的路径。
对于所有其他类型的节点，此属性为空。

ReadState

表示总体读状态，有以下几种:
- “initial”表示Read()方法还没有被调用。
- “cursoractive”意味着Read()方法至少被调用过一次。
- “eof”表示已经到达文件的末尾。

Uri

当前节点的URI。
返回的值取决于节点的类型。

Value

值(如果有的话)，适合于节点类型。
如果该值小于32kb，则为字符串。
否则，它是一个字符流。

检查标量结果

本节介绍在类中使用由%XML.XPATH.ValueResult表示的XPath结果。除Type属性外，该类还提供Value属性。

请注意，如果该值的长度大于32KB，则会自动将其放入流对象中。除非确定将收到的结果类型，否则应该检查Value是否为流对象。为此，可以使用$IsObject函数。(也就是说，如果此值是对象，则它是流对象，因为它是唯一可以是对象的类型。)

 // 如果结果长度大于32KB，则值可以是流
 Set tValue=tResult.Value

 If $IsObject(tValue){
     Write ! Do tValue.OutputToDevice()
 } else {
     Write tValue
 }

一般方法

除非可以确定在计算XPath表达式时会收到什么样的结果，否则应该编写代码来处理最常见的情况。代码的可能组织如下：

查找返回结果列表中的元素数量。遍历此列表。
对于每个列表项，检查Type属性。

- 如果Type为$$$XPATHDOM,，在类中使用%XML.XPATH.DOMResult的方法导航并检查此XML子树。
- 如果Type为$$$XPATHVALUE，请检查Value属性是否为流对象。如果是流对象，则使用常用的流接口访问数据。否则，Value属性为字符串。

示例

本节中的示例针对以下XML文档计算XPath表达式：

<?xml version="1.0"?>
<staff>
  <doc type="consultant">
    <name first="Xin" last="Yao">Yao Xin</name>
    <name first="David" last="Bertoni">Mr. Bertoni</name>
    <name first="Donald" last="Leslie">Mr. Leslie</name>
    <name first="Emily" last="Farmer">Ms. Farmer</name>
  </doc>
  <doc type="GP">
    <name first="Myriam" last="Midy">Ms. Midy</name>
    <name first="Paul" last="Dick">Mr. Dick</name>
    <name first="Scott" last="Boag">Mr. Boag</name>
    <name first="Shane" last="Curcuru">Mr. Curcuru</name>
    <name first="Joseph" last="Kesselman">Mr. Kesselman</name>
    <name first="Stephen" last="Auriemma">Mr. Auriemma</name>
  </doc>
</staff>

计算具有子树结果的XPath表达式

/// 计算返回DOM Result的XPath表达式
ClassMethod Example1()
{
    Set tSC=$$$OK
    do {

    Set tSC=##class(%XML.XPATH.Document).CreateFromFile(filename,.tDoc)
    If $$$ISERR(tSC) {Do $System.OBJ.DisplayError(tSC) Quit}

    Set context="/staff/doc"
    Set expr="name[@last='Marston']"
    Set tSC=tDoc.EvaluateExpression(context,expr,.tRes)
    If $$$ISERR(tSC) Quit

        Do ##class(%XML.XPATH.Document).ExampleDisplayResults(tRes)

    } while (0)
    If $$$ISERR(tSC) {Do $System.OBJ.DisplayError(tSC)}
    Quit
}

本例选择了<name>元素的last属性等于Yao的任何节点。
该表达式在<staff>元素的<doc>节点中计算。

请注意，此示例使用%XML.XPATH.Document的ExampleDisplayResults()类方法。

执行example1（）方法时，将先前的XML文件作为输入提供，您会看到以下输出：

DHC-APP>d ##class(PHA.TEST.Xml).Example1("E:\temp\xmlXpath.txt")

XPATH DOM
element: name
         attribute: first Value: Xin
         attribute: last  Value: Yao

chars : #text Value: Yao Xin

计算具有标量结果的`XPath`表达式

下面的类方法读取XML文件并计算返回标量结果的XPath表达式：

/// 计算返回值结果的XPath表达式
/// d ##class(PHA.TEST.Xml).Example2("E:\temp\xmlXpath.txt")
ClassMethod Example2(filename)
{
    Set tSC=$$$OK
    do {

    Set tSC=##class(%XML.XPATH.Document).CreateFromFile(filename,.tDoc)
    If $$$ISERR(tSC) {Do $System.OBJ.DisplayError(tSC) Quit}

    Set tSC=tDoc.EvaluateExpression("/staff","count(doc)",.tRes)
        If $$$ISERR(tSC) Quit

        Do ##class(%XML.XPATH.Document).ExampleDisplayResults(tRes)

    } while (0)
    If $$$ISERR(tSC) {Do $System.OBJ.DisplayError(tSC)}
    Quit
}

这个例子统计<doc>子节点。
该表达式在<staff>元素中求值。

当执行Example2()方法，提供前面的XML文件作为输入时，会看到以下输出:

DHC-APP> d ##class(PHA.TEST.Xml).Example2("E:\temp\xmlXpath.txt")

XPATH VALUE
2

第二十二章 计算XPath表达式

第二十二章 计算XPath表达式

IRIS中XPath表达式求值概述

创建XPath文档时的参数列表

为默认命名空间添加前缀映射

计算XPath表达式

使用XPath结果

检查XML子树

导航子树

节点的属性

AttributeCount

EOF

HasAttributes

HasValue

LocalName

Name

NodeType

Path

ReadState

Uri

Value

检查标量结果

一般方法

示例

计算具有子树结果的XPath表达式

计算具有标量结果的XPath表达式

第二十二章计算XPath表达式

第二十二章计算XPath表达式

计算具有标量结果的`XPath`表达式