PowerShell技巧:使用XPath语法查询XML文件

日期: 2016-01-19 作者:Adam Bertram翻译:邹雅玲 来源:TechTarget中国 英文

XML是存储结构化数据的一个很好的途径,但是想要让数据在其中发挥作用又会有些困难。每一种语言都有其特定方式来查询XML文件中的命名空间、元素及属性。PowerShell也不例外。PowerShell在查询XML文件时会略有不同,而该技巧主要依赖于Select-Xml命令和XPath语法上。

XPath是定义XML文件组成的语言。XPath早在1999年就已经存在,一直被用于查询XML文件最标准的方法。 XPath将XML文件定义为树。XML文件中的每个节点都节点与其他各节点存在交互关系,就这样形成了一个族谱。

如果其中一个节点包含许多其他节点,那么该节点便是族谱中的“父母亲”,而其他节点便是族谱……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

XML是存储结构化数据的一个很好的途径,但是想要让数据在其中发挥作用又会有些困难。每一种语言都有其特定方式来查询XML文件中的命名空间、元素及属性。PowerShell也不例外。PowerShell在查询XML文件时会略有不同,而该技巧主要依赖于Select-Xml命令和XPath语法上。

XPath是定义XML文件组成的语言。XPath早在1999年就已经存在,一直被用于查询XML文件最标准的方法。

XPath将XML文件定义为树。XML文件中的每个节点都节点与其他各节点存在交互关系,就这样形成了一个族谱。如果其中一个节点包含许多其他节点,那么该节点便是族谱中的“父母亲”,而其他节点便是族谱中的“孩子”。同样的道理,子节点之间是“兄弟姐妹”的关系。我们以这种方式来分解节点是要让大家更容易理解XML文件结构。

例如,XML文件中包含了车载经销商库存明细,具体代码看起来是这样的:

<?xml version="1.0" encoding="utf-8"?>
<dealership>
     <cars>
           <car make="Ford" model="Taurus" year="2014">
                <trims>
                     <trimpackage>SportEdition</trimpackage>
                     <trimpackage>Basic</trimpackage>
                </trims>
           </car>
           <car make="BMW" model="328i" year="2015">
                <trims>
                     <trimpackage>SportEdition</trimpackage>
                     <trimpackage>Basic</trimpackage>
                </trims>
           </car>
     </cars>
</dealership>

这段XML文件代表了经销商。经销商是一个节点,而经销商“内部”是一个代表车载库存的节点。经销商是车载节点的“父母亲”,而车载节点是“孩子”。然后,车载节点下面也有分支,产生“孩子”节点。每个车载节点之间又形成一个“兄弟姐妹”关系。在这个例子中,存在树多属性关系。属性使特定节点的固有特性。你会注意到,每个车载都有自己的标志和模型属性。这种做法可以使车载类型更加具体化。这些都是指定车载节点的属性。

如何使用XPath查询XML

以上时XML结构,但是,如何使用XPath 语言查询该结构呢?XPath是一种功能强大,但却十分复杂的查询语法。为了实现简化操作,接下来我们一起谈谈XPath的普遍用法以及试图查找出此文件中所有车载节点。XPath提供了多种查找XML文件信息的方法。使用哪种方法主要根据你想要得到哪种效果。以我们团队为例,我们拥有经销商总节点,其中包含许多车载子节点,而车载节点又包含许多子节点。用XPath语法就可以表达出这种族谱关系:

/dealership/cars/car

通过这种特殊的查询方法可以获取所有车载子节点,属于经销商节点分支,而这些经销商节点又属于XML文件根目录。这是一种与众不同的方法。然而,还有另外集中查找车载节点的方法。如果你不希望了解整个方法原理,那么,你只需要需要输入查询//car就可以找到XML文件中所有车载节点。这种方法没有什么特别之处,但是,当我们需要的时候还是会用到几次的。

使用Select-Xml命令

现在,我们一起分析下PowerShell的特别之处,并指出Select-Xml的工作原理。Select-Xml是一种PowerShell命令,并用于查询System.Xml.XmlDocument对象。该命令会有一个“拍档”叫做Xpath,被用于说明特定XmlDocument对象的XPath字符串。让我们一起看看实例。

首先,为了能够使用上Select-Xml,我们必须有可供查询的XmlDocument对象。仅仅需要读取现有不工作电脑中的XML文件夹。然后,我们需要从系统文件中读取XML文件,并将其转换到XmlDocument对象中。使用Get-Content命令读取XML文件夹中的纯文本文件,并将其转换为变量,如图1所示

图1. 使用Get-Content命令从文件夹系统中读取XML文件

图1. 使用Get-Content命令从文件夹系统中读取XML文件

运行该命令后,你将会看到BaseType数组,但是还没有发挥作用。因为它必须是XmlDocument形式。为了将xmlContent变量转换为XmlDocument对象,我们还需将该变量转化为不同对象类型。做到以上几点后,再使用xml类型加速器,如图2所示。

图2. 使用xml类型加速器将BaseType数列转换为XmlDocument

图2. 使用xml类型加速器将BaseType数列转换为XmlDocument

现在,你可以看到$xmlContents归为XmlDocument类。我们现在已经做好使用Select-Xml的准备了。

使用Select-Xml的最佳方式是,通过管道将XML文件传递过去,并使用XPath作为参数,如图3所示。

图3. 使用Select-Xml和XPath参数读取XML文件

图3. 使用Select-Xml和XPath参数读取XML文件

早期,我曾使用过相同的XPath查询方法,并返回到两个车载节点上,这正是我所期待的。我也可以使用 //car捷径得到同样的结果。

查找更深层的节点

如果你想要进一步了解车载详细信息怎么办?你需要展开每个节点。使用Select-Object命令,亦或者只需选择一些其他命令,然后,通过ExpandProperty来实现查询功能,如图4所示。这种方法需要读取每个节点,并且需要读取每个节点所包含的具体节点有哪些。

图4. 使用ExpandProperty参数展开节点

图4. 使用ExpandProperty参数展开节点

假设,你只需要了解Ford Taurus的具体信息的话该怎么办?因为"Ford"和"Taurus"是XML属性,所以,XPath方法会使之变得更加复杂:

$xmlContents | Select-Xml -XPath "//car[@make='Ford']" | select -ExpandProperty node

我在XPath语法中增加了@make='Ford'字符串。这是一种查询XML属性的方法。记住这个语法,将有助于理解替换"attribute"符号。

更多XPath信息

如果你想要了解更多有关XPath语法的信息,我建议你访问XPath tutorial on W3schools.com网站。而如果你想要了解更多关于Select-Xml命令的信息,推荐Petri.com上的题为Search XML Files with PowerShell using Select-Xml的文章。

作者

Adam Bertram
Adam Bertram

自由撰稿人

相关推荐