Xpath語法格式總結_XML/RSS

來源:腳本之家  責任編輯:小易  

看下面一些例子:1)獲取子節點:getchildren()等價于child:*doc.getchildren()2)獲取當前節點:"."等價于self:node()doc.xpath(".")doc.xpath("self:node()")3)獲取父節點:"."等價于parent:node()doc.head.xpath(".")doc.head.xpath("parent:node()")4)ancestor軸和descendant軸分別代表當前元素所有祖先元素、所有后代元素,比如:meta.xpath('ancestor:*')meta.xpath('ancestor:head')doc.xpath('descendant:table')doc.xpath('descendant:table[@id="tcdatafields"]')doc.xpath('/table[@id="tcdatafields"]')5)ancestor-or-self和descendant-or-self軸分別表示當前元素或其所有祖先元素、當前元素或其所有后代元素,比如:meta.xpath('ancestor-or-self:*')6)child和parent軸分別表示當前元素所有子元素、父元素:doc.xpath('child:head')head.xpath('child:meta[1]')head.xpath('child:meta[position()]')7)attribute軸表示當前元素的所有屬性,例如下面是meta元素的name和content兩個屬性以及取值:meta.items()[('name','googlebot'),('content','index,follow')]獲取所有屬性取值:meta.xpath('attribute:*')['googlebot','index,follow']獲取name屬性的取值:meta.xpath('attribute:name')['googlebot']8)following和preceding分別表示當前元素的所有后繼元素、前置元素,比如:meta.xpath('following:*')meta.xpath('preceding:*')9)following-sibling和preceding-sibling軸分別表示當前元素的所有平級后繼元素、平級前置元素,比如:meta.xpath('preceding-sibling:*')meta.xpath('following-sibling:*')10)self軸表示當前元素自身doc.xpath("self:*")使用謂詞(predicates)謂詞就是step中使用中括號[.]定義的那部分,使用謂詞能實現精確查找,看下面的例子:doc.xpath('/html/head/meta')1)位置謂詞doc.xpath('/html/head/meta[1]')doc.xpath('/html/head/meta[2]')doc.xpath('/html/head/meta[last()]')doc.xpath('/html/head/meta[last()-1]')doc.xpath('/html/head/meta[position()]')注:這里使用了last()和position()兩個函數,xpath還支持更多的函數,結合這些函數可以獲得非常強大的處理能力。2)屬性謂詞含有屬性name的meta元素:doc.xpath('/html/head/meta[@name]')含有屬性name而且其取值為robots的meta元素:含有任意屬性的meta元素:doc.xpath('/html/head/meta[@*]')3)函數謂詞xpath內置很多函數,靈活使用這些函數,可以極大提升查找效率,比如:使用text()函數doc.xpath('/td[text()="2017-03-21"]')使用contains函數[td.textfortdindoc.xpath('/td[contains(text(),"2017-03-2")]')]['2017-03-29','2017-03-28','2017-03-27','2017-03-24','2017-03-23','2017-03-22','2017-03-21','2017-03-20']使用starts-with函數[td.textfortdindoc.xpath('/td[starts-with(text(),"2017-02-2")]')]['2017-02-28','2017-02-27','2017-02-24','2017-02-23','2017-02-22','2017-02-21','2017-02-20'][td.textfortdindoc.xpath('/td[text()>21.0andtext()]')]['21.02'][td.textfortdindoc.xpath('/td[text()()>21.0]')]['21.02','-2.64']通配符xpath也支持通配符"*",其中'*"可以匹配任何標簽元素,"@*"可以匹配任何元素屬性,node()可以匹配任何節點:head.xpath('./*')head.xpath('./meta[@*]')head.xpath('./node()')www.13333515.buzz防采集請勿采集本網。

經常在工作中會使用到XPath的相關知識,但每次總會在一些關鍵的地方不記得或不太清楚,所以免不了每次總要查一些零碎的知識,感覺即很煩又浪費時間,所以對XPath歸納及總結一下。

最近剛好寫了一個基于xpath對XML的增刪改查的實例hl需要的話留下QQ3951我發到你郵箱

在這篇文章中你將能學習到:

1、XmlNodeList list=myDoc.SelectNodes(\"/root/list/catalog[@orders>'3'and catalogtype='0']\");2、XmlNodeList list=myDoc.SelectNodes(\"/root/list/catalog[@catalogname='軍事新聞']\");3、

XPath簡介

/html/body/form/input[1] html/body/form/input[@name='username']

XPath 路徑表達式詳解

百度我喜歡。

XPath在DOM,XSLT及XQuery中的應用

你句子里面的雙引號。

XPath簡介

XPath是W3C的一個標準。它最主要的目的是為了在XML1.0或XML1.1文檔節點樹中定位節點所設計。目前有XPath1.0和XPath2.0兩個版本。其中Xpath1.0是1999年成為W3C標準,而XPath2.0標準的確立是在2007年。W3C關于XPath的英文詳細文檔請見:http://www.w3.org/TR/xpath20/ 。

XPath是一種表達式語言,它的返回值可能是節點,節點集合,原子值,以及節點和原子值的混合等。XPath2.0是XPath1.0的超集。它是對XPath1.0的擴展,它可以支持更加豐富的數據類型,并且XPath2.0保持了對XPath1.0的相對很好的向后兼容性,幾乎所有的XPath2.0的返回結果都可以和XPath1.0保持一樣。另外XPath2.0也是XSLT2.0和XQuery1.0的用于查詢定位節點的主表達式語言。XQuery1.0是對XPath2.0的擴展。關于在XSLT和XQuery中使用XPath表達式定位節點的知識在后面的實例中會有所介紹。

在學習XPath之前你應該對XML的節點,元素,屬性,原子值(文本),處理指令,注釋,根節點(文檔節點),命名空間以及對節點間的關系如:父(Parent),子(Children),兄弟(Sibling),先輩(Ancestor),后代(Descendant)等概念有所了解。這里不在說明。

XPath路徑表達式

在本小節下面的內容中你將可以學習到:

路徑表達式語法

相對/絕對路徑

表達式上下文

謂詞(篩選表達式)及軸的概念

運算符及特殊字符

常用表達式實例

函數及說明

這里給出一個實例Xml文件。下面的說明及實例都是基于該XML文件。

<?xml version="1.0" encoding="UTF-8"?><!-- edited with XMLSpy v2008 rel. 2 sp2 (http://www.altova.com) by Administrator --><?xml-stylesheet type="text/xsl" href="messages.xsl" rel="external nofollow" ?><messages> <message id="1"> <sender>[email protected]</sender> <to>[email protected] <group name="IT"> <address>[email protected]</address> <address>[email protected]</address> <address>[email protected]</address> <address>[email protected]</address> <address>[email protected]</address> </group> </to> <subject>This is a sample</subject> <datetime date="2008-12-11" time="12:00:00" formatted="12/11/2008 12:00AM">2008-12-11T12:00:00Z</datetime> <body> Are you interested in? <attachments> <attachment id="1"> <message id="0"> <sender>[email protected]</sender> <to>[email protected]</to> <body>We strongly recommend the following books <books xmlns:amazon="http://www.amazon.com/books/schema"> <amazon:book> <name>Professional C# 2008 </name> <country>USA</country> <price>37.79</price> <year>2007</year> </amazon:book> <amazon:book> <name>Microsoft Visual C# 2008 Step by Step </name> <country>USA</country> <price>26.39 </price> <year>2008</year> </amazon:book> <amazon:book> <name>C# in Depth</name> <country>USA</country> <price>29.69 </price> <year>2006</year> </amazon:book> <amazon:book> <name>Thinking in Java</name> <country>USA</country> <price>23.69 </price> <year>2004</year> </amazon:book> </books> </body> </message> </attachment> </attachments> </body> </message> <message id="2"> <sender>[email protected]</sender> <to>[email protected]</to> <subject>No title</subject> <body/> </message></messages>

路徑表達式語法:

路徑 = 相對路徑 | 絕對路徑

XPath路徑表達式 = 步進表達式 | 相對路徑 "/"步進表達式。

步進表達式=軸 節點測試 謂詞

說明:

其中軸表示步進表達式選擇的節點和當前上下文節點間的樹狀關系(層次關系),節點測試指定步進表達式選擇的節點名稱擴展名,謂詞即相當于過濾表達式以進一步過濾細化節點集。

謂詞可以是0個或多個。多個多個謂詞用邏輯操作符and, or連接。取邏輯非用not()函數。

請看一個典型的XPath查詢表達式:/messages/message//child::node()[@id=0],其中/messages/message是路徑(絕對路徑以"/"開始),child::是軸表示在子節點下選擇,node()是節點測試表示選擇所有的節點。[@id=0]是謂詞,表示選擇所有有屬性id并且值為0的節點。

相對路徑與絕對路徑:

如果"/"處在XPath表達式開頭則表示文檔根元素,(表達式中間作為分隔符用以分割每一個步進表達式)

如:/messages/message/subject是一種絕對路徑表示法,它表明是從文檔根開始查找節點。假設當前節點是在第一個message節點【/messages/message[1]】,則路徑表達式subject(路徑前沒有"/")這種表示法稱為相對路徑,表明從當前節點開始查找。具體請見下面所述的"表達式上下文"。

表達式上下文(Context):

上下文其實表示一種環境。以明確當前XPath路徑表達式處在什么樣的環境下執行。例如同樣一個路徑表達式處在對根節點操作的環境和處在對某一個特定子節點操作的環境下執行所獲得的結果可能是完全不一樣的。也就是說XPath路徑表達式計算結果取決于它所處的上下文。

XPath上下文基本有以下幾種:

當前節點(./):

如./sender表示選擇當前節點下的sender節點集合(等同于下面所講的"特定元素",如:sender)

父節點(../):

如../sender表示選擇當前節點的父節點下的sender節點集合

根元素(/):

如/messages表示選擇從文檔根節點下的messages節點集合.

根節點(/*):

這里的*是代表所有節點,但是根元素只有一個,所以這里表示根節點。/*的返回結果和/messages返回的結果一樣都是

messages節點。

遞歸下降(//):

如當前上下文是messages節點。則//sender將返回以下結果:

/messages//sender :

<sender>[email protected]</sender>

<sender>[email protected]</sender>

<sender>[email protected]</sender>

/messages/message[1]//sender:

<sender>[email protected]</sender>

<sender>[email protected]</sender>

我們可以看出XPath表達式返回的結果是:從當前節點開始遞歸步進搜索當前節點下的所有子節點找到滿足條件的節點集。

特定元素

如sender:表示選擇當前節點下的sender節點集合,等同于(./sender)

注意:在執行XPath時一定要注意上下文。即當前是在哪個節點下執行XPath表達式。這在XMLDOM中很重要。如:在XMLDOM中的selectNodes,selectSingleNode方法的參數都是一個XPath表達式,此時這個XPath表達式的執行上下文就是調用這個方法的節點及它所在的環境。更多信息請參見:http://www.w3.org/TR/xpath20/

謂詞(篩選表達式)及軸的概念:

XPath的謂詞即篩選表達式,類似于SQL的where子句.

軸名稱

結果

ancestor

選取當前節點的所有先輩(父、祖父等)

ancestor-or-self

選取當前節點的所有先輩(父、祖父等)以及當前節點本身

attribute

選取當前節點的所有屬性

child

選取當前節點的所有子元素。

descendant

選取當前節點的所有后代元素(子、孫等)。

descendant-or-self

選取當前節點的所有后代元素(子、孫等)以及當前節點本身。

following

選取文檔中當前節點的結束標簽之后的所有節點。

namespace

選取當前節點的所有命名空間節點

parent

選取當前節點的父節點。

preceding

直到所有這個節點的父輩節點,順序選擇每個父輩節點前的所有同級節點

preceding-sibling

選取當前節點之前的所有同級節點。

self

選取當前節點。

運算符及特殊字符:

運算符/特殊字符

說明

/

此路徑運算符出現在模式開頭時,表示應從根節點選擇。

//

從當前節點開始遞歸下降,此路徑運算符出現在模式開頭時,表示應從根節點遞歸下降。

.

當前上下文。

..

當前上下文節點父級。

*

通配符;選擇所有元素節點與元素名無關。(不包括文本,注釋,指令等節點,如果也要包含這些節點請用node()函數)

@

屬性名的前綴。

@*

選擇所有屬性,與名稱無關。

:

命名空間分隔符;將命名空間前綴與元素名或屬性名分隔。

( )

括號運算符(優先級最高),強制運算優先級。

[ ]

應用篩選模式(即謂詞,包括"過濾表達式"和"軸(向前/向后)")。

[ ]

下標運算符;用于在集合中編制索引。

|

兩個節點集合的聯合,如://messages/message/to | //messages/message/cc

-

減法。

div,

浮點除法。

and, or

邏輯運算。

mod

求余。

not()

邏輯非

=

等于

!=

不等于

特殊比較運算符

< 或者 <

<= 或者 <=

> 或者 >

>= 或者 >=

需要轉義的時候必須使用轉義的形式,如在XSLT中,而在XMLDOM的scripting中不需要轉義。

常用表達式實例:

/

Document Root文檔根.

/*

選擇文檔根下面的所有元素節點,即根節點(XML文檔只有一個根節點)

/node()

根元素下所有的節點(包括文本節點,注釋節點等)

/text()

查找文檔根節點下的所有文本節點

/messages/message

messages節點下的所有message節點

/messages/message[1]

messages節點下的第一個message節點

/messages/message[1]/self::node()

第一個message節點(self軸表示自身,node()表示選擇所有節點)

/messages/message[1]/node()

第一個message節點下的所有子節點

/messages/message[1]/*[last()]

第一個message節點的最后一個子節點

/messages/message[1]/[last()]

Error,謂詞前必須是節點或節點集

/messages/message[1]/node()[last()]

第一個message節點的最后一個子節點

/messages/message[1]/text()

第一個message節點的所有子節點

/messages/message[1]//text()

第一個message節點下遞歸下降查找所有的文本節點(無限深度)

/messages/message[1] /child::node()

/messages/message[1] /node()

/messages/message[position()=1]/node()

//message[@id=1] /node()

第一個message節點下的所有子節點

//message[@id=1] //child::node()

遞歸所有子節點(無限深度)

//message[position()=1]/node()

選擇id=1的message節點以及id=0的message節點

/messages/message[1] /parent::*

Messages節點

/messages/message[1]/body/attachments/parent::node()

/messages/message[1]/body/attachments/parent::* /messages/message[1]/body/attachments/..

attachments節點的父節點。父節點只有一個,所以node()和* 返回結果一樣。

(..也表示父節點. 表示自身節點)

//message[@id=0]/ancestor::*

Ancestor軸表示所有的祖輩,父,祖父等。

向上遞歸

//message[@id=0]/ancestor-or-self::*

向上遞歸,包含自身

//message[@id=0]/ancestor::node()

對比使用*,多一個文檔根元素(Document root)

/messages/message[1]/descendant::node()

//messages/message[1]//node()

遞歸下降查找message節點的所有節點

/messages/message[1]/sender/following::*

查找第一個message節點的sender節點后的所有同級節點,并對每一個同級節點遞歸向下查找。

//message[@id=1]/sender/following-sibling::*

查找id=1的message節點的sender節點的所有后續的同級節點。

//message[@id=1]/datetime/@date

查找id=1的message節點的datetime節點的date屬性

//message[@id=1]/datetime[@date]

//message/datetime[attribute::date]

查找id=1的message節點的所有含有date屬性的datetime節點

//message[datetime]

查找所有含有datetime節點的message節點

//message/datetime/attribute::*

//message/datetime/attribute::node()

//message/datetime/@*

返回message節點下datetime節點的所有屬性節點

//message/datetime[attribute::*]

//message/datetime[attribute::node()]

//message/datetime[@*]

//message/datetime[@node()]

選擇所有含有屬性的datetime節點

//attribute::*

選擇根節點下的所有屬性節點

//message[@id=0]/body/preceding::node()

順序選擇body節點所在節點前的所有同級節點。(查找順序為:先找到body節點的頂級節點(根節點),得到根節點標簽前的所有同級節點,執行完成后繼續向下一級,順序得到該節點標簽前的所有同級節點,依次類推。)

注意:查找同級節點是順序查找,而不是遞歸查找。

//message[@id=0]/body/preceding-sibling::node()

順序查找body標簽前的所有同級節點。(和上例一個最大的區別是:不從最頂層開始到body節點逐層查找。我們可以理解成少了一個循環,而只查找當前節點前的同級節點)

//message[@id=1]//*[namespace::amazon]

查找id=1的所有message節點下的所有命名空間為amazon的節點。

//namespace::*

文檔中的所有的命名空間節點。(包括默認命名空間xmlns:xml)

//message[@id=0]//books/*[local-name()='book']

選擇books下的所有的book節點,

注意:由于book節點定義了命名空間<amazone:book>.若寫成//message[@id=0]//books/book則查找不出任何節點。

//message[@id=0]//books/*[local-name()='book' and namespace-uri()='http://www.amazon.com/books/schema']

選擇books下的所有的book節點,(節點名和命名空間都匹配)

//message[@id=0]//books/*[local-name()='book'][year>2006]

選擇year節點值>2006的book節點

//message[@id=0]//books/*[local-name()='book'][1]/year>2006

指示第一個book節點的year節點值是否大于2006.

返回xs:boolean: true

函數及說明:

值得欣喜的是XPath函數和XSLT,XQuery等共享函數庫,函數庫為我們提供了功能豐富的各種函數的調用,我們也可以自定義自己的函數。這里不再對每個函數的用法逐一說明,中文的可以參考這個網站, //www.13333515.buzz/w3school/xpath/index.htm

XPath在DOM,XSLT及XQuery中的應用

DOM:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml"><head><title>XPath Test</title></head><body><script language="javascript" type="text/javascript">var xmlDoc = new ActiveXObject("Microsoft.XMLDOM");xmlDoc.async="false";xmlDoc.load("messages.xml");xmlDoc.setProperty("SelectionLanguage", "XPath"); var sPath = "/messages/message[1]//books/*[local-name()='book']";var bookNodes = xmlDoc.selectNodes(sPath);document.write("<ul>");for ( var i = 0; i < bookNodes.length; i++) {document.write("<li>" + bookNodes[i].childNodes[0].text + "</li>");}document.write("</ul>");</script></body></html>

注意:

我們若使用new ActiveXObject("Microsoft.XMLDOM")則需要注意的是:因為早期的XMLDOM的SelectionLanguage屬性默認是正則表達式,不是XPath語言。所以需要指定這樣一條語句xmlDoc.setProperty("SelectionLanguage", "XPath"); 以支持XPath查詢表達式。.

若沒有指定SelectionLanguage屬性值為XPath則要注意以下情況:

數組下標從0開始(我們知道在XPath查詢表達式中數組下標是從1開始的)不支持在XPath查詢表達式中使用XPath函數。

總結

以上就是本文關于Xpath語法格式總結的全部內容,希望對大家有所幫助。感興趣的朋友可以參閱:MYSQL updatexml()函數報錯注入解析OGNL表達式基本語法與用法詳解前端常見跨域解決方案(全)等,有什么問題可以隨時留言,歡迎大家討論交流。

/是在它的子結點中查找,而/是在它的所有子結點中查找,包括子結點的子結點等等比如:lev2_1lev2_2那么如果用lev1/lev2只能得到文本是lev2_2的這個結點,而如果用lev1/lev2,則兩個lev2結點都能得到內容來自www.13333515.buzz請勿采集。


  • 本文相關:
  • htmlcleaner使用方法及xpath語法初探
  • 解析xpath語法之在c#中使用xpath的示例詳解
  • jquery 選擇器 xpath 語法應用
  • xml輕松學習手冊(三):xml的術語
  • xml創建可排序、分頁的數據顯示頁面
  • xml輕松學習手冊(1)xml快速入門
  • xml入門精解之結構與語法
  • xml卷之實戰錦囊(3):動態分頁
  • 了解web頁面工具語言xml(一)產生背景
  • 了解web頁面工具語言xml(六)展望
  • xml在語音合成中的應用
  • 怎樣快速從一個xml文件中查找信息
  • xml卷之實戰錦囊(1):動態排序
  • XML中的XPATH語法的'/'和'//'的區別在哪里?
  • 如何使用xpath表達式解析HTML和XML文檔
  • xpath 語法問題
  • 關于c# 利用xpath 搜索XML 的問題
  • c# webform下使用xpath獲取xml的節點文本
  • XML XPATH
  • 一個xpath語法的問題
  • java中如何使用XPath來校檢xml
  • xml 數據查詢問題 懷疑 是 xpath 的bug
  • C#Xpath創建xml
  • 網站首頁網頁制作腳本下載服務器操作系統網站運營平面設計媒體動畫電腦基礎硬件教程網絡安全javascriptasp.netphp編程ajax相關正則表達式asp編程jsp編程編程10000問css/htmlflex腳本加解密web2.0xml/rss網頁編輯器相關技巧安全相關網頁播放器其它綜合dart首頁xml/rssmysql updatexml()函數報錯注入解析ognl表達式基本語法與用法詳解前端常見跨域解決方案(全)htmlcleaner使用方法及xpath語法初探解析xpath語法之在c#中使用xpath的示例詳解jquery 選擇器 xpath 語法應用xml輕松學習手冊(三):xml的術語xml創建可排序、分頁的數據顯示頁面xml輕松學習手冊(1)xml快速入門xml入門精解之結構與語法xml卷之實戰錦囊(3):動態分頁了解web頁面工具語言xml(一)產生背景了解web頁面工具語言xml(六)展望xml在語音合成中的應用怎樣快速從一個xml文件中查找信息xml卷之實戰錦囊(1):動態排序sxna rss blog 聚合器程序asp+rss閱讀器制作xml文件的結構解讀xpath語法格式總結xml和yaml的使用方法javascript生成xml怎樣快速從一個xml文件中查找信息把html表單提交的數據轉化成xml文使用正則表達式進行xml數據驗證包含中文字符的url編碼問題了解web頁面工具語言xml(二)定義用xml和sql 2000來管理存儲過程調用xml、dataset、datagrid結合一xsl簡明教程(2)xsl轉換使用純html的通用數據管理和服務xml 解析類利用xmlserializer將對象串行化到xmlxml輕松學習手冊(二):xml概念不錯的rss看樣要學習了學習使用xml引擎xqengine
    免責聲明 - 關于我們 - 聯系我們 - 廣告聯系 - 友情鏈接 - 幫助中心 - 頻道導航
    Copyright © 2017 www.13333515.buzz All Rights Reserved
    3排列五开奖结果