当前位置: 代码迷 >> 综合 >> 爬虫前的小准备--Xpath
  详细解决方案

爬虫前的小准备--Xpath

热度:12   发布时间:2023-12-06 08:36:22.0

XPath是一门在XML文档中查找信息的语言.XPath可用来在XML文档中对元素和属性进行遍历.而我们熟知的HTML恰巧属于XML的一个子集.所以完全可以用xpath去查找html中的内容.

一,XML

<book><id>1</id><name>张三</name><age>12</age><body><nick>头</nick><nick>眼</nick></body>
</book>

其中<book> <id> <name> <age> <body> <nick> ...被称为节点

<book>是 <id> <name> <age> <body>父节点

<id> <name> <age> <body>是<book>字节点

<id> <name> <age> <body>为同胞节点

1,导包

from lxml import etree

2,用法

 

 二,XML