当前位置: 代码迷 >> 综合 >> 六、Scrapy Selector使用
  详细解决方案

六、Scrapy Selector使用

热度:96   发布时间:2023-10-13 21:24:47.0

Selectors 选择器

Scrapy Selectors内置XPath 和CSS Selector表达式机制

Selectors有四个基本的方法,最常用的还是xpath:

xpath():传入xpath表达式,返回该表达式所对应的所有节点的selector list列表

extract():序列化该节点为Unicode字符串并返回list

css():传入CSS表达式,返回该表达式所对应的所有节点的selector list列表,语法同Beautisoup

re():根据传入的正则表达式对数据进行提取,返回Unicode字符串list列表

 

XPath表达式的例子及对应的含义:

/html/head/title:选择<html>文档中<head>标签内的<title>元素

/html/head/title/text():选择上面提到的<title>元素的文字

//td:选择所有的<td>元素

//div[@class=”mine”]:选择所有具有class=”mine”属性的div 元素

  相关解决方案