AI智能
改变未来

Scrapy CSS选择器


CSS基本选择

1.通用选择器

response.css(\”*\”).extract()

2. 类型选择

选择指定标签的内容

<input></input>

.css(“div”)或者 response.css(“input”)

3. 类Class选择器

选择指定类的内容

<div class = \"pic\"></div>

Response.css(\”.pic\”)

4.ID选择器

选择指定ID的内容

<div id=\"pic\"></div>

Response.css(\”#pic\”)

5.属性选择Attr选择器

按照给定的属性,选择所有匹配的元素。
语法:[attr] [attr=value] [attr~=value] [attr|=value] [attr^=value] [attr$=value] [attr*=value]

6.分组选择器

使用逗号分隔不同标签, 可以同时匹配到二者任意元素
Reponse.css(“div, span”)

6.后代组合器

组合选择前一个元素的后代节点, 匹配所有位于任意

<div>

元素之内的

<span>

Reponse.css(“div span”)

7.直接子代组合器

组合选择前一个元素的直接子代节点, 匹配直接嵌套在

<ul>

元素内的所有

<li>

元素。
Response.css(“ul > li”)

7.一般兄弟组合器

选择兄弟元素,也就是说,后一个节点在前一个节点后面的任意位置,并且共享同一个父节点。匹配同一父元素下,

<p>

元素后的所有

<span>

元素。
Reponse.css(“p ~ span”)

7.紧邻兄弟组合器

选择相邻元素,即后一个元素紧跟在前一个之后,并且共享同一个父节点。会匹配所有紧邻在

<h2>

元素后的

<p>

元素。
Response.css(“h2 + p”)

7.列组合器

选择属于某个表格行的节点。 会匹配所有

<col>

作用域内的

<td>

元素。
Response.css(“co || td”)

7.伪选择器

:: 伪选择器用于表示无法用 HTML 语义表达的实体。匹配所有

<p>

元素的第一行。
Response.css(“p::first-line”)

赞(0) 打赏
未经允许不得转载:爱站程序员基地 » Scrapy CSS选择器