使用select方法详解
(1)通过标签名查找:soup.select('a')
(2)通过类名查找:soup.select('.sister')
(3)通过 id 名查找:soup.select('#link1')
(4)组合查找:soup.select('p #link1')
(5)属性查找:soup.select('a[href="http://example.com/elsie"]')
BeautifulSoup获取标签内的文本信息通常有以下几种方式:
1. string:获取某个标签下的非标签字符串(如果自身标签下没有内容,则返回空值,即使子孙有),返回的是一个字符串。
2. strings:获取某个标签下的子孙非标签字符串,返回的是一个生成器,通常取值时需要先转换成list。
3. stripped_strings:获取某个标签下的子孙非标签字符串,会去掉空白字符,返回的是一个生成器,通常取值时需要先转换成list。
4. get_text:获取某个标签下的子孙标签字符串,返回的是普通字符串(包含HTML的格式内容,通常配合css选择器(soup.select)进行使用)。
5. text:用来获取目标路径下的子孙非标签字符串,返回的是字符串
来源:https://blog.csdn.net/qq_39504519/article/details/107008277
https://www.cnblogs.com/yizhenfeng168/p/6979339.html