p.s.高产量博主,点个关注?不迷路!
今天更博比较晚,简单的写一个常见错误的处理吧:
首先展示一下我们的错误代码(一段xpath处理本地HTML文件的代码) :
from lxml import etreetree = etree.parse('xpathDemo.html')
print(tree)
这是我们对应读取的HTML源代码:
<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><title>XpathDemo</title>
</head>
<body><ul><li id = "l1">北京</li><li id = "l2">北京</li><li>深圳</li><li>武汉</li></ul>
</body>
</html>
这是错误的信息:
lxml.etree.XMLSyntaxError: Opening and ending tag mismatch: meta line 4 and head, line 6, column 8
它是什么意思呢?它的意思是说,我们读取的HTML文件的第四行,meta标签出错了,而且是语法错误,那我们回到上面找一找HTML文件的源码,第四行是:
<meta charset="UTF-8">
它有什么错误呢,其实是它少了一个/线,因为根据HTML代码的规范性,标签都要求是一对出现的,这种单标签需要补一个斜线,但是我们常用的IDE生成这一行代码的时候往往都不会自动补全一个斜线,因此我们需要自己手动添加:
<meta charset="UTF-8"/>
这样就不会报错了,以后报这种错误,直接在<meta>中加斜线即可!???