xpath取空标签里面的内容
这几天爬虫遇到一个问题,有标签之间的内容为空,如下图:最后一个td标签是没有内容的,如果直接用xpath提取:代码如下
a=_b.xpath('.//td/text()')
输出结果只能输出前三个标签下的内容,不会取到第四个标签。而我希望即便第四个标签为空,也能取到空值,从而和前三个一起存到列表中,便于我向excel中保存文件,对此可单独提取td标签:
all = _b.xpath('td') if a.xpath('td') else ''
for j in all:
k=j.xpath('.//text()')
k=''.join([l for l in k]).replace('/xa0','')
all_list.append(k)
上面的代码通过单独提取td标签,再取解析每个td标签的内容,可实现输出['0.36','g','o', ' ']
xpath取空标签里面的内容最先出现在Python成神之路。
共有 0 条评论