图1
如图1所示,以这个网页的标签为例,所有的p 标签都在用箭头指向的<div class="content">中,而p标签它是一个段落标签,它里面放的是网页的文字,并且这些文字都不是在一个p标签里面,也就是说我们要提取的文字都分段放在每个p标签里面了,如果采用右击直接使用复制xpath的方式往往做不到提取p标签下面所有的内容,这样怎么办呢,我们可以利用xpath提取标签的特点
(1)// 从任意位置找标签
(2)[ ] 找该标签需要具备的条件,通常里面放该标签的属性
(3)@ 后面接属性
(4)/ 找一层级的内容
关于网络标签的其他详细内容,可以看我发布过的内容
明白这几个特点后我们就可以使用xpath提取所有的p标签下面的内容了
具体代码是:
//div[@class="content"]/p/text()
关于我的讲答,还有什么不明白的地方可以评论区留言哦!