手把手教你使用python爬虫之xpath - 悦读

手把手教你使用python爬虫之xpath

文章目录

xpath

xpath

环境安装：

pip install lxml

1.xpath解析的编码流程

1.创建一个etree类型的对象，然后把即将被解析的页面源码数据加载到该对象中
2.调用etree对象的xpath方法结合着不同形式的xpath表达式，进行标签定位和数据提取
xpath表达式如何理解？
- html中的标签是遵从树状结构的。
- 切记:xpath表达式中最好不要出现tbody标签，因为tbody标签可能是浏览器加的，可以通过查看网页源代码判断是否是真实的tbody！
  tbody可能是源代码自带的，也有可能是浏览器添加的
  可以通过右键，查看页面源代码，确定tbody是不是浏览器添加的，如果源代码中有tbody，那就时源代码中包含的
  如果没有那就是浏览器添加的

2.使用方法

悦读

道可道，非常道；名可名，非常名。无名，天地之始，有名，万物之母。故常无欲，以观其妙，常有欲，以观其徼。此两者，同出而异名，同谓之玄，玄之又玄，众妙之门。

剩余电流动作保护继电器的应用探讨

Vue——数据双向绑定

Docker 镜像库国内加速的几种方法

【C++】Functions

MySQL后端返回给前端的时间变了（时区问题）

聊一聊 Valgrind 监视非托管内存泄露和崩溃

Spring Authorization Server 1.4.0 使用及详细配置搭配Spring Boot3.4.0 + Spring Security6.4.1

python库openpyxl操作excel

Generative Adversarial Nets[Pre-WGAN]

【Jenkins】+【飞书机器人】发送通知(带签名)【Linux】

;