Bootstrap

【python实战】爬取起点中文网自制小说阅读器

哈喽,大家好,我是一条。

相信有很多爱看小说的朋友,一定也有很多爱听小说的朋友。

今天就教大家先爬取起点中文网,再自制小说阅读器。

起点中文网爬虫

一条从初中开始看小说,那时3G刚普及,wifi更没有现在这么常见,所以都是把小说下载下来看,所以找一个免费的下载源就尤为重要。

直到接触到爬虫,简直太爽了!

1.涉及知识点

  • requests请求
  • 利用lxml进行xpath解析
  • python文件操作

2.实现步骤

url

百度搜索起点中文网,得到所有小说的url:https://www.qidian.com/all

解析网页

通过开发者工具,分析小说名字的xpath路径

;