哈喽,大家好,我是一条。
相信有很多爱看小说的朋友,一定也有很多爱听小说的朋友。
今天就教大家先爬取起点中文网,再自制小说阅读器。
起点中文网爬虫
一条从初中开始看小说,那时3G刚普及,wifi更没有现在这么常见,所以都是把小说下载下来看,所以找一个免费的下载源就尤为重要。
直到接触到爬虫,简直太爽了!
1.涉及知识点
requests
请求- 利用
lxml
进行xpath
解析 - python文件操作
2.实现步骤
url
百度搜索起点中文网,得到所有小说的url:https://www.qidian.com/all
解析网页
通过开发者工具,分析小说名字的xpath
路径