第1关:利用urllib库爬取网页内容
任务描述
本关任务:爬取指定网页内容,并将内容保存。
相关知识
为了完成本关任务,你需要掌握:1.urllib库。
第2关:利用bs4库提取网页内容
任务描述
本关任务:爬取网页内容,并提取关键内容。 抓取豆瓣电影Top250网页,提取影片名、评分、链接三项数据,将数据保存到movie.csv文件中。 (1)爬取网址:豆瓣电影 Top 250
(2)源代码分析
(3)结果文件movie.csv工作表内容如下 :
本关任务:爬取指定网页内容,并将内容保存。
为了完成本关任务,你需要掌握:1.urllib库。
本关任务:爬取网页内容,并提取关键内容。 抓取豆瓣电影Top250网页,提取影片名、评分、链接三项数据,将数据保存到movie.csv文件中。 (1)爬取网址:豆瓣电影 Top 250
(2)源代码分析
(3)结果文件movie.csv工作表内容如下 :
道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。