文章目录
前言
本文以电影《你好,李焕英》在豆瓣上的影评数据为爬取和分析的目标,利用python爬虫技术对影评数据进行了爬取,使用pandas库进行了数据清洗,使用jieba库进行分词,使用collections库进行词频统计,使用wordcloud库绘制词云图,使用matplotlib库绘制了评论人所在城市占比饼状图,并使用matplotlib库绘制了评论数量随时间变化折线图。
一、数据抓取
本文的目标网址为https:/
本文以电影《你好,李焕英》在豆瓣上的影评数据为爬取和分析的目标,利用python爬虫技术对影评数据进行了爬取,使用pandas库进行了数据清洗,使用jieba库进行分词,使用collections库进行词频统计,使用wordcloud库绘制词云图,使用matplotlib库绘制了评论人所在城市占比饼状图,并使用matplotlib库绘制了评论数量随时间变化折线图。
本文的目标网址为https:/
道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。