Bootstrap

goodreads书籍评论爬取&NRC Emotion Lexicon分析


对爬虫、逆向感兴趣的同学可以查看文章,一对一小班教学:https://blog.csdn.net/weixin_35770067/article/details/142514698

目标网站

https://www.goodreads.com/book/show/3656.The_Sea
在这里插入图片描述
就是针对一本书进行3000+评论抓取和情感分析。

数据获取

页面比较简单,都不需要写代码,直接用插件采集获取结果。
下图为部分评论结果
在这里插入图片描述

评论情感分析

import pandas as pd
;