Bootstrap

python-京东商品可视化

项目截图

README.txt

编写爬虫程序实现通过搜索抓取京东商品信息

对抓取数据进行清洗,把商品名称,评价数量数量,店铺名称,商品详情链接,价格信息清洗出来。

使用店铺名称和评价数量绘制出柱形图

对商品名称进行文本分析,随机抽取6个商品名称做为样本,然后去结果集中进行文本相似度计算或者词频统计,统计出卖该6个商品的商家数量,并根据售卖的商家数量绘制饼形图

完成课程设计报告内容编写,按时提交

文件标注

STSong.ttf 字体

京东商品.csv 数据文件

京东商品可视化.py 可视化

京东商品数据清理.py 清理

商品多页采集.py 采集

商品评论数.py 获取评论数

清洗后京东商品.csv 数据文件

运行步骤

商品多页采集.py —> 商品评论数.py -> 京东商品数据清理.py -> 京东商品可视化.py

本项目采集的是iphone15

需要更换的是cookie

一共两个文件中用到了cookie

分别是

商品多页采集.py

商品评论数.py

商品多页采集.py

Ps补充

这个地方控制页数 i<4 页就是3页的意思

商品评论数.py

接下来讲下cookie获取地址

打开下面这个网址(一定要登入哦)

https://search.jd.com/Search?keyword=iphone15&enc=utf-8&suggest=1.his.0.0&wq=&pvid=53d83601f6f8483bad6f228dd37e07f6

搜索

https://api.m.jd.com/?appid=search-pc-java&functionId=pc_search_s_new

如果需要更换商品

商品多页采集.py

修改这个地方

悦读

道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。

;