接口分析
爬数据需要先思考从哪里爬?经过一番搜索和考虑,我发现天天基金网的数据既比较全,又十分容易爬取,所以就从它入手了。
首先,随便点开一支基金,我们可以看到域名就是该基金的代码,十分方便,其次下面有生成的净值图。
基金详情
打开chrome的开发者调试,选择Network,然后刷新一下,很快我们就能发现我们想要的东西了。可以看到,这是基金代码加当前时间的一个接口 请求的url:
http://fund.eastmoney.com/pingzhongdata/003511.js?v=20190304115823
也就是说我们可以简单的通过
http://fund.eastmoney.com/pingzhongdata/
基金代码.js?v=当前时间这样一个接口就能获取到相应的数据了。