Python爬虫
爬取腾讯视频评论内容
腾讯视频评论内容在源码里是不可见,所以要使用抓包分析。
可安装fiddler代理服务器实现。
下面爬了腾讯视频评论内容(不包括回复),及发表评论者的id、昵称和头像链接。
下面是《恰好是少年》第2期的评论爬取。
#导入模块
import urllib.request
import re
import urllib.error
#添加UA
headers={
"User-Agent":" Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36",
"Content-Type": "application/json"}
Headers=[]
for i,j in headers.items():
tu=(i,j)
Headers.append(tu)
opener=urllib.request.build_opener()
opener.addheaders=Headers
#设置全局变量
urllib.request.install_opener(opener)
#视频编号,每个视频都有视屏编号,可在抓包工具获得
sp="6737986455"
#评论编号,第一次