Bootstrap

python爬取B站弹幕

文章目录


1.所需库
2.cid的获取
3.源代码

1.所需库

  1. requests:用于发送http请求
  2. BeautifulSoup:用于解析html文档,便于之后的到导航和查找
  3. pandas:用于对数据的处理,创建数据电子表格
    2.cid的获取:
    点击F12在右端获取在这里插入图片描述

3.源代码如下:

import numpy as np
from PIL import Image
from bs4 import BeautifulSoup
url="http://comment.bilibili.com/cid.xml"
req = requests.get(url)
html
;