Python网络爬虫(四):b站评论

        首先来看一下采集的数据格式:

        本文不对数据采集的过程做探讨,直接上代码。首先要在程序入口处bvids列表内替换成自己想要采集的视频bvid号,然后将self.cookies替换成自己的(需要字典格式),代码可以同时爬取多个视频的评论,且爬取的评论较为完整,亲测有效:

import csv
import math
import re
import requests
import time
import json


class BilibiliComment:
    def __init__(self):
        """
        需要替换cookies,字典格式
        """
        self.cookies = {
            
        }   
        self.headers = {
            'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
            'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36',
  

相关推荐

  1. Python网络爬虫(五):b弹幕

    2024-04-05 08:04:05       37 阅读
  2. 爬取B评论Python技术实现详解

    2024-04-05 08:04:05       30 阅读
  3. 【自学用】Bpython爬虫课程笔记(Q11-)

    2024-04-05 08:04:05       44 阅读
  4. 数据分析——Python网络爬虫(){爬虫库的使用}

    2024-04-05 08:04:05       24 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-05 08:04:05       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-05 08:04:05       101 阅读
  3. 在Django里面运行非项目文件

    2024-04-05 08:04:05       82 阅读
  4. Python语言-面向对象

    2024-04-05 08:04:05       91 阅读

热门阅读

  1. c语言之指针数组

    2024-04-05 08:04:05       34 阅读
  2. pytest中文使用文档----12缓存:记录执行的状态

    2024-04-05 08:04:05       32 阅读
  3. xss相关知识点与绕过思路总结

    2024-04-05 08:04:05       40 阅读
  4. 【NC14661】简单的数据结构

    2024-04-05 08:04:05       37 阅读
  5. [xboard]real6410-5.2 移植kernel网络驱动

    2024-04-05 08:04:05       39 阅读
  6. 大数据组件官方源和国内源下载地址

    2024-04-05 08:04:05       27 阅读
  7. 深度学习与神经网络:从基础到前沿

    2024-04-05 08:04:05       34 阅读
  8. node.js常用命令

    2024-04-05 08:04:05       34 阅读
  9. Visual Studio(VS) 搭建 QT 开发环境

    2024-04-05 08:04:05       34 阅读
  10. 【C++】List的模拟实现

    2024-04-05 08:04:05       28 阅读
  11. SPI456456

    2024-04-05 08:04:05       38 阅读