利用reddit的api进行爬虫

1 介绍

Reddit是一个社交新闻聚合网站,用户可以发布、评价和讨论各种话题。Reddit的内容涵盖了广泛的主题,可以从中获取大量的文本数据进行情绪分析。

2 注册

2.1 注册reddit

你需要先注册一个reddit的账号。

2.2 注册api

https://www.reddit.com/prefs/apps 在这个上面注册一个账号,开通一个api,开通完是这样的
在这里插入图片描述

3 代码

3.1 配置

在这个代码里面,你需要4个东西

  • client_id 用户的id,就是上面图片中的那一串
  • client_secret 密码,就是上图的密码
  • username 用户名,这个是reddit的用户名
  • password 密码,这个是reddit的密码
    在这里插入图片描述

3.2 爬取代码

主要是爬取body,这个里面存放的就是内容

需要你去设置要爬取的标题

subreddit_channel = 'politics'
for comment in reddit.subreddit(subreddit_channel).stream.comments():
    tmp_df = comment

可以咨询:https://docs.qq.com/doc/DWEtRempVZ1NSZHdQ

相关推荐

  1. pytorch利用保存模型进行预测

    2023-12-08 00:28:03       40 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2023-12-08 00:28:03       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2023-12-08 00:28:03       106 阅读
  3. 在Django里面运行非项目文件

    2023-12-08 00:28:03       87 阅读
  4. Python语言-面向对象

    2023-12-08 00:28:03       96 阅读

热门阅读

  1. 小程序如何刷新当前页面?

    2023-12-08 00:28:03       56 阅读
  2. python中的map函数

    2023-12-08 00:28:03       70 阅读
  3. Kubernetes学习笔记-Part.02 Docker版本

    2023-12-08 00:28:03       58 阅读
  4. rsync高效文件传输工具

    2023-12-08 00:28:03       55 阅读
  5. [MTK]安卓8 ADB执行ota升级

    2023-12-08 00:28:03       61 阅读
  6. elasticdump elasticsearch 数据迁移

    2023-12-08 00:28:03       59 阅读
  7. Spark低版本适配Celeborn

    2023-12-08 00:28:03       61 阅读