python爬虫实战(7)--获取it某家热榜

2024-01-11 08:18:03
开发
37

1. 需要的类库

import requests
from bs4 import BeautifulSoup
import pandas as pd

2. 请求榜单

def fetch_ranking_data():
    url = "https://m.ithome.com/rankm/"
    response = requests.get(url)

    if response.status_code == 200:
        return response.content
    else:
        print(f"Error fetching data. Status code: {response.status_code}")
        return None

3. 解析响应

def parse_html(html_content):
    soup = BeautifulSoup(html_content, 'html.parser')
    rank_items = soup.find_all('div', class_='placeholder one-img-plc')

    data = []
    for rank_item in rank_items:
        rank_num = rank_item.select_one('.rank-num').text
        title = rank_item.select_one('.plc-title').text
        url = rank_item.select_one('a')['href']

        data.append({
            'Rank': rank_num,
            'Title': title,
            'URL': url
        })

    return data

4.输出文件

def create_excel(data):
    df = pd.DataFrame(data)
    df.to_excel('ranking_data.xlsx', index=False)
    print("Excel file created successfully.")

5. 成果展示

在这里插入图片描述

原文地址:https://blog.csdn.net/qq_34252622/article/details/135504533 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1745238605347033088.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

python爬虫实战(7)--获取it某家热榜

2024-01-11 08:18:03 38 阅读
python爬虫实战(6)--获取某度热榜

2024-01-11 08:18:03 36 阅读
python爬虫实战(8)--获取虎pu热榜

2024-01-11 08:18:03 34 阅读
【经典爬虫案例】用Python爬取微博热搜榜！

2024-01-11 08:18:03 8 阅读
爬虫练习：获取某招聘网站Python岗位信息

2024-01-11 08:18:03 18 阅读
某web华yu榜music链接获取

2024-01-11 08:18:03 24 阅读
Python爬虫实战—探索某网站电影排名

2024-01-11 08:18:03 18 阅读
Python爬虫-新能源汽车销量榜

2024-01-11 08:18:03 40 阅读
【爬虫实战项目一】Python爬取豆瓣电影榜单数据

2024-01-11 08:18:03 10 阅读
js逆向之实例某宝热卖(MD5)&爬虫

2024-01-11 08:18:03 23 阅读

热门阅读

kettle的基本介绍和使用

2024-01-11 08:18:03 31 阅读
【MongoDB使用Int型TImestamp记录时间数据有更快的排序速度】

2024-01-11 08:18:03 32 阅读
【Kafka-3.x-教程】-【六】Kafka 外部系统集成【Flume、Flink、SpringBoot、Spark】

2024-01-11 08:18:03 26 阅读
Vue3中的`ref`和`reactive使用中遇到的一些坑

2024-01-11 08:18:03 34 阅读
Flink/Doris生产环境方案选型的一些思考

2024-01-11 08:18:03 32 阅读
PPT插件-大珩助手-清除同类

2024-01-11 08:18:03 36 阅读
24/1/10 qt work

2024-01-11 08:18:03 30 阅读
ReactHooks：渲染与useState

2024-01-11 08:18:03 38 阅读
zmq_connect和zmq_poll

2024-01-11 08:18:03 22 阅读
用matlab解决简单的数学问题

2024-01-11 08:18:03 30 阅读
jmeter监控服务器资源使用情况

2024-01-11 08:18:03 34 阅读
N卡可以点亮但是A卡无法点亮故障解决记录

2024-01-11 08:18:03 30 阅读
Pytorch从零开始实战16

2024-01-11 08:18:03 41 阅读
微服务自动化.跨主机集群

2024-01-11 08:18:03 32 阅读
12.1SPI驱动框架

2024-01-11 08:18:03 27 阅读
01-04css

2024-01-11 08:18:03 30 阅读
CSS响应式布局

2024-01-11 08:18:03 39 阅读
C/C++汇编学习（六）——数据结构汇编实例：链表、树、图。

2024-01-11 08:18:03 32 阅读
[Kubernetes]7. K8s包管理工具Helm、使用Helm部署mongodb集群(主从数据库集群)

2024-01-11 08:18:03 40 阅读
linux磁盘清理_docker/overlay2爆满

2024-01-11 08:18:03 46 阅读
k8s的存储卷---数据卷

2024-01-11 08:18:03 33 阅读
DevEco Studio for Mac：zsh: command not found: ohpm

2024-01-11 08:18:03 35 阅读
创建ROS模型与小机器人地图规划

2024-01-11 08:18:03 31 阅读
[足式机器人]Part3 机构运动学与动力学分析与建模 Ch00-3(1) 刚体的位形 Configuration of Rigid Body

2024-01-11 08:18:03 25 阅读
线程休眠、线程让步、线程优先级相关内容学习笔记

2024-01-11 08:18:03 21 阅读
pnp4nagios 配置 nagios

2024-01-11 08:18:03 32 阅读
【Linux】之搭建 PostgreSQL 环境

2024-01-11 08:18:03 40 阅读
k8s的陈述式资源管理

2024-01-11 08:18:03 31 阅读
经典目标检测YOLO系列(一)复现YOLOV1(5)模型的训练及验证

2024-01-11 08:18:03 40 阅读
C语言中顺序栈的实现与表示

2024-01-11 08:18:03 33 阅读