python爬虫——抓取表格pandas当爬虫用超简单

pandas还能当爬虫用,你敢信吗?而且超级简单,两行代码就趴下来

只要想提取的表格是属于<table 标签内,就可以使用pd.read_html(),它可以将网页上的表格都抓取下来,并以DataFrame的形式装在一个列表中返回。

例子:
比如这个基金网站,想趴下基金的持仓股表格,
http://vip.stock.finance.sina.com.cn/q/go.php/vComStockHold/kind/jjzc/index.phtml
在这里插入图片描述

首先F12,页面元素点击表格内容,发现最上面的层级是<table,那么就可以用pandas直接抓!

在这里插入图片描述
代码如下:

import pandas as pd
df = pd.DataFrame()
for i in range(6):
    url = 'http://vip.stock.finance.sina.com.cn/q/go.php/vComStockHold/kind/jjzc/index.phtml?p={page}'.format(page=i+1)
    df = pd.concat([df,pd.read_html(url)[0]])
    print("第{page}页完成~".format(page=i+1))
df.to_csv('D:\\data.csv', encoding=gbk, index=0) #保存地址

就看到保存的CSV文件了
在这里插入图片描述
搞定。。!是不是超级简单,记得点个赞哦!

相关推荐

  1. 利用python抓取小说,爬虫抓取小说

    2024-01-23 15:26:03       12 阅读
  2. Python基础12-爬虫抓取网页内容

    2024-01-23 15:26:03       17 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-01-23 15:26:03       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-23 15:26:03       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-23 15:26:03       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-23 15:26:03       20 阅读

热门阅读

  1. 【AI】深度学习在编码中的应用(10)

    2024-01-23 15:26:03       30 阅读
  2. 美易makeasy平台:小米汽车雄心勃勃

    2024-01-23 15:26:03       37 阅读
  3. C#控制台应用把视频转为图片

    2024-01-23 15:26:03       32 阅读
  4. 笨蛋学设计模式行为型模式-责任链模式【18】

    2024-01-23 15:26:03       31 阅读
  5. 笨蛋学设计模式行为型模式-解释器模式【23】

    2024-01-23 15:26:03       30 阅读
  6. 5.docker实战

    2024-01-23 15:26:03       35 阅读
  7. k8s-helm

    k8s-helm

    2024-01-23 15:26:03      28 阅读
  8. vue请求拦截统一给所有请求加loading

    2024-01-23 15:26:03       32 阅读