【运行Python爬虫脚本示例】

主要内容:Python中的两个库的使用。
1、requests库:访问和获取网页内容,
2、beautifulsoup4库:解析网页内容。

一 python 爬取数据

1 使用requests库发送GET请求,并使用text属性获取网页内容。

然后可以对获取的网页内容进行解析和处理

import requests

url = "https://www.baidu.com"

# 发送GET请求
response = requests.get(url)

# 获取网页内容
html_content = response.text

# 打印网页内容
print(html_content)

这段代码是一个简单的Python脚本,用于向https://www.baidu.com发送一个HTTP GET请求,并打印返回的HTML内容。这里使用了requests库,它是一个流行的用于发送HTTP请求的Python库。

以下是代码的逐行解释:


import requests: #导入requests库。

url = "https://www.baidu.com": #定义一个字符串变量url,其值为百度主页的URL。

response = requests.get(url): 
#使用requests.get()方法向指定的URL发送一个GET请求,并将响应对象存储在response变量中。

html_content = response.text: #从响应对象中提取HTML内容,并将其存储在html_content变量中。

print(html_content): #打印提取的HTML内容。

注意:在运行此代码之前,请确保你已经安装了requests库,否则会出现下面错误:import requests ModuleNotFoundError: No module named ‘requests’

2 使用beautifulsoup4库解析网页内容

可以使用Python中的requests库来访问和获取网页内容,同时还需要使用beautifulsoup4库来解析网页内容。

import requests
from bs4 import BeautifulSoup

url = "https://www.baidu.com"

# 发送GET请求
response = requests.get(url)

# 将响应的内容转换成BeautifulSoup对象
soup = BeautifulSoup(response.content, 'html.parser')

# 打印网页标题
print("网页标题:", soup.title.string)

运行以上代码,即可获取百度网页的标题。你可以根据需要进一步解析和提取网页内容。

注意:在运行此代码之前,请确保你已经安装了BeautifulSoup库,方法和安装requests库相同。

2 no module named requests 处理方式

如图一所示,流程为:右上角设置标志,点开setting,出现setting界面,在这里插入图片描述
图一

点开setting界面中,如图二,找到自己建立的工程名称,点开python interpreter ,然后点击图上的“+”号:在搜索框搜索requests,点击下面的install package,安装成功即可。
在这里插入图片描述
图二

相关推荐

  1. Python实现的网页爬虫示例

    2024-01-28 22:42:07       13 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-01-28 22:42:07       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-28 22:42:07       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-28 22:42:07       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-28 22:42:07       20 阅读

热门阅读

  1. C语言2024-1-27练习记录

    2024-01-28 22:42:07       28 阅读
  2. Windows OpenVPN的安装之桥接模式

    2024-01-28 22:42:07       27 阅读
  3. 【C语言】分支循环语句

    2024-01-28 22:42:07       33 阅读
  4. C语言sizeof和strlen区别

    2024-01-28 22:42:07       46 阅读
  5. uniapp微信小程序-前端设计模式学习(中)

    2024-01-28 22:42:07       31 阅读
  6. 南门的树(数组)★★★ c++版本 10分

    2024-01-28 22:42:07       38 阅读