Python爬虫之路（2）：爬天气情况

2024-07-14 00:50:03
开发
18

hello hello~ ，这里是绝命Coding——老白~💖💖 ，欢迎大家点赞🥳🥳关注💥💥收藏🌹🌹🌹

💥个人主页：绝命Coding-CSDN博客
💥 所属专栏：后端技术分享
这里将会不定期更新有关后端、前端的内容，希望大家多多点赞关注收藏💖

历史文章：

Python爬虫速成之路（1）：获取网页源代码-CSDN博客

使用requests.get()方法发送HTTP请求，并通过content属性获取网页的源代码

正则表达式(.*?)：它可以匹配任意长度的字符串，比如abcde，正则表达式a(.*?)e，它就会匹配上bcd。（基本后续的爬虫这一个正则表达式就已经够用了，万能）

import urllib.request as http
import re

#【天气预报】天气预报7天,10天,15天_全国天气网
url = 'http://tianqi.so.com/weather/101281901'
#获取网页源代码
content = http.urlopen(url).read().decode("utf-8")
#.*? 后面多个问号，代表非贪婪模式，也就是说只匹配符合条件的最少字符
pattern = re.findall(r'<div class="temperature">(.*?)</div>',content)
#<div class="temperature">13</div>
print('今天的温度是：{}°'.format(pattern[0]))

优化：

import requests  
import re  
content = requests.get("http://tianqi.so.com/weather/101281901").content.decode()  #获取网页源代码
pattern = re.findall(r'<div class="temperature">(.*?)</div>',content)  
print("今天的温度是:{}°".format(pattern[0]))

这里re.findall里面要求传入的是str类型
从str到bytes:调用方法encode().
从bytes到str:调用方法decode()

更多精彩内容请关注：绝命Coding

原文地址:https://blog.csdn.net/qq_33445788/article/details/140368316 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1812167618732363776.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

Python爬虫之路（2）：爬天气情况

相关推荐

最近更新

热门阅读