Python爬虫之路(2):爬天气情况

 hello hello~ ,这里是绝命Coding——老白~💖💖 ,欢迎大家点赞🥳🥳关注💥💥收藏🌹🌹🌹
19d95742d45b4220ad0ae0359ffcba93.png

💥个人主页绝命Coding-CSDN博客
💥 所属专栏后端技术分享
这里将会不定期更新有关后端、前端的内容,希望大家多多点赞关注收藏💖

 历史文章:

Python爬虫速成之路(1):获取网页源代码-CSDN博客

使用requests.get()方法发送HTTP请求,并通过content属性获取网页的源代码

正则表达式(.*?):它可以匹配任意长度的字符串,比如abcde,正则表达式a(.*?)e,它就会匹配上bcd。(基本后续的爬虫这一个正则表达式就已经够用了,万能)

import urllib.request as http
import re

#【天气预报】天气预报7天,10天,15天_全国天气网
url = 'http://tianqi.so.com/weather/101281901'
#获取网页源代码
content = http.urlopen(url).read().decode("utf-8")
#.*? 后面多个问号,代表非贪婪模式,也就是说只匹配符合条件的最少字符
pattern = re.findall(r'<div class="temperature">(.*?)</div>',content)
#<div class="temperature">13</div>
print('今天的温度是:{}°'.format(pattern[0]))

优化:

import requests  
import re  
content = requests.get("http://tianqi.so.com/weather/101281901").content.decode()  #获取网页源代码
pattern = re.findall(r'<div class="temperature">(.*?)</div>',content)  
print("今天的温度是:{}°".format(pattern[0]))

这里re.findall里面要求传入的是str类型
从str到bytes:调用方法encode().
从bytes到str:调用方法decode()

 更多精彩内容请关注:绝命Coding

相关推荐

  1. Python学习-爬虫提高:selenium

    2024-07-14 00:50:03       52 阅读
  2. Python爬虫实战演练去VIP电影

    2024-07-14 00:50:03       53 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-14 00:50:03       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-14 00:50:03       72 阅读
  3. 在Django里面运行非项目文件

    2024-07-14 00:50:03       58 阅读
  4. Python语言-面向对象

    2024-07-14 00:50:03       69 阅读

热门阅读

  1. 【DDD】领域驱动设计概念深入探索

    2024-07-14 00:50:03       23 阅读
  2. MATLAB——运算符

    2024-07-14 00:50:03       20 阅读
  3. 2024.7.31 Spyglass lint tcl 使用总结

    2024-07-14 00:50:03       22 阅读
  4. Python解包语法

    2024-07-14 00:50:03       21 阅读
  5. Linux概述

    2024-07-14 00:50:03       20 阅读
  6. ArcGIS Pro SDK (九)几何 2 坐标

    2024-07-14 00:50:03       21 阅读
  7. ls命令学习记录2

    2024-07-14 00:50:03       21 阅读
  8. 无人机在应急救援中的几种应急方案

    2024-07-14 00:50:03       19 阅读