Python爬虫实战(基础篇)—14获取【巴黎圣母院新闻网(Notre Dame News)】新闻写入Word(附完整代码)
- 开发
- 40
-
专栏导读
🔥🔥本文已收录于《Python基础篇爬虫》
🉑🉑本专栏专门针对于有爬虫基础
准备的一套基础教学,轻松掌握Python爬虫,欢迎各位同学订阅,专栏订阅地址:点我直达
🤞🤞此外如果您已工作,如需利用Python解决办公中常见的问题,欢迎订阅《Python办公自动化》专栏
,订阅地址:点我直达
的
🔺🔺此外《Python30天从入门到熟练》专栏已上线,欢迎大家订阅,订阅地址:点我直达
背景
我是一个非常喜欢新闻的网友,特别喜欢的新闻网站是【巴黎圣母院新闻网】,我想获取每日的最新新闻,然后再写入Word中,方便我查看
1、网页分析+找到【Latest News】的URL
①、首先我们发现请求响应的返回在【Response】中;
②、我们发现网页中有【a】标签,存放着文章url链接
③、所以我们决定此次爬虫应该是用 lxml+xpath比较合适,说干就干!
④、请求方法是【GET】
⑤、请求参数是:无
2、测试请求
我们发现测试请求成功!
测试代码如下
'''
@Project :巴黎圣母院新闻网(Notre Dame News)
@File :main_.py
@IDE :PyCharm
@Author :一晌小贪欢(278865463@qq.com)
@Date :2024/3/12 10:12
'''
import json
import requests
url = 'https://news.nd.edu/'
headers = {
'User-Agent'
原文地址:https://blog.csdn.net/weixin_42636075/article/details/136643021
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。
本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:https://www.suanlizi.com/kf/1767855139684749312.html
如若内容造成侵权/违法违规/事实不符,请联系《酸梨子》网邮箱:1419361763@qq.com进行投诉反馈,一经查实,立即删除!