Python爬虫实战(基础篇)—14获取【巴黎圣母院新闻网(Notre Dame News)】新闻写入Word(附完整代码)


请添加图片描述

专栏导读

🔥🔥本文已收录于《Python基础篇爬虫》

🉑🉑本专栏专门针对于有爬虫基础准备的一套基础教学,轻松掌握Python爬虫,欢迎各位同学订阅,专栏订阅地址:点我直达

🤞🤞此外如果您已工作,如需利用Python解决办公中常见的问题,欢迎订阅《Python办公自动化》专栏,订阅地址:点我直达

🔺🔺此外《Python30天从入门到熟练》专栏已上线,欢迎大家订阅,订阅地址:点我直达

背景

  • 我是一个非常喜欢新闻的网友,特别喜欢的新闻网站是【巴黎圣母院新闻网】,我想获取每日的最新新闻,然后再写入Word中,方便我查看

  • 在这里插入图片描述

1、网页分析+找到【Latest News】的URL

  • ①、首先我们发现请求响应的返回在【Response】中;

  • ②、我们发现网页中有【a】标签,存放着文章url链接

  • ③、所以我们决定此次爬虫应该是用 lxml+xpath比较合适,说干就干!

  • ④、请求方法是【GET】

  • ⑤、请求参数是:无

在这里插入图片描述

2、测试请求

我们发现测试请求成功!

在这里插入图片描述

测试代码如下

# -*- coding: UTF-8 -*-
'''
@Project :巴黎圣母院新闻网(Notre Dame News)
@File    :main_.py
@IDE     :PyCharm
@Author  :一晌小贪欢(278865463@qq.com)
@Date    :2024/3/12 10:12
'''
import json

import requests

url = 'https://news.nd.edu/'

headers = {
   
    'User-Agent'

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-13 18:08:05       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-13 18:08:05       100 阅读
  3. 在Django里面运行非项目文件

    2024-03-13 18:08:05       82 阅读
  4. Python语言-面向对象

    2024-03-13 18:08:05       91 阅读

热门阅读

  1. yield代码解释

    2024-03-13 18:08:05       41 阅读
  2. 蓝桥杯 图形排版

    2024-03-13 18:08:05       45 阅读
  3. git pull拉下来的信息解读

    2024-03-13 18:08:05       43 阅读
  4. Leetcode 20. 有效的括号

    2024-03-13 18:08:05       38 阅读
  5. 一篇文章讲清楚HashMap

    2024-03-13 18:08:05       41 阅读
  6. 【数据结构学习笔记】选择排序

    2024-03-13 18:08:05       32 阅读
  7. Leetcode刷题笔记——贪心篇

    2024-03-13 18:08:05       34 阅读
  8. 完整的模型训练套路及GPU的利用

    2024-03-13 18:08:05       43 阅读
  9. 听力 3.12

    2024-03-13 18:08:05       37 阅读