爬虫你需要知道的：什么是http请求

2024-01-11 06:08:06
开发
41

1. 什么是http请求

我们将通过发送http请求来获取网页内容。http是HyperText Transfer Protocol的缩写，意思是超文本传输协议，它是一种客户端和服务器之间的请求响应协议。

浏览器就可以看作是一个客户端，当我们在浏览器地址栏输入想访问的网址，按下回车后，浏览器就会像服务端发送一个http请求，然后等待服务器返回给浏览器响应。

http有多种不同的请求方法，最常见的是get和post。由于爬虫程序大部分都是在获取数据，所以我们发送的请求大部分情况下都用get方法。

2. 一个完整的http请求组成

一个http请求由三个部分组成：

在这里插入图片描述

请求行会包含方法类型、资源路径和协议版本等等

资源路径指明了我们将要访问服务器的哪个资源，资源路径后方也可以添加查询参数。
请求头会包含一些给服务器的信息，比如Host、User-Agent、Accept等等

Host 指主机域名，结合请求行里的路径资源，可以得到一个完整的网址。

User-Agent 用来告知服务器客户端的相关信息，比如请求是浏览器发出来的还是其他东西发出来的如果是浏览器的话，类型是什么、版本是什么等等。

Accept 是想告诉服务器客户端想接受的响应数据是什么类型的，接受多种类型的话，可以用逗号进行分隔，如果是*/*表示什么类型都可以。
请求体里面可以放客户端传给服务器的其他任意数据，但是get方法的请求体一般是空的。

当服务端收到客户端传来的请求后，它会根据所有这些信息返回http响应，响应也由三个部分组成：

在这里插入图片描述

状态行包含了协议版本、状态码、状态消息

其中状态消息常见的有以下这些：
响应头会包含一些想要告知客户端的信息

Date 是生成响应的日期和时间。

Content-Type 返回内容的类型及编码格式。例如text/html;charset=utf-8 指响应类型是HTML，编码是utf-8。
响应体里是服务端想要告知客户端的一些内容

比如如果前面的内容类型是HTML，这里返回的就是HTML内容。

文章整理自：这绝对是全B站最用心（没有之一）的Python+爬虫公开课程

原文地址:https://blog.csdn.net/weixin_45605541/article/details/135516197 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1745205899951214592.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

爬虫你需要知道的：什么是http请求

2024-01-11 06:08:06 42 阅读
API是什么？API的基础知识你知道多少

2024-01-11 06:08:06 41 阅读
什么是HTTPS加密协议？一篇文章带你走进HTTPS的世界

2024-01-11 06:08:06 42 阅读
你知道什么是SonarQube吗？

2024-01-11 06:08:06 18 阅读
你知道什么是pnpm吗？

2024-01-11 06:08:06 10 阅读
有关爬虫http/https的请求与响应

2024-01-11 06:08:06 41 阅读
http和https的区别是什么？

2024-01-11 06:08:06 21 阅读
http是什么？http的基础知识教程详解（2024-04-24）

2024-01-11 06:08:06 46 阅读
什么是HTTP? HTTP 和 HTTPS 的区别?

2024-01-11 06:08:06 14 阅读
“网络爬虫”是什么，他的原理是什么？

2024-01-11 06:08:06 33 阅读

最近更新

源码编译安装LAMP

2024-01-11 06:08:06 0 阅读
fluwx插件实现微信支付

2024-01-11 06:08:06 0 阅读
数据结构（初阶2.顺序表）

2024-01-11 06:08:06 0 阅读
综合安全防护

2024-01-11 06:08:06 0 阅读
使用webrtc-streamer查看rtsp实时视频

2024-01-11 06:08:06 1 阅读
Zabbix分布式监控

2024-01-11 06:08:06 1 阅读
Mybatis的学习

2024-01-11 06:08:06 1 阅读
安防视频监控/云存储/视频汇聚EasyCVR平台播放设备录像不稳定，是什么原因？

2024-01-11 06:08:06 1 阅读
网格化监控：Eureka与分布式服务网格的协同监控

2024-01-11 06:08:06 1 阅读
C#Modbus通信

2024-01-11 06:08:06 1 阅读
Tomcat异步请求实现原理和应用场景简介

2024-01-11 06:08:06 1 阅读
吴恩达机器学习笔记2.1 - 什么是机器学习

2024-01-11 06:08:06 1 阅读
藏汉翻译通作为翻译软件的优势有哪些？

2024-01-11 06:08:06 1 阅读
[Python学习篇] Python面向对象——类

2024-01-11 06:08:06 1 阅读
activemq-CVE-2022-41678

2024-01-11 06:08:06 1 阅读
每日一道算法题 LCR 150. 彩灯装饰记录 II

2024-01-11 06:08:06 1 阅读
13 - matlab m_map地学绘图工具基础函数 - 介绍创建管理颜色映射的函数m_colmap和轮廓图绘制颜色条的函数m_contfbar

2024-01-11 06:08:06 1 阅读
Ubuntu 添加so库搜索路径

2024-01-11 06:08:06 1 阅读
寂静孤独的404页面源码

2024-01-11 06:08:06 1 阅读
arp缓存中毒实验

2024-01-11 06:08:06 1 阅读
C++基础语法

2024-01-11 06:08:06 1 阅读