python爬虫（8）之认识网页结构

2024-03-12 23:04:04
开发
43

就以咱们csdn网站的结构来看看这些网页的基础内容

1、查看网页源代码

1、F12，或者右上角三个点找到更多工具里面有一个开发人员工具

之后点击左上角

你就能看见一个网页的源代码

当然你现抄是没法完全实现的

然后我们就以csdn的门面进行对网页结构进行认识

我们主要认识一下<body>里面的内容

1、<div>标签

他是干啥的为啥咱们这里会有这么多<div>

<div>标签就是块标签，将网页中规划出一块区域进行显示内容

下面我将用一些代码来进行演示：

<!DOCTYPE html>

<html>

<head>

<meta charset="utf-8">

<title>过度引用</title>

<style>

div{

background-color:pink;

display: inline-block;

width: 100px;

height:100px;

}</style>

</head>

<body>

<div>

</div>

</body>

</html>

这里的div 的格式完全可以按照自己的喜好进行设置大小背景色等等以及是否独占一行等等都是可以做到的

结果如下：

2、<ul> 标签<ol>标签 <li>标签

定义列表的元素当然在csdn的门户是用ul嵌套li做的也就是最上面的一列

现在我们来试试看去使用requests模块去爬取一下csdn

import requests

resp = requests.get(url='https://www.csdn.net')

print(resp.text)

结果如下：

其实就是把源代码给拿过来了

关于动态数据的加载等下次再说。

原文地址:https://blog.csdn.net/m0_61885507/article/details/136661699 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1767567237725687808.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

python爬虫（8）之认识网页结构

2024-03-12 23:04:04 44 阅读
python网络爬虫之Urllib

2024-03-12 23:04:04 22 阅读
Python爬虫之爬取网页图片

2024-03-12 23:04:04 41 阅读
Python爬虫之异步爬虫

2024-03-12 23:04:04 34 阅读
Python爬虫之分布式爬虫

2024-03-12 23:04:04 36 阅读
探索Python爬虫：解析网页数据的神奇之旅

2024-03-12 23:04:04 34 阅读
Python爬虫速成之路（1）：获取网页源代码

2024-03-12 23:04:04 22 阅读
Python网络爬虫实战——实验8：Python爬虫项目部署与kafka消息队实战

2024-03-12 23:04:04 55 阅读
Python之爬虫基础

2024-03-12 23:04:04 22 阅读
网络爬虫之爬虫原理

2024-03-12 23:04:04 35 阅读

最近更新

题解 - 序列

2024-03-12 23:04:04 117 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-03-12 23:04:04 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-03-12 23:04:04 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-03-12 23:04:04 101 阅读
NoSQL之Redis非关系型数据库

2024-03-12 23:04:04 101 阅读
2024.7.22 作业

2024-03-12 23:04:04 98 阅读
GDB调试正在运行的程序

2024-03-12 23:04:04 82 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-03-12 23:04:04 85 阅读
在Django里面运行非项目文件

2024-03-12 23:04:04 82 阅读
SSD基本架构与工作原理

2024-03-12 23:04:04 87 阅读
在誉天学习完HCIE就业吗？

2024-03-12 23:04:04 94 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-03-12 23:04:04 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-03-12 23:04:04 86 阅读
go 协程池的实现

2024-03-12 23:04:04 89 阅读
Shell脚本循环语句与函数

2024-03-12 23:04:04 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-03-12 23:04:04 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-03-12 23:04:04 85 阅读
四大引用——强软弱虚

2024-03-12 23:04:04 87 阅读
Python语言-面向对象

2024-03-12 23:04:04 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-03-12 23:04:04 85 阅读
网站安全-CDN篇

2024-03-12 23:04:04 89 阅读