初级使用Scrapy

2024-04-12 18:24:02
开发
14

创建Scrapy项目：测试项目为lufei小说

创建爬虫模版：要先切换到刚刚创建的lufei路径下面，名称为lufeishuo，域名为b.faloo.com

模版创建好之后修改stat_url为自己要爬取的url

import scrapy


class LufeishuoSpider(scrapy.Spider):
    name = "lufeishuo"
    allowed_domains = ["b.faloo.com"]
    start_urls = ["https://b.faloo.com/html_1404_1404547/"]

    def parse(self, response):
        print(response.text)

然后修改设置settings.py，改成不接受协议False

解开注释并添加自己的User_Agent伪装一下

在scrapy.cfg的同级目录下面创建start.py文件

在start文件中写入启动程序

右键运行至此结束

原文地址:https://blog.csdn.net/qq_52624850/article/details/137650615 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1778730788200779776.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

初级使用Scrapy

2024-04-12 18:24:02 15 阅读
scrapy的入门使用

2024-04-12 18:24:02 35 阅读
使用 scrapyd 部署 scrapy

2024-04-12 18:24:02 13 阅读
Python 使用scrapy框架

2024-04-12 18:24:02 13 阅读
爬虫scrapy管道的使用

2024-04-12 18:24:02 36 阅读
scrapy的基本使用介绍

2024-04-12 18:24:02 17 阅读
StrApi基本使用

2024-04-12 18:24:02 9 阅读
Scrapy

2024-04-12 18:24:02 12 阅读
架构学习(二)：原生scrapy如何接入scrapy-redis，初步入局分布式

2024-04-12 18:24:02 30 阅读
爬虫scrapy中间件的使用

2024-04-12 18:24:02 27 阅读

热门阅读

vue中watch监听路由传来的参数变化问题

2024-04-12 18:24:02 13 阅读
CHINC 2024 | 人大金仓携云一体机亮相，擘画数字化转型新蓝图

2024-04-12 18:24:02 16 阅读
Windows下如何确定虚函数在虚函数表中的位置

2024-04-12 18:24:02 17 阅读
签到二维码如何限定访问区域？二维码加入区域限制的方法

2024-04-12 18:24:02 13 阅读
微服务学习2

2024-04-12 18:24:02 15 阅读
MYSQL执行流程

2024-04-12 18:24:02 18 阅读
嵌入式中常用的巧妙方法 - （汇总）

2024-04-12 18:24:02 15 阅读
Kivy 学习2

2024-04-12 18:24:02 15 阅读
el-drawer二次封装进行可拖拽

2024-04-12 18:24:02 17 阅读
Proteus 8 的使用记录

2024-04-12 18:24:02 15 阅读
AttributeError: ‘Text‘ object has no property ‘FontSize‘

2024-04-12 18:24:02 13 阅读
【docker】之linux写shell脚本备份线上数据库（备份为dump文件）

2024-04-12 18:24:02 14 阅读
Fiddler：网络调试利器

2024-04-12 18:24:02 14 阅读
Redis 的常见使用场景

2024-04-12 18:24:02 16 阅读
从零学算法274

2024-04-12 18:24:02 15 阅读
处理SAP 采购订单创建报错：会计科目XXXXXX不能使用(

2024-04-12 18:24:02 21 阅读
什么是粘包？造成粘包的原因，解决它的方法

2024-04-12 18:24:02 17 阅读
【python处理数据的函数】---误区2

2024-04-12 18:24:02 17 阅读
LeetCode 每日一题 ---- 【2923. 找到冠军 I】

2024-04-12 18:24:02 19 阅读
linux总结

2024-04-12 18:24:02 19 阅读
《C语言深度解剖》(3)：探索函数递归、传值、传址调用的奥秘

2024-04-12 18:24:02 24 阅读
在linux上如何执行带有目录的命令

2024-04-12 18:24:02 22 阅读
steam流太难用了看看JDFrame

2024-04-12 18:24:02 31 阅读
mysql知识点

2024-04-12 18:24:02 21 阅读
整理的微信小程序日历（单选/多选/筛选）

2024-04-12 18:24:02 15 阅读
光耦合器的使用：了解输入和输出之间的关系

2024-04-12 18:24:02 18 阅读
抓住三大关键企业数字化发展安全建设的决胜策略

2024-04-12 18:24:02 58 阅读
可视化后台管理系统-空框架

2024-04-12 18:24:02 19 阅读
2024MarthorCUP妈妈杯——思路附代码B题

2024-04-12 18:24:02 17 阅读
2023-2024爱分析·信创厂商全景报告｜爱分析报告

2024-04-12 18:24:02 20 阅读