python爬虫scrapy基本使用超详细教程

站长资源 2026/4/17 佚名

27 1538 27

DDR爱好者之家 Design By 杰米

一、介绍

官方文档：中文2.3版本

下面这张图大家应该很熟悉，很多有关scrapy框架的介绍中都会出现这张图，感兴趣的再去查询相关资料，当然学会使用scrapy才是最主要的。

二、基本使用

2.1 环境安装

1.linux和mac操作系统：

pip install scrapy

2.windows系统：

先安装wheel：pip install wheel
下载twisted：下载地址

安装twisted：

pip install Twisted"text-align: center">
2.2 scrapy使用流程
这里默认大家已经安装好scrapy库，大家要记得要在命令行里输入以下命令啊。(我使用的anaconda的命令行)
创建工程


scrapy startproject projectName





进入工程目录：这里一定要进入到刚才创建好的目录中




cd projectName



创建爬虫文件：创建的爬虫文件会出现在之前创建好的spiders文件夹下


scrapy genspider spiderName www.xxx.com



编写相关代码
执行爬虫文件




scrapy crawl spiderName



2.3 文件解析


import scrapy

class HelloSpider(scrapy.Spider):
 name = 'hello' # 爬虫名称

 # 允许的域名:限定start_urls列表当中哪些url可以进行请求的发送
 # 通常情况下我们不会使用
 # allowed_domains = ['www.baidu.com'] 

 # 起始的url列表:scrapy会自动对start_urls列表中的每一个url发起请求
 # 我们可以手动添加我们需要访问的url
 start_urls = ['https://www.baidu.com/','https://www.csdn.net/']

 def parse(self, response): # 当scrapy自动向start_urls中的每一个url发起请求后，会将响应对象保存在response对象中
 # 代码一般是在parse方法中写
 print("response:",response)



2.4 settings.py一些常见的设置
相当于requests中的headers参数中的User-Agent


USER_AGENT = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36 Edg/88.0.705.68'


可以忽略或者不遵守robots协议


ROBOTSTXT_OBEY = False 


只有程序出现错误的情况下，才显示日志文件，程序正常执行时只会输出我们想要的结果


LOG_LEVEL='ERROR' == scrapy crawl spiderName --nolog
//二者是等价的，当然还是推荐使用前者


未加LOG_LEVEL='ERROR'

加LOG_LEVEL='ERROR'之后

scrapy 爬取文件保存为CSV文件中文乱码的解决办法


//下面的设置可能会导致繁体出现,可以逐个试一下
FEED_EXPORT_ENCODING = "gb18030"
FEED_EXPORT_ENCODING = "utf-8"
FEED_EXPORT_ENCODING = "gbk"



三、实例
3.1 实例要求
目的：爬取百度网页的百度热榜
 
3.2 实例代码
实例代码
 
3.3 输出结果
结果


                                
                                    python爬虫scrapy使用,python爬虫scrapy框架 
                                DDR爱好者之家 Design By 杰米


                        
                            
                                广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）

                                免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！
                            
                        
                        
                            
                                
                                    上一篇
                                    安装不同版本的tensorflow与models方法实现
                                
                            
                            
                                
                                    下一篇
                                    解决pip安装tensorflow中出现的no module named tensorflow.python 问题方法
                                
                            
                        
                        
                        DDR爱好者之家 Design By 杰米
                        
                            
                                
                                
                                    评论“python爬虫scrapy基本使用超详细教程”
                                
                            
                            
                                
                                    
                                        
                                            
                                                
                                                    
                                                
                                                
                                                    
                                                
                                                
                                                    
                                                    
                                                    
                                                
                                                
                                                     再想想
                                                    
                                                    
                                                    
                                                    
                                                    
                                                
                                            
                                            
                                        
                                    
                                    
                                    
                                        暂无评论...


                    
                        
                            
                                
                                    
                                        
                                    
                                    
                                        
                                            
                                        
                                    
                                
                                
                                    ddrfans.com
                                            
                                                DDR爱好者之家 
                                    
                                    
                                        
                                            
                                        
                                        
                                            
                                        
                                        
                                            
                                        
                                        
                                            
                                        
                                    
                                    
                                    
                                        
                                            8,675无损音乐
                                        
                                        
                                            1,324高清电影
                                        
                                        
                                            213破解软件
                                        
                                        
                                            70,141收录资讯
                                        
                                    
                                
                            
                            
                                最新文章
                                
                                    
                                         
                                       
                                            
                                                
                                            
                                            
                                                
                                                    群星《奔赴！万人现场 第2期》[FLAC/分轨][5
                                                
                                                
                                                    
                                                        2026/4/17
                                                        
                                                         43
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    群星《奇妙浪一夏 (上海迪士尼度假区音乐)》
                                                
                                                
                                                    
                                                        2026/4/17
                                                        
                                                         32
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    群星《奇妙浪一夏 (上海迪士尼度假区音乐)》
                                                
                                                
                                                    
                                                        2026/4/17
                                                        
                                                         61
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    【古典音乐】詹姆斯·高威《季节》1993[WAV+
                                                
                                                
                                                    
                                                        2026/4/17
                                                        
                                                         24
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    贝拉芳蒂《卡里普索之王》SACD[WAV+CUE]
                                                
                                                
                                                    
                                                        2026/4/17
                                                        
                                                         74
                                                    
                                                
                                            
                                        


                                    
                                
                            
                            
                                站点导航
                                
                                    
                                        抖音极速版
                                        河马剧场
                                        京东
                                        小红书
                                        微信
                                        高德地图
                                        红果短剧
                                        夸克
                                        美团
                                        剪映
                                        拼多多
                                        支付宝
                                        淘宝
                                        快手
                                        QQ
                                        哔哩哔哩
                                        番茄小说
                                        得物
                                        阿里巴巴
                                        王者荣耀
                                        和平精英
                                        腾讯视频
                                        爱奇艺
                                        QQ音乐
                                        咸鱼之王
                                        逆水寒
                                        三国志战略版
                                        梦幻西游
                                        金铲铲之战
                                        捕鱼大作战
                                        原神
                                        英雄联盟手游
                                        网易云音乐
                                        崩坏星穹铁道
                                        优酷视屏
                                        酷狗音乐
                                        蛋仔派对

python爬虫scrapy基本使用超详细教程

一、介绍

二、基本使用

2.1 环境安装

2.2 scrapy使用流程

2.3 文件解析

2.4 settings.py一些常见的设置

三、实例

3.1 实例要求

3.2 实例代码

3.3 输出结果

安装不同版本的tensorflow与models方法实现

解决pip安装tensorflow中出现的no module named tensorflow.python 问题方法

评论“python爬虫scrapy基本使用超详细教程”

更新日志

友情链接