Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

站长资源 2026/7/9 佚名

67 1538 67

DDR爱好者之家 Design By 杰米

下载代码Cookie池（这里主要是微博登录，也可以自己配置置其他的站点网址）

下载代码GitHub：https://github.com/Python3WebSpider/CookiesPool

下载安装过后注意看网页下面的相关基础配置和操作！！！！！！！！！！！！！

自己的设置主要有下面几步：

1、配置其他设置

2、设置使用的浏览器

3、设置模拟登陆

源码cookies.py的修改（以下两处不修改可能会产生bug）：

4、获取cookie

随机获取Cookies： http://localhost:5000/weibo/random（注意：cookie使用时是需要后期处理的！！）

简单的处理方式，如下代码（偶尔需要对获取的cookie处理）：

def get_cookie(self):
    return requests.get('http://127.0.0.1:5000/weibo/random').text
 
  def stringToDict(self,cookie):
    itemDict = {}
    items = cookie.replace(':', '=').split(',')
    for item in items:
      key = item.split('=')[0].replace(' ', '').strip(' "')
      value = item.split('=')[1].strip(' "')
      itemDict[key] = value
    return itemDict

scrapy爬虫的使用示例（爬取微博）：

middlewares.py中自定义请求中间件

def start_requests(self):
    ua = UserAgent()
    headers = {
      'User-Agent': ua.random,
      }
    cookies = self.stringToDict(str(self.get_cookie().strip('{|}')))
 
    yield scrapy.Request(url=self.start_urls[0], headers=headers,
               cookies=cookies, callback=self.parse)
cookies = self.stringToDict(str(self.get_cookie().strip('{|}')))

    yield scrapy.Request(url=self.start_urls[0], headers=headers,
               cookies=cookies, callback=self.parse)

settings.py 中的配置：

5、录入账号和密码：

格式规定（账号----密码）

6、验证：（注意：使用cmd）

7、使用时注意保持cmd打开运行！！

使用时一定要打开cmd,并运行如第6步。

得到Cookie是判断是否处理处理Cookie（几乎都需要！！）类比第4步！！！

scrapy,Cookie池,scrapy,Cookie

DDR爱好者之家 Design By 杰米

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

DDR爱好者之家 Design By 杰米

评论“Python爬虫scrapy框架Cookie池(微博Cookie池)的使用”

暂无评论...

P70系列延期，华为新旗舰将在下月发布

3月20日消息，近期博主@数码闲聊站透露，原定三月份发布的华为新旗舰P70系列延期发布，预计4月份上市。

而博主@定焦数码爆料，华为的P70系列在定位上已经超过了Mate60，成为了重要的旗舰系列之一。它肩负着重返影像领域顶尖的使命。那么这次P70会带来哪些令人惊艳的创新呢？
根据目前爆料的消息来看，华为P70系列将推出三个版本，其中P70和P70 Pro采用了三角形的摄像头模组设计，而P70 Art则采用了与上一代P60 Art相似的不规则形状设计。这样的外观是否好看见仁见智，但辨识度绝对拉满。

更新日志

2026年07月09日

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

自己的设置主要有下面几步：

selenium如何定位span元素的实现

python 进制转换 int、bin、oct、hex的原理

评论“Python爬虫scrapy框架Cookie池(微博Cookie池)的使用”

P70系列延期，华为新旗舰将在下月发布

更新日志

友情链接