网站首页 > 后端 > 正文

爬虫时报错 yield self.engine.open

编程自学免费教程后端 2024-04-03 15 1

报错信息中有个ip,在本地ping一下发现能ping通，所以不是网络问题。

错误信息再仔细看一下，定位错误原因。这个错误是由于无法连接到AMQP（高级消息队列协议）服务器引起的。AMQPConnectionError表示无法与AMQP服务器建立连接。一般报错多在配置文件的，解决起来很复杂，优先考虑代码是否有问题。

一开始我以为是pika版本问题，所以从1.3系列降到1.1系列，但还是一样的报错。

现在开始排查代码。首先，检查到在url中添加域名时http写成了https,以后在书写时要注意爬取网站的url是否准确。

然后，telnet 报错信息提到的端口，试过之后端口打不开，可能是官网有限制，所以我在pipelines.py文件里注释掉报错信息提到的connection属性的相关代码。此报错解决了，但是爬虫依旧不能运行。于是继续排查。

然后发现，代码在用到selenium的wait_time时class必须填写页面存在的，所以返回要爬取的页面检查，换了已存在的class。（页面上选一个要采集的数据所在的div的class就可以了）

爬虫可以正常运行了，接下来就是完善和修改具体的需求。

文章来源

评论可见，请评论后查看内容，谢谢！！！

您阅读本篇文章共花了：

大家都在找：

爬虫：爬虫教程

大家都在看：

Linux安装Mysql报错:libtinfo.so.5: cannot open shared object file

我在Linux上安装Mysql 8.0，准备启动的时候遇到了如标题所示的错误：大致意思是系统找不到 libtinfo.so.5，也就是缺少这个依赖而无法启动。 ...

scrapy爬虫框架报错解决记录20230825

在安装了scrapy之后,cmd或者powershell窗口输入 : scrapy startproject 项目名它!报错了,它长这样！好的我去上图所示网站下载了那个文件，文件名是service...

运维 jenkins 报错The engine "node" is incompatible with this module. Expected version ">=18". Got "16.15.1"...

错误是由于node版本不兼容导致的，解决方案就是忽略引擎版本的检查解决方案在前端编译的时候忽略引擎版本检测添加如下

前端 node.js 报错解决：npm ERR! code EPERM npm ERR! syscall open npm ERR! path D:\Program Files\nodejs\node

目录一、报错问题二、错误原因三、解决方法一、报错问题二、错误原因错误原因就是自己当初安装nodejs时，上面这三个文件的权限不够导致的，既然权限不够，那我们就给他权限就好喽！三、解决方法三个文件一个一...

解决docker运行redis报错：Fatal error, can‘t open config file /etc/redis/redis.conf以及启动redis后自动退出容器

现象如下：看了报错是权限问题，然后发现redis1.conf的权限果然不大对，所以运行 chmod o+r 添加权限但是启动后容器自动退出：然后把redis-server改成绝对路径/usr...

自动化测试网络爬虫爬虫代理数据采集 Selenium使用中报错：We

Selenium使用中报错：We’re sorry but hr-frontend-v2 doesn’t work properly without JavaScript enabled. Pleas...

前端 node.js npm报错：Invalid response body while trying to fetch https://xxx/:EPERM: operation not permitted, open

解决npm 报错! FetchError: Invalid response body while trying to fetch https://registry.npmmirror.com/: E...

运维容器 Docker安装Nginx，启动报错:open() “/etc/nginx/mime.types“ failed，问题分析及解决

博客地址完整报错信息：nginx: [emerg] open() “/etc/nginx/mime.types” failed (2: No such file or directory) in ...

https 爬虫的requests报错ssl.SSLError: [SSL: WRONG

捣鼓了一天几乎把网上能查到的方法试遍了...总结一下1.不伪装浏览器（即不设置headers时）代码如下此时修改url中https为http就可解决。2.使用headers参数时代码如下此时，上一步...

eureka 容器 golang 开发语言后端 ubuntu Docker启动失败报错Failed to start Docker Application Container Engine解决方案

Docker启动失败，报错"Failed to start Docker Application Container Engine"，这个问题可能由多种原因引起。下面我会列出一些可能的原因和相应的解决...

【Git】git | git重装，历史项目报错 | Could not open repository.libgit2 returned: repository path

一、概述 1、系统重装 2、git重装 3、项目在其他盘，重新拉取报错 4、报错内容二、解决 1、项目所在目录，右键 2、执行命令 ...

linux 运维安装pytest插件时报错:ERROR: Could not open requirements file: [Errno 2] No such file or directory: ‘require

安装pytest插件时报错其实是个路径设置的问题。就是你的文本其实是存在的，但是你所设置的路径不对导致了系统找不到requriements.txt文件。所以，只需要更改自己的路径设置为要查询文件的上级...

微信小程序小程序 HBuilderX 运行微信开发者工具 “Fail to open IDE“报错解决

这个问题遇见过几次了，老是忘记，所以记录一下在uniapp写的项目在hbuiderx中，以微信开发者工具打开结果报错HBuilderX 运行微信开发者工具 “Fail to open IDE“报错...

android studio 报错提示 va.io.FileNotFoundException: /storage/emulated/0/xxx/xxx/加密: open failed: EACCES (Permission denied)

android studio 编译的报错提示：java.io.FileNotFoundException: /storage/emulated/0/xxx/xxx/加密: open failed: E...

pycharm Anaconda Add Python Interpreter 报错 Error code:2. XX can‘t open file XX [Errno 2] No such file or directory

刚下载Anaconda3，用conda create -n spytorch python=3.9命令创建了一个名为spytorch的虚拟环境；然后又下载了pycharm，结果往pycharm里配置时...

本文由用户于 2024-04-03 发布在金钥匙，如有疑问，请联系我们。
本文链接：https://www.51969.com/post/18717560.html

上一篇

python 网络 Newspaper库，一个新手也能快速上手的爬虫库

下一篇

网络安全安全笔记【网安】DDoS / Web漏洞 / CC攻击 / 恶意爬虫

发表评论取消回复

15人参与，1条评论

笑对人生苦
2024-07-17 19:10:46回复
在排查代码过程中，你是如何确定是selenium的wait_time导致的问题的？
答案：在排查过程中，我发现在使用selenium的wait_time时，页面上选择的class需要存在，我返回要爬取的页面进行检查，并更换了已存在的class，这样，爬虫就可以正常运行了。

扫码支持

微信支付

支付宝

返回顶部暗黑模式