测试工具爬虫-selenium

爬虫-selenium

特点

基于浏览器自动化的模块

可以模拟手动操作

1.便捷的获取网站中动态加载的数据

2.便捷的实现模拟登陆

3.可以获取js动态加载的数据

驱动下载和版本关系

http://chromedriver.storage.googleapis.com/index.html

http://blog.csdn.net/huilan_same/article/details/51896672

简单案例

from selenium import webdriver

from lxml import etree

#实例化一个浏览器对象，需要传入驱动

chrome=webdriver.Chrome(executable_path="chromedriver")

url='https://www.ixigua.com/i6701605562779435533/'

url2='http://125.35.6.84:81/xk'

#浏览器发起请求

chrome.get(url=url2)

#浏览器获取界面源码数据

page_text=chrome.page_source

print(page_text)

tree=etree.HTML(page_text)

c_name=tree.xpath("//ul[@id='gzlist']/li/dl/@title")

print(c_name)

#关闭浏览器

chrome.quit()

常用的方法

1.发起请求：get(url)

2.标签定位：find系列的方法

3.标签交互(想输入框添值)：send_keys()

4.执行js程序：execute_script("jscode")

5.请进，返回：back()/forward()

6.关闭浏览器：quit()

from selenium import webdriver

import time

chrome=webdriver.Chrome(executable_path="chromedriver")

url="https://www.jd.com"

url2="https://www.baidu.com"

#发起请求

chrome.get(url)

#找到搜索框

input=chrome.find_element_by_id("key")

#将想要查询的内容填入搜索框内

input.send_keys("显卡")

#找到搜索按钮

button=chrome.find_element_by_xpath('//*[@id="search"]/div/div[2]/button')

#点击搜索

button.click()

time.sleep(2)

#跳转到百度

chrome.get(url2)

time.sleep(2)

#返回

chrome.back()

time.sleep(2)

#前进

chrome.forward()

chrome.back()

#向下滚动一个浏览器界面的长度

for i in range(3):

chrome.execute_script('window.scrollTo(0,document.body.scrollHeight)')

time.sleep(2)

time.sleep(3)

#浏览器退出

chrome.quit()

参考链接

https://www.cnblogs.com/xiaoyuanqujing/articles/11805718.html

精彩链接

评论可见，请评论后查看内容，谢谢！！！

您阅读本篇文章共花了：

大家都在找：

爬虫：爬虫软件官网

selenium：selenium怎么读

测试工具：测试工具英文

大家都在看：

测试工具 python爬虫——selenium

目录一、背景编辑 1.1、selenium的发展 1.2、在爬虫中的应用 1.3selenium执行原理图 1.4、WebDriver，与WebElement 二、准备编辑 2.1、下载驱动 2...

测试工具爬虫 Selenium Python教程第7章：Selenium编程其它功能

eclipse 测试工具 Selenium用法详解【窗口表单切换】【JAVA爬虫】

简介本文主要讲解java 代码利用Selenium如何实现控制浏览器进行窗口切换和页面内的不同表单之间的切换操作。切换操作窗口切换在 selenium 操作页面的时候，可能会因为点击某个链接而跳转到一...

测试工具继续上一个爬虫，所以说selenium加browsermobproxy

继续，书接上回，这次我通过jsrpc，也学会了不少逆向的知识，感觉对于一般的网站应该都能应付了。当然我说的是简单的网站，遇到那些混淆的，还有那种猿人学里面的题目，还是免谈了。那种需要的水平太高，我学习...

测试工具异步任务爬虫【测试】selenium拦截Ajax（XHR）等异步请求数据

1.说明在爬取某个网站的时候遇到加密参数，由于js代码经过混淆编译不好破解，所以采用selenium的方式获取参数，但是我们获取selenium的数据基本上都是基于页面的，对于网站发起的异步请求，我...

测试工具 python 爬虫当Selenium遇上referer防爬时怎么处理

近期在工作上遇到了一个问题，我用requests写的爬虫代码交给公司运营同事使用，用于导出后台账户的某些产品数据，省的他们一个个的去页面上把数据复制到表格里，从而减轻工作量。 ...

测试工具 python 爬虫网络爬虫基于selenium和bs4的通用数据采集技术（附代码）

AI应用开发相关目录本专栏包括AI应用开发相关内容分享，包括不限于AI算法部署实施细节、AI应用后端分析服务相关概念及开发技巧、AI应用后端应用服务相关概念及开发技巧、AI应用前端实现路径及开发技巧 ...

python 测试工具【爬虫】Selenium爬取动态网页的base64图片

文章简介 Selenium爬取动态网页的base64图片,并解决页面完整加载缓慢，base64字符串的获取和格式转码，一些页面不存在，部分照片无法加载等问题。后附源码。目录1，需求2，环境和使用的技术...

测试工具 chrome 100天精通Python（爬虫篇）——第47天：selenium自动化操作浏览器（基础+代码实战）

文章目录一、Selenium框架环境搭建1. 下载模块2. 安装浏览器驱动WebDriver二、基础操作1. 打开浏览器2. 无界面模式3. 元素定位4. 元素操作5. 前进后退6. 执行js7.页面...

爬虫测试工具 Selenium+Python自动化测试之验证码处理

两常用种方式：验证码识别技术 (很难达到100%) 添加Cookie （*****五星推荐）方式一：验证码识别技术处理逻辑：打开验证码所在页面，截图。获取验证码元素坐标，...

测试工具爬虫练习：Selenium使用案例

一、获取某电商平台商品信息with open('苏宁商品.csv',mode='a',newline='',encoding='utf-8') as f:#打开谷歌浏览器#打开网页#滚动#提取数据wi...

测试工具自动化测试软件测试找工作功能测试爬虫选择大战：Scrapy vs Selenium，谁主沉浮？

2024软件测试面试刷题，这个小程序（永久刷题），靠它快速找到工作了！（刷题APP的天花板）_软件测试刷题小程序-CSDN博客文章浏览阅读3.4k次，点赞86次，收藏15次。你知不知道有这么一个软件测...

测试工具 Python 中 selenium 设置参数，不打开可视化页面，后台执行爬虫程序

前言在使用 selenium 浏览器渲染技术，爬取网站信息时，默认情况下就是一个普通的纯净的 chrome 浏览器，而我们平时在使用浏览器时，经常就添加一些插件，扩展，代理之类的应用...

测试工具【Python爬虫与数据分析】爬虫selenium工具

目录一、selenium工具安装二、selenium打开浏览器测试三、无头浏览器四、元素定位五、页面滑动六、按键、填写登录表单七、页面切换八、实战爬取当当网书籍数据 Selenium是...

python chrome 测试工具爬虫已解决selenium.common.exceptions.TimeoutException: Message: script timeout

已解决（selenium模块操作浏览器报错）selenium.common.exceptions.TimeoutException: Message: script timeout文章目录报错代码报错...

测试工具爬虫 selenium语法（八）

目录一、为什么使用selenium二、selenium语法——元素定位1.根据 id 找到对象2.根据标签属性的属性值找到对象3.根据Xpath语句获取对象4.根据标签名获取对象5.使用bs语法获取对...

金钥匙

测试工具爬虫-selenium

开发语言网络爬虫——python爬取豆瓣评论

网络测试工具 Wireshark抓包分析DHCP

发表评论取消回复

金钥匙

测试工具 爬虫-selenium

开发语言 网络爬虫——python爬取豆瓣评论

网络 测试工具 Wireshark抓包分析DHCP

相关文章

发表评论取消回复

测试工具爬虫-selenium

开发语言网络爬虫——python爬取豆瓣评论

网络测试工具 Wireshark抓包分析DHCP