Python第三方库使用——splinter
时间:2019-03-13
本文章向大家介绍Python第三方库使用——splinter,主要包括Python第三方库使用——splinter使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
分享一下我老师大神的人工智能教程吧。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!http://www.captainbed.net
功能:实现与html标签的交互,例如用编程的方式实现对页面中某一按键的点击,实现对文本框的填写。
准备
-
安装
pip install splinter
- 1
-
下载浏览器(推荐使用chrome)驱动(默认调用的是 firefox)
请点击如下网站下载与自己操作系统相匹配的驱动程序。
http://chromedriver.storage.googleapis.com/index.html?path=2.20/
基本用法
如想获得直观的演示效果,推荐使用ipython
,实现一种交互式的命令响应。
>>> from splinter.browser import Browser
- 1
获得网页的“句柄”
>>> b = Browser(driver_name='chrome')
# 此时会打开chrome浏览器,
# b这个Browser对象会持有后续操作的页面
# 可将其理解为页面的句柄
# 也即通过操纵b来实现对页面的操纵
- 1
- 2
- 3
- 4
- 5
访问某一站点
>>> url='https://www.baidu.com'
>>> b.visit(url)
# 会在浏览器中打开百度首页
# 是不是很神奇,通过代码的方式实现以前手动完成的事
# 更神奇的还在后面
- 1
- 2
- 3
- 4
- 5
使用百度进行关键字的检索
为避免中英文编码方式的影响,这里我们统一使用页面标签的id
属性而非text
属性。
如,我们按如下的方式获取百度输入框的name
属性值。
>>> b.fill('wd', 'splinter')
- 1
我们可以获得百度一下
所标示的按钮,然后通过代码的方式实现对该按钮的点击。
>>> btn = b.find_by_id('kw')
>>> btn.click()
- 1
- 2
或者连写:
>>> b.find_by_id('kw').click()
- 1
注,因为当前百度搜索填写关键字会触发搜索结果的显示,所以这项演示似乎看起来click和不click影响不大。
杂项
# 判断页面是否存在
>>> b.is_text_present('splinter.cobrateam.info')
True
# 退出
>>> b.quit()
- 1
- 2
- 3
- 4
- 5
- 6
一个实例
我们通过如下简单的代码实现对12306网站的相关标签的设置(以代码的形式操纵而非手动):
登录
>>> from splinter.browser import Browser
>>> url = 'https://kyfw.12306.cn/otn/leftTicket/init'
>>> b = Browser(driver_name='chrome')
>>> b.visit(url)
>>> b.find_by_id('login_user').click()
# 点击登录按钮
>>> b.fill('loginUserDTO.user_name', '****@qq.com')
>>> b.fill('userDTO.password', '****')
# 无奈,此时并不能通过简单的设置绕过验证码
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
以cookie的形式设置始发站、终点站以及日期
>>> b.cookie.all()
# 显示当前cookie,并无站点实现信息
2
3
4
{u'BIGipServerotn': u'1977155850.38945.0000',
u'JSESSIONID': u'0A01D97598F459F751C4AE8518DBFB300DA7001B67',
u'__NRF': u'95D48FC2E0E15920BFB61C7A330FF2AE',
u'current_captcha_type': u'Z'}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
# 然后我们填写出发站,以下信息均需自己事先填写
>>> b.cookies.add({"_jc_save_fromStation":"%u4E0A%u6D77%2CSHH"})
# 添加目的地
>>> b.cookies.add({u'_jc_save_toStation':'%u6C38%u5DDE%2CAOQ'})
# 添加出发日期
>>> b.cookies.add({"_jc_save_fromDate":"2016-01-23"})
# 注,如果需要对相关信息进行修改的话,调用的是add方法,这和字典的操作相兼容
>>> b.cookies.add({u'_jc_save_toStation':'xxxxxx'})
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
>>> b.cookies.all()
{u'BIGipServerotn': u'1977155850.38945.0000',
u'JSESSIONID': u'0A01D97598F459F751C4AE8518DBFB300DA7001B67',
u'__NRF': u'95D48FC2E0E15920BFB61C7A330FF2AE',
u'_jc_save_fromDate': u'2016-01-20',
u'_jc_save_fromStation': u'%u4E0A%u6D77%2CSHH',
u'_jc_save_toStation': u'%u6C38%u5DDE%2CAOQ',
u'current_captcha_type': u'Z'}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
cookie准备完毕,reload然后开始查询:
>>> b.reload()
>>>
- 1
- 2
再分享一下我老师大神的人工智能教程吧。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!http://www.captainbed.net
- BP神经网络识别性别
- 为or、in平反——or、in到底能不能利用索引?
- BP神经网络续1
- 隐藏在程序旮旯中的“安全问题”
- SQLSERVER 占了500多M内存,原来的程序无法一次查询出50多W数据了,记录下这个问题的解决过程。
- 能自己“跑”的表单控件,思路,雏形,源码。vs2005版本
- 在SQLMAP中使用动态SQL
- 使用OQL“语言”构造ORM实体类的复杂查询条件
- AdoHelper使用MySQL存储过程示例
- 使用8位字节的编码格式将字节流安全的转换成String
- 同样的SQL语句在查询分析器执行很快,但是网站上执行超时的诡异问题
- PDF.NET数据开发框架操作MySQL实体类操作实例
- 使用PDF.NET数据开发框架的实体操作语言OQL构造复杂查询条件
- 鲶鱼CMS存储XSS漏洞披露
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 【MySQL】删库别着急跑路(二)--mysqldump的使用
- 【MySQL】删库别着急跑路(三)--binlog2sql闪回工具的使用
- 微服务[学成在线] day10:课程发布、ElasticSearch
- MySql监控分析视图-sys schema
- 如何使用PyMysql操作MySQL数据库?
- 【redis】部署及参数详解(吐血整理,建议收藏)
- 【MySQL性能调优】-关于索引的那些事儿(一)
- 【索引潜规则】-覆盖索引、ICP、MRR详解
- 微服务[学成在线] day12:基于 Nuxt.js 构建搜索前端工程
- 别找了,你要的Redis命令都在这了
- 微服务[学成在线] day13:使用FFmpeg进行格式转换以及m3u8文件生成、文件分块上传接口实现
- GTID,你了解多少?
- Spring Boot 拓展SpringMVC
- Spring Boot 日志配置
- R语言进阶之图形参数