目录
- 问题描述
- 解决方案
- 参考
问题描述
通过selenium请求目标网站时候, 真实数据(我这里是验证码图片)已经加载出来, 由于网站做了第三方上报所以得等待很久, 但是上报这个请求不是必须的.
例如
验证码已经加载完成, 但是huatuo.qq.com响应时间过长 , webdriver.get()的机制是等待请求的url响应全部完成才进行下一步. 显示等待和隐式等待的作用是每隔多少秒来检测一下这个地址是否加载完成, 所以此处不生效.
那我要做的是: 当请求目标url时候, 希望webdriver不上报或者屏蔽huatuo.qq.com…这样就能节省大量时间, 从而进行下一步操作
解决方案
在通过selenium打开目标url后, 植入js插件, 通过插件来屏蔽上报url
配置selenium属性, 添加屏蔽规则
chrome_options.add_argument(\'--host-resolver-rules=MAP report.huatuo.qq.com 127.0.0.1\')
最终效果
这样就能专注于目标url, 更快的执行下一步.
其他属性配置
options.add_argument(‘headless\') # 无头模式options.add_argument(‘window-size={}x{}\'.format(width, height)) # 直接配置大小和set_window_size一样options.add_argument(‘disable-gpu\') # 禁用GPU加速options.add_argument(‘proxy-server={}\'.format(self.proxy_server)) # 配置代理options.add_argument(\'–no-sandbox\') # 沙盒模式运行options.add_argument(\'–disable-setuid-sandbox\') # 禁用沙盒options.add_argument(\'–disable-dev-shm-usage\') # 大量渲染时候写入/tmp而非/dev/shmoptions.add_argument(\'–user-data-dir={profile_path}\'.format(profile_path)) # 用户数据存入指定文件options.add_argument(\'no-default-browser-check) # 不做浏览器默认检查options.add_argument(\"–disable-popup-blocking\") # 允许弹窗options.add_argument(\"–disable-extensions\") # 禁用扩展options.add_argument(\"–ignore-certificate-errors\") # 忽略不信任证书options.add_argument(\"–no-first-run\") # 初始化时为空白页面options.add_argument(\'–start-maximized\') # 最大化启动options.add_argument(\'–disable-notifications\') # 禁用通知警告options.add_argument(\'–enable-automation\') # 通知(通知用户其浏览器正由自动化测试控制)options.add_argument(\'–disable-xss-auditor\') # 禁止xss防护options.add_argument(\'–disable-web-security\') # 关闭安全策略options.add_argument(\'–allow-running-insecure-content\') # 允许运行不安全的内容options.add_argument(\'–disable-webgl\') # 禁用webgloptions.add_argument(\'–homedir={}\') # 指定主目录存放位置options.add_argument(\'–disk-cache-dir={临时文件目录}\') # 指定临时文件目录options.add_argument(‘disable-cache\') # 禁用缓存options.add_argument(‘excludeSwitches\', [‘enable-automation\']) # 开发者模式
参考
其他详细配置 请点击
到此这篇关于python selenium禁止加载某些请求的实现的文章就介绍到这了,更多相关python selenium禁止加载某些请求内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
您可能感兴趣的文章:
- python3+selenium获取页面加载的所有静态资源文件链接操作
- Python selenium页面加载慢超时的解决方案
- 浅谈selenium如何应对网页内容需要鼠标滚动加载的问题
- Python使用Selenium爬取淘宝异步加载的数据方法
- Selenium 模拟浏览器动态加载页面的实现方法