Selenium的三种等待
当执行python的selenium代码时,如果需要定位一个元素或者点击一个元素,需要考虑到网速等多方面原因,导致页面加载速度慢,元素还未加载出来,这样就会导致找不到对应元素,从而报错的问题,所以要设置等待条件,等待元素加载出来后才执行相应的代码。
其中,selenium中有三种等待方式,下面一一进行介绍
sleep(): 强制等待,设置固定休眠时间。后脚本的执行过程中执行 sleep()后线程休眠,而另外两种线程不休眠。
implicitly_wait():隐式等待,是设置的全局等待。设置等待时间,是对页面中的所有元素设置加载时间,如果超出了设置时间的则抛出异常。隐式等待可以理解成在规定的时间范围内,浏览器在不停的刷新页面,直到找到相关元素或者时间结束。
WebDriverWait():显示等待,是针对于某个特定的元素设置的等待时间,在设置时间内,默认每隔一段时间检测一次当前页面某个元素是否存在,如果在规定的时间内找到了元素,则直接执行,即找到元素就执行相关操作,如果超过设置时间检测不到则抛出异常。默认检测频率为0.5s,默认抛出异常为:NoSuchElementException。
显示等待和隐士等待同时存在时,看谁的时间长,就取谁的等待时间
一、强制等待
最简单的一种方式,直接引入time模块,设置等待时间,但这种方式实用性不高,设置时间太短元素仍未找到,设置时间过长影响效率。
import time
time.sleep(5)#强制等待5s
二、隐形等待
由webdriver提供的方法,一旦设置,这个隐式等待会在WebDriver对象实例的整个生命周期起作用,它不针对某一个元素,是全局元素等待,即在定位元素时,需要等待页面全部元素加载完成,才会执行下一个语句。如果超出了设置时间的则抛出异常。
当一个元素初始化后,养成习惯进行隐式等待,相当于监控器
在窗口切换后不再生效
局限性高,只能用来等元素出现,或者是某个指令没有完成,并不能等待所有情况,只能等待很少的一部分。
当页面某些js无法加载,但是想找的元素已经出来了,它还是会继续等待,直到页面加载完成(浏览器标签左上角圈圈不再转),才会执行下一句。某些情况下会影响脚本执行速度。
from selenium.webdriver import Chrome
browser = Chrome() # 浏览器对象
# 开启隐式等待,全局只需放一次
browser.implicitly_wait(30)
browser.implicitly_wait(10) # 等待十秒加载不出来就会抛出异常,10秒内加载出来正常返回
browser.get('http://www.baidu.com')
e = browser.find_element_by_id('kw')
print(e)
implicity_wait()
默认参数的单位为秒,本例中设置等待时长为10秒,首先这10秒并非一个固定的等待时间,它并不影响脚本的执行速度。其次,它并不针对页面上的某一元素进行等待。当脚本执行到某个元素定位时,如果元素可以定位,则继续执行,如果元素定位不到,则它将以轮询的方式不断地判断元素是否被定位到。假设在第六秒定位到了元素则继续执行,若直到超出设置的时长10秒还没有定位到元素,则抛出异常。
三、显性等待
原理:指定一个等待条件,和一个最长等待时间,程序会判断在等待时间内条件是否满足,如果满足则返回,如果不满足会继续等待,超过时间就会抛出异常。
(简而言之,就是直到元素出现才去操作,如果超时则报异常)
需要通过from selenium.webdriver.support.wait import WebDriverWait
导入模块
from selenium.webdriver import Chrome
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
browser = Chrome() # 浏览器对象
browser.get('http://www.baidu.com') # 访问百度页面
e = browser.find_element_by_id('kw')#webelement对象
# 发送数据,输入文本
e.send_keys('腾讯课堂')
# 快速点击,查找父节点如果有form表单就会直接提交
e.submit()
#定时器、等待器
wait = WebDriverWait(browser, 20)
#等待条件,直到元素可见,传入条件为元祖格式
e = wait.until(EC.visibility_of_element_located((By.XPATH, "//a[contains(text(), 'ke.qq.com/' )]")))
#e = wait.until(EC.visibility_of_element_located(("xpath", "//a[contains(text(), 'ke.qq.com/' )]")))
e = browser.find_element_by_xpath("//a[contains(text(), 'ke.qq.com/' )]")
print(e)
WebDriverWait(driver,timeout,poll_frequency=0.5,ignored_exceptions=None)
driver:浏览器驱动
timeout:最长超过时间,默认以秒为单位
poll_frequency:监测的时间间隔,默认为0.5秒
ignored_exceptions:超时后的异常信息,默认情况下抛NoSuchElementException异常
WebDriverWait
一般与until和until_not方法配合使用
until(method,message)
until_not(method ,message)
3.1 WebDriverWait与expected_conditions结合使用
expected_conditions
类常用的判断方法有:
title_is:标题时某个内容
title_contains:标题包含某内容
presence_of_element_located----(2)元素加载出,传入定位元组,如(By.ID, 'p')
visibility_of_element_located----(1)元素可见,传入定位元组
visibility_of:可见,传入元素对象
presence_of_all_elements_located:所有元素加载出
text_to_be_present_in_element:某个元素文本包含某文字
text_to_be_present_in_element_value:某个元素值包含某文字
frame_to_be_available_and_switch_to_it:frame加载并切换
invisibility_of_element_located:元素不可见
element_to_be_clickable ----(3)元素可点击
staleness_of:
element_to_be_selected:
element_located_to_be_selected
element_selection_state_to_be
element_located_selection_state_to_be
alert_is_present
3.2 自行定义等待器
工作中根据webdriverwait原理,自行封装,不需要管这个判断条件,但在学习期间不建议使用自行封装
def wait_element(drive,timeout,poll,locator):
#locator=("xpath","//....")
time_use=0
while time_use<timeout:
e=driver.find_element(*locator)#拆包
return e
except:
time.sleep(poll)
time_use+= poll
raise TimeoutError("元素定位超时")