1、DOM
“文档对象模型(Document Object Model,简称DOM)
DOM提供了对整个文档的访问模型,将文档作为一个树形结构,树的每个结点表示了一个HTML标签或标签内的文本项
将HTML或XML文档转化为DOM树的过程称为解析(parse)。HTML文档被解析后,转化为DOM树,因此对HTML文档的处理可以通过对DOM树的操作实现。”
在打开的网页中,按f12--elements,再借助这个页面左上角的箭头,可以找到页面元素对应的html语言
在console窗口里可以通过document.getElementById/ClassName/TagName等进行操作,找出多个时,可以下标取值,取定后可以进行获取、改值等操作
如:
2、selenium的使用准备
① pip install selenium
② 搜索淘宝镜像,找到chromedriver(和浏览器版本相对应)下载,下载后解压得到一个.exe文件,将这个文件放到python的安装目录下(此步操作后不必再去配置环境变量)
from selenium import webdriver # 配置了环境变量,不用传参数 driver = webdriver.Chrome() # 如果没有给chromedriver配置环境变量,要通过参数去指定chromedriver所在的路径 # driver = webdriver.Chrome(executable_path=r"chromedriver.exe所在的路径")
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。