微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python通过selenium获取网页信息可以绕过反扒系统

加载selenium控件:

pip intall selenium;pip show selenium

web下载地址:

chrome浏览器,chrome插件,谷歌浏览器下载,谈笑有鸿儒 (chromedownloads.net)

配置环境变量path:C:\Program Files\python38

完整代码


import requests
from bs4 import BeautifulSoup
from datetime import datetime
import json
import xlwt
import xlwings as xw
from selenium import webdriver
import time
from selenium.webdriver import Chrome, ChromeOptions

opt = ChromeOptions()            # 创建Chrome参数对象
opt.headless = True              # 把Chrome设置成可视化无界面模式,windows/Linux 皆可
driver = Chrome(options=opt)
# driver = webdriver.Chrome()
driver.get('http://emweb.eastmoney.com/PC_HSF10/Operationsrequired/Index?type=web&code=SH601600')
html=BeautifulSoup(driver.page_source,'html.parser')
time.sleep(2)
source =driver.page_source
# driver.find_element_by_id().send_keys()
# driver.find_element_by_name()
# driver.find_elements_by_class_name()

with open('rrBand.html', 'w') as f:
    f.write(source)
# print(html)
html.list=html.find_all('div',attrs={'class':'sckrox'})
print(html.list)
driver .quit()

# str=['中国铝业','中国核电','中国']
# print(str[1])

 

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐