AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

javascript-解析具有动态内容的网站

时间：2022-10-09分类：Ruby作者：编程之家原文地址

我正在使用Nokogiri解析TechCrunch [具有特定的搜索词.

http://techcrunch.com/search/education#stq=education&stp=1

问题在于该站点在返回与搜索项相关的列表之前有几秒钟的延迟,因此当Nokogiri检索到它时,我输入到Nokogiri解析的URL没有相关内容.

几秒钟后,内容似乎已动态加载-我猜是Javascript.
关于如何稍微延迟检索HTML的任何想法？

用Ruby方法,睡觉

seconds_to_delay = 5
sleep seconds_to_delay

编辑1：处理在文档加载完成后一段时间加载的div

我讨厌这种情况.我必须处理完全相同的情况,所以这就是我的解决方法.
您需要使用selenium-webdriver gem之类的东西.

require 'selenium-webdriver'
url = "http://techcrunch.com/search/education#stq=education&stp=1"

css_selector = ".tab-panel.active"

driver = Selenium::WebDriver.for :firefox
driver.get(url)
driver.switch_to.default_content
posts_text = driver.find_element(:css, css_selector).text
puts posts_text
driver.quit

如果您在Heroku,AWS EC2或Digital Ocean之类的虚拟机上运行此程序,则不能使用firefox.相反,您需要像phantom.js这样的无头浏览器.

为了使用phantom.js而不是firefox,首先,在VM上安装phantomjs.然后更改为driver = Selenium :: WebDriver.for：phantomjs.

您可以使用this gem为您实际安装phantomjs.

问题b)的第二次编辑

require 'selenium-webdriver'
url = "http://techcrunch.com/search/education#stq=education&stp=1"

css_selector = ".tab-panel.active ul.river-compact.river-search li"

driver = Selenium::WebDriver.for :phantomjs
driver.get(url)
driver.switch_to.default_content
items = driver.find_elements(:css, css_selector)
items.each {|x| puts x }
driver.quit

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

ruby on rails validates

validates:conclusion,:presence=>true,:inclusion=>{:in=>[0,1]}validates:email,:presence=>true,:length=>{:minimum=>3,:maximum=>254},:uniqueness=>true,:email=>truevalidates:end...

作者：编程之家时间：2022-10-09

redis 集群搭建

一、redis集群搭建redis3.0以前，提供了Sentinel工具来监控各Master的状态，如果Master异常，则会做主从切换，将Slave作为master，将master做为slave。其配置也较复杂，且表现一般。redis3.0以后已经支持集群容错功能...

作者：编程之家时间：2022-10-09

如何让ruby中的ri起作用

分享一下我老师大神的人工智能教程。零基础！通俗易懂！风趣幽默！还带黄段子！希望你也加入到我们人工智能的队伍中来！https://blog.csdn.net/jiangjunshow 不知道大家是否注意到...

作者：编程之家时间：2022-10-09

ruby方法名之命名方式

上一篇博文 ruby传参之引用类型里边定义了一个方法名 modify_my_object!，这个方法名是以!结尾，在ruby的对象里边是用于表达修改本身的意思。比如String#gsub，返回的是一个新的字符串对象；而String#gsub!，返回...

作者：编程之家时间：2022-10-09

一编程与编程语言什么是编程语言？能够被计算机所识别的表达方式即编程语言,语言是沟通的介质，而编程语言是程序员与计算机沟通的介质。什么是编程？编程即程序员根据需求把自己的思想流程按照某种编程语言的语法...

作者：编程之家时间：2022-10-09

雷林鹏分享：Ruby 类和对象

Ruby类和对象Ruby是一种完美的面向对象编程语言。面向对象编程语言的特性包括：数据封装数据抽象多态性继承这些特性将在面向对象的Ruby中进行讨论。一个面向对象的程序，涉及到的类和对象。类是个别对象创建的蓝图。...

作者：编程之家时间：2022-10-09

1.ruby的标签<ruby>漢<rp>(<p><rt>han<t><rp>)<p>字<rp>(<p><rt>zi<t><rp>)<p><uby>

作者：编程之家时间：2022-10-09

Redis安装及单机集群搭建总结(多节点搭建集群和单机集群大同小异)

1、软件安装1.安装包是个压缩包-->解压到/homeedis_tar下命令如下： tar-zxvf./../-C/homeedis_tar2.安装c++环境yum-yinstallgcc-c++（注：redis底层源码是c++）3.解压后需要源码编译进入到redis-3.0.0后执行make...

作者：编程之家时间：2022-10-09

sass(scss的安装

1.sass基于Ruby语言开发而成，因此安装sass前需要安装Ruby。（注:mac下自带Ruby无需在安装Ruby!）window下安装SASS首先需要安装Ruby，先从官网下载Ruby并安装。安装过程中请注意勾选AddRubyexecutablestoyourPATH添加...

作者：编程之家时间：2022-10-09

从0使用Ruby on Rails打造企业级RESTful API项目实战之我的云音乐

本节对我们项目实现的功能和知识点做一个简单的介绍，因为是RESTfulAPI项目，所以对于后端来说基本上没有什么UI界面可展示，那我们就在关键的点，使用客户端（Android）实现的效果图。课程简介这是一门企业级项目实战...

作者：编程之家时间：2022-10-09