AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

ajax – 站点抓取：等待站点完全加载

时间：2020-08-12分类：Ajax作者：编程之家

我需要下载以下网页： http://m.10bet.com/#leage_panel#10096

这是一个体育博彩页面,我需要报价.所以,首先这看起来很简单.但是,这是发生的事情(您可以使用例如浏览器的开发人员工具来检查)：

>打开URL
>页面加载一个初始HTML,随后调用ajax请求来检索引号
>然而,引用包含在json中但是它们被模糊化,因此不可能直接从ajax调用中解析它们.此外,网页的javascript也被混淆了.所以没有机会直接读取请求中的引号.

相反,我需要使用能够评估javascript的无头浏览器. HtmlUnit for java是不够的,因为它不提供强大的JavaScript功能.因此,PhantomJS与CasperJS的结合是我目前的选择.我使用以下脚本应用CasperJS：

var casper = require('casper').create();

casper.start('http://m.10bet.com/#leage_panel#10096',function() {
    var url = 'http://m.10bet.com/#leage_panel#10096';
    this.download(url,'10bet.html');
});

casper.run(function() {
    this.echo('Done.').exit();
});

但是,此脚本不会加载整个页面.只是初始页面.如何加载浏览器中显示的完整网页？

解决方法

该脚本看起来是一个好的开始,但是一旦你的(HTML)页面加载,(CasperJS)脚本就会停止,因为你没有给它任何更多的指令.解决这个问题的最简单方法是进入睡眠状态几秒钟,然后刮掉页面：

var casper = require('casper').create();
var fs=require('fs');

casper.start('http://m.10bet.com/#leage_panel#10096',function() {
    this.wait(2000,function() {
        fs.write("10bet.html",this.getHTML() );
   });
});

casper.run();

2000毫秒的暂停是原始的,原因有两个：

>如果数据加载的速度比您浪费时间的速度快.
>如果加载速度较慢,则脚本不起作用.

所以最好在页面上标识出你想要的东西,然后使用Casper的waitForXXX()函数.请参阅此处开始的api文档：http://casperjs.readthedocs.org/en/latest/modules/casper.html#waitfor

另外一点,我猜你实际上并不想要整个HTML页面,只是其中的数据. getHTML()接受一个参数来过滤收到的内容.例如.在你的情况下,getHTML(‘#league_block’)可能会更有用.再次,请参阅api文档以获取更多想法.

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

ajax 上传文件项目下载

IE6是一个非常老旧的网页浏览器，虽然现在很少人再使用它，但是在某些特殊情况下，我们可能还需要使用IE6来访问网页。而在IE6中，我们通常会使用JavaScript来提交表单，来看一下具体操作。

作者：编程之家时间：2023-08-20

PHP中的count()函数是用来计算数组或容器中元素的个数。这个函数十分方便，在编写代码时使用频率也非常高。无论你是要统计数组的长度、统计字符串中字符出现的次数还是统计对象中属性的个数，count()都可以帮助你轻松

作者：编程之家时间：2023-08-20

ajax 不返回值写法

使用 AJAX（Asynchronous JavaScript and XML）技术可以在不刷新整个页面的情况下，向服务器发送请求并接收响应。通常来说，我们使用 AJAX 请求是为了获取后台数据，并将其展示在前端页面上。然而，有时候我们只需要

作者：编程之家时间：2023-08-20

ajax 下载文件 blob

Ajax（Asynchronous JavaScript and XML）是一种用于改进网页用户体验的技术，通过与服务器进行异步通信，实现在网页上局部刷新数据而不必整个页面刷新的功能。在实际开发中，我们经常需要从服务器端下载文件，而传统

作者：编程之家时间：2023-08-20

ajax 下载excel文件流

本文将介绍如何通过AJAX下载Excel文件流。通过AJAX，我们可以在不刷新整个页面的情况下，向服务器发送请求并获取响应数据。在某些场景下，我们需要通过AJAX下载Excel文件流，以便于在前端使用或保存到本地。本文将详

作者：编程之家时间：2023-08-20

ajax .get .post

Ajax是一种用于客户端和服务器之间的异步通信技术。通过Ajax，我们可以在不刷新整个页面的情况下向服务器发送请求并获得响应数据。而在Ajax的基础上，.get和.post是两种常用的请求方法，它们分别用于发送GET和POST请

作者：编程之家时间：2023-08-20

ajax 上传 excel

AJAX（Asynchronous JavaScript and XML）是一种在网页上实现异步数据传输的技术。通过AJAX，网页可以在不刷新整个页面的情况下与服务器进行数据交互，提升用户体验和页面性能。在实际应用中，AJAX广泛用于表单提交、

作者：编程之家时间：2023-08-20

ajax 下拉 360取不到值

在使用Ajax下拉加载数据的过程中，有时候会出现无法取到360度的问题。这个问题可能是由于代码逻辑的问题导致的，也有可能是网络延迟引起的。为了解决这个问题，我们需要对代码进行仔细排查，并且在合适的地方添加适当

作者：编程之家时间：2023-08-20

ajax 与 .post 区别

本文将介绍Ajax和.post之间的区别。Ajax是一种用于在网页上进行异步通信的技术，能够在不刷新整个页面的情况下更新部分页面内容。.post是jQuery中的一个方法，用于向服务器发送POST请求。虽然它们都可以用于发送异步

作者：编程之家时间：2023-08-20

ajax 上传文件目录权限

AJAX（Asynchronous JavaScript and XML）是一种在Web页面上进行异步数据请求和交互的技术。它的出现使得页面在后台与服务器进行数据交互的同时，不需要重新加载整个页面。在网页开发中，常常需要实现文件上传功能，

作者：编程之家时间：2023-08-20