AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

apify-js

时间：2022-03-20分类：框架类库

2核2G 3M固定带宽云服务器 ¥99/年

编程之家收集整理的这个编程导航主要介绍了apify-js，编程之家，现在分享给大家，也给大家做个参考。

apify-js 介绍

apify-js是一款用于 JavaScript 的可伸缩的 web 爬虫和抓取库。能通过无头（headless）Chrome 和 Puppeteer 实现数据提取和 Web 自动化作业的开发。它提供了管理和自动扩展无头Chrome / Puppeteer实例池的工具，维护要爬网的URL队列，将爬网结果存储到本地文件系统或云端。

安装：

npm install apify --save

运行以下示例以使用Puppeteer执行网站的爬取：

const Apify = require('apify');

Apify.main(async () => {

const requestQueue = await Apify.openRequestQueue();

await requestQueue.addRequest({ url: 'https://www.iana.org/' });

const pseudoUrls = [new Apify.PseudoUrl('https://www.iana.org/[.*]')];

const crawler = new Apify.PuppeteerCrawler({

requestQueue,

handlePageFunction: async ({ request,page }) => {

const title = await page.title();

console.log(`Title of ${request.url}: ${title}`);

await Apify.utils.puppeteer.enqueueLinks(page,'a',pseudoUrls,requestQueue);

},

maxRequestsPerCrawl: 100,

maxConcurrency: 10,

});

await crawler.run();

});

网站地址:https://sdk.apify.com/

GitHub:https://github.com/apifytech/apify-js

网站描述:可伸缩的 web 爬虫和抓取库

apify-js

官方网站：https://sdk.apify.com/

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

johnny-five,Bocoup 的 JavaScript 机器和物联网编程框架

作者：编程之家时间：2022-03-20

WePY,一款让小程序支持组件化开发的框架

作者：编程之家时间：2022-03-20

Deep playground

Deep playground,神经网络的交互式可视化，使用d3.js和TypeScript编写

作者：编程之家时间：2022-03-20

ShareDB,用于并发编辑系统的前端数据库

作者：编程之家时间：2022-03-20

RxJS,RxJS 是使用 Observables 的响应式编程的库

作者：编程之家时间：2022-03-20

egg-react-ssr,最小而美的Egg + React + SSR 服务端渲染应用骨架

作者：编程之家时间：2022-03-20

Avalon.js,迷你, 易用 ,高性能的前端MVVM框架

作者：编程之家时间：2022-03-20

d3-dag,用于可视化有向无环图的布局算法

作者：编程之家时间：2022-03-20

Guess.js,Google的数据驱动改进前端体验的工具库

作者：编程之家时间：2022-03-20

hyperapp,创建前端应用的 1 KB 的 JavaScript 库

作者：编程之家时间：2022-03-20