Skip to content

爬取模式

一个爬虫应用实例有两种爬取模式: 异步/同步,每个爬虫实例只能选择其中一种。

js
import { createCrawl } from 'x-crawl'

const crawlApp = createCrawl({ mode: 'async' })

mode 选项默认为 async 。

  • async: 异步爬取目标,无需等当前爬取目标完成,就进行下次爬取目标
  • sync: 同步爬取目标,需要等这次爬取目标完成,才会进行下次爬取目标

若有设置间隔时间,则都需要等间隔时间结束才会爬取下次目标。

TIP

爬取 API 的爬取过程都是单独进行的,也就是说如果调用两个 crawlPage 他们会互不干扰,该模式对批量爬取目标才有效。

基于 MIT 许可发布