Hero scripts of machete.
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

44 lines
964 B

1 year ago
# machete的hero爬虫脚本库
Hero scripts of machete.
1 year ago
本项目基于Node.js和开源工具Hero(官网:https://ulixee.org)。
1 year ago
1 year ago
支持以下平台视频分享网页数据抓取:
1 year ago
* 抖音网页版
* 快手网页版
* 西瓜视频网页版
* Bilibili
爬虫采集到的数据结构见Machete项目的TaJian皮肤文档。
1 year ago
1 year ago
## 目录/文件说明
* bot - 针对各大平台的网页HTML解析类
* bypass - 针对各大平台的常用域名收集
* test - 类库测试代码
* tmp - 临时文件保存目录
1 year ago
* install_cloud.sh - hero服务端安装(非必需)
* install_hero.sh - hero客户端安装
## 使用方法
1 year ago
1. 下载本源码到本地后
2. 执行下面命令安装依赖包:
1 year ago
```
npm install
```
如果你对npm和node不熟悉,请自行了解。
1 year ago
3. 写一个.mjs脚本,调用bot/下的类库,自行解析目标网页获取所需数据。
bot/目录下的类库调用方法,可参考test/scrap_test.mjs测试脚本。