超简单的爬虫，并配置ChatGPT 的GPTs培训自己的AI

前言

大家用过ChatGPT的GPTs的同学，应该都知道它的厉害，它能上传你自己的模型，实现最接受你风格的AI，简单讲，就是可以利用已有数据，生成特定的自定义模型。可以上传自己的视频，文本，图片，等内容，今天就介绍一下最简单的入门爬虫，收集自己喜欢的数据，训练自己的AI模型。

项目

官方项目地址：https://github.com/builderio/gpt-crawler

官方有使用说明，这里再结合我自己的过程，记录一下。

有三种运行项目的方式，前提是你要安装好node.js>=16版本以上。

方式一：CMD

这个是最简单的，配置环境最少的

第一步，直接下载zip代码到本地，并解压

第二步，在资源管理器地址栏输入CMD，或者开始菜单进入的项目目录，确保已在项目目录下

第三步，输入以下命令安装项目

npm i

第四步，配置爬虫目录，编辑config.js文件 import { Config } from "./src/config";

export const defaultConfig: Config = {
url: "https://www.builder.io/c/docs/developers",
match: "https://www.builder.io/c/docs/**",
maxPagesToCrawl: 50,
outputFileName: "output.json",
};

url:替换成你的目录地址

match:目录下所有文件

maxPagestoCrawl:50,这个是数量

outputFileName:输出结果的文件名

第五步，运行项目

npm start