蓝天采集器(SkyCaiji)网页爬虫系统,采用PHP+Mysql开发已经过5年迭代更新,成熟稳定可部署在云端服务器和虚拟主机中,可视化操作使用浏览器即可采集数据,功能包括数据挖掘、分析、清洗、处理、发布等。软件免费无限制使用,可二次开发,自定义规则和插件自由度高,简单易操作。
数据采集支持无限制多级、多页、分页和RPA流程采集,自定义采集规则(支持正则、XPATH、JSON等)精准匹配任意信息流,几乎能采集所有类型的网页,支持模拟浏览器点击、滚动等操作抓取页面渲染后的内容。数据采集助力垂直大模型AIGC内容创作,可解决大模型应用缺少训练数据的问题。
内容发布无缝对接各类CMS建站程序,实现免登录导入数据,支持自定义数据发布插件,也可以直接导入数据库、存储为Excel文件、远程API发布等。
云部署及自动化该软件类似CMS程序,完全跨平台,任何系统中都能安装,在虚拟主机中也能良好运行。实现定时定量全自动采集发布,简单操作即可持续采集。
此处为隐藏内容,请评论后查看隐藏内容,谢谢!
如果您已经评论了,请点击 刷新 后查看资源哦~
接口地址: (接口开启插件后就在插件设置里显示的)
请求方式:POST
数据编码:utf-8
发送数据:Title=标题、Content=正文、Alias=别名(默认空)、PostTime=日期(默认当前时间)、Intro=摘要(默认空)、CateID=分类(默认空,填入分类名称或id)、Tag=标签(默认空,多个用,号分隔)、Template=模板(默认空)、Status=状态(默认0,可填入 0 公开、1 草稿、2 审核)、IsTop=置顶(默认0,可填入 0 无、1 全局、2 首页、4 分类)、IsLock=禁止评论(默认0,可填入 1 是、0 否)
第一:发布设置
发布方式选择调用接口,接口就是采集对接数据中的接口地址,复制进去即可;
第二:发送数据
发送数据需要自行添加,如标题、内容、分类、标签等重要数据,发送数据中名称就是采集对接数据中发送数据,如标题则是Title,值就是自己写的采集规则,点击字段就能看到自己的规则有哪些!
第三:响应状态
这个响应状态没有什么要注意的,名称是啥就复制啥在输入框中即可。
博主专注于Z-BLOG网站搭建、网站优化以及电脑故障排查、重装、优化、维修系统等,QQ/WX:2126245521(请注明来意)
Copyright © 2020-2023 Jack作品 Reserved.
Powered By Z-Blog Sitemap | 蜀ICP备2023025269号-1
Processed : 0.034 SQL : 14
本文暂无评论 - 欢迎您