新手使用火车头发布接口如何采集文章教程

前沿:

如果你对火车头一点都不知道,你还是去网上自学一点火车头采集的知识,我也不是什么大师,硬着头皮写的,至少能用,在这里我不会教你如何写采集规则,因为写法种类太多,你问我我也不知道,火车头相关文件夹里提供的发布接口内置了马甲发布文章,和发布文章时间设置(10-70分钟随机)。用户只需关注火车头标题和内容即可,参数值标题(title),内容(content)。

采集之前后台插件管理,先批量添加10-20个左右马甲

第一步:站点设置里设置下火车头免登录发布接口的全局变量值:(随便写字母,好记就行)


第二步:将发布接口上传覆盖程序根目录:

image.png

application上传到问答网站根目录覆盖原来的application文件夹

image.png

whatsns_newquestion.wpm是问答发布模块

whatsnsnewarticle.wpm是文章发布模块


第三步:登录火车头软件后导入发布模块"


下图更多处下拉--选择导入:


导入后:


上图中,数字1处填写你在网站后台设置的全局变量值。

2 处选择 utf-8 编码。

3 处填写你网站域名,不要带 反斜杠'/'.

4处选择不需要登录

5 处点击获取列表--选择你需要入库的分类 (注意:网址是https得网站免费版火车头软件有可能获取不到分类列表)

6 随便给当前这个发布模块写个名字,后续采集任务模块会用到。

最后点击保存配置按钮。

---------

下面讲解导入采集任务:--这个规则不保证最新

新建任务分组后,在该分组下导入任务规则(导入任务至该分组):




选择我们的采集任务规则(.ljobx文件):



下一步:双击规则项


image.png

第二步很重要,导入咱们对应的问答/文章发布模块,看你采集规则事问答还是文章,这样方便同步最新的采集标签

image.png

点击第三步:修改发布内容设置



修改下你发布的分类:


最后保存即可:



然后右键开始任务采集:



发布内容审核模式+批量计划任务定时放行使用方法:

打开站点根目录:application\controllers\Pccaiji\Pccaiji_question.php ,application\controllers\Pccaiji\Pccaiji_catgory.php 两个文件

 image.png

状态 status  1 改成 0 


两个文件都修改完成后,火车头那边发布的内容会进入审核列表,前端不会展示了。


如何设置计划任务定时放行?

这个站点根目录/application\controllers\Doit.php 插件文件就是批量自动放行审核内容的。默认放行访问一次 放行 100条,这个值自己可以修改,最大不要超过2000,不然查询有压力,负载增加。


image.png


问答访问地址:网址/doit/question.html

文章访问地址:网址/doit/article.html


将访问地址可以添加到宝塔计划任务中:


image.png