真牛论坛

 找回密码
 立即注册

查看: 136|回复: 1

[小工具] 数据采集机器人 1.0.3破解版(ror_grab)

[复制链接] [查看百度是否已收录]
灌水成绩
 375

 410

 798

主题
帖子
积分
等级头衔

 ID : 739

斗灵

积分成就    威望 : 0
   贡献 : 0
   铜钱: 798
   违规 : 0
   在线时间 :14 小时
  注册时间 :2019-3-15
  最后登录 :2019-10-24
勋章
联系方式

发表于 2019-9-1 01:10:08 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

数据采集机器人 1.0.3破解版(ror_grab)

数据采集机器人 1.0.3破解版(ror_grab)

数据采集机器人 1.0.3破解版(ror_grab)

数据采集机器人 1.0.3破解版(ror_grab)

数据采集机器人 1.0.3破解版(ror_grab)

数据采集机器人 1.0.3破解版(ror_grab)


适配编码:UTF8SC
兼容版本:2.5 3 3.1 3.2 3.3 3.4 F1.0 L1.0


插件使用说明
1、下载后解压“数据采集机器人 1.0.3.zip”压缩包
2、将解压后的文件找到“ror_grab”上传到网站的/source/plugin/目录
3、到网站后台-应用 找到刚刚上传的插件“数据采集机器人 1.0.3”点击安装
4、启用刚刚安装的插件即可
5、如有其他附加文件如:组件、详细教程、DIY等均放在ror_grab目录内
6、在线安装的用户如有其他附加文件
如:组件、详细教程、DIY等到网站的/source/plugin/ror_grab/目录内寻找

PS、在线安装可以忽略步骤1-3和步骤5


应用信息

主要功能描述:采集网络资源自动发帖(使用命名空间,要求PHP版本不低于5.3)

http://share555.com/ 资源网站登陆
账号:        樱花乱舞
密码:        1234567
http://bbs.share555.playmonetize.com/ 测试论坛登陆
账号:        樱花乱舞
密码:        12374567

后台 采集管理 顶部每个按钮说明

采集:
手动拉取需要采集的资源
接口地址host/plugin.php?id=ror_grab&act=cron_grab
拉取数据的频率最小为每小时
会有计划任务每小时执行此操作

发帖:
手动把本地保存的采集数据发到板块的帖子里
接口地址host/plugin.php?id=ror_grab&act=cron_thread
若有本地数据会根据设置里的 每次自动发帖数量 发帖子
会有计划任务每5分钟执行此操作(设置里可以关闭自动发帖)

已发贴:
展示已发到帖子的本地数据列表,可搜索和查看帖子

未发贴:
采集到本地未发帖的数据列表,可搜索、删除和审核发帖

导航:
可以添加想要采集的导航到本地的导航列表,采集任务会根据添加的导航采集相关数据
每个导航添加时必须要指定板块,同时也可以指定板块分类,会把导航数据采集到指定板块的指定分类
导航的添加列表是目前已搜录的采集资源列表,若想要采集未搜录的信息可以在反馈里提交数据给管理员
管理员会根据反馈信息适当增减搜录的采集资源列表

马甲:
设置采集数据发帖时的作者,输入uid批量添加
可以根据板块指定对应的马甲用户进行发帖

反馈:
有新的需求或插件问题可以通过反馈通知管理员
重要的反馈信息,处理结果会发到您设置的邮箱里

捐赠:
默认免费服务可以采集有限信息(每小时采集最新添加的前30个导航的最近一小时内的最新3条信息)
为了可以提供更好的服务可以通过捐赠获取更多采集信息(每小时采集最新添加的前30个导航的最近一小时内的全部信息)
捐赠之前要在设置里添加捐赠的支付宝账户
若捐赠成功一定注意点击确认捐赠按钮以便通知管理员处理,若长时间未收到处理邮件通知,可添加反馈或联系管理员

token:
捐赠成功并且管理员分配token收到邮件通知后可以通过token按钮来获取自己的token信息和采集资源站访问的登陆账户
获取token后可以在设置里添加此token信息
token信息是根据您的论坛ip进行绑定的,所以ip更换token会失效此时需要反馈给管理员处理,当然您的论坛要是走了代理ip不固定是不能申请token的

文档:
会跳到数据采集机器人插件的官方页

须知:
1、由于采集发帖尤其有图片本地化时非常耗时,并且x2.5不支持插件计划任务,
目前的计划任务策略是全局的钩子检测触发时机,若触发会在页面以script方式延迟调用计划任务脚本,
这样做的好处是访问页面不会有延迟,弊端是只有浏览器访问论坛才会触发脚本

x3.0版本以上论坛是可以在工具的计划任务里添加系统计划任务触发的
数据采集机器人自动发帖脚本名称:ror_grab:thread_hourly.php(建议每隔5分钟执行,此时关闭设置自动发帖)
数据采集机器人采集数据脚本名称:ror_grab:grab_hourly.php(每小时执行,建议每小时的随机某一分钟执行,都是同一时间执行会导致服务器并发过高丢弃请求)
当然discuz系统计划任务也是需要有论坛访问请求才会触发的,若用户访问页面时触发可能会导致访问的页面加载有延迟

最好的解决办法是在服务器加系统计划任务
数据采集机器人自动发帖接口地址host/plugin.php?id=ror_grab&act=cron_thread(建议每隔5分钟执行,此时关闭设置自动发帖)
数据采集机器人采集数据接口地址host/plugin.php?id=ror_grab&act=cron_grab(每小时执行,建议每小时的随机某一分钟执行,都是同一时间执行会导致服务器并发过高丢弃请求)

2、关闭设置自动发帖后,默认的自动发帖和采集数据计划任务都会停掉

3、采集数据的限制会根据服务器的压力和用户需求适时调整

4、您的论坛此插件设置信息是根据论坛的服务器ip来绑定的,所以ip更换需要重新设置邮箱信息,当然要是您的论坛走了代理,ip一直变动是不能使用此插件的

5、允许发html的板块采集信息可以在设置里自定义在帖子详情页展示的样式,需要注意某个板块一旦开启允许发html,若有新发帖子并且再次关闭允许板块发html,此时的帖子将展示html源码,目前只有web版支持自定义样式

声明:
数据采集机器人只是简易的爬虫小工具,默认采集发帖是必须走审核的,自动发帖只会检测您论坛后台设置的关键词,所以若是发帖涉及到版权或信息安全问题与本插件无关
此插件是基于discuz现有框架开发的简易插件框架,后台ui采用的layui前端框架,禁止盗用本插件框架
更新记录

兼容php7

取消call_user_func调用

插件采用了比较高版本的php语法,导致一些用户安装插件不能运行,已改成常用语法

取消管理跳转页面





插件下载:
游客,如果您要查看本帖隐藏内容请回复

游客,如果您要查看本帖隐藏内容请回复


免回复下载:
[urlattach=https://pan.baidu.com/s/1ilyxswpbavRzDAtj0eMvhw,提取码q249,0,5]百度云盘[/urlattach][urlattach=https://www.lanzous.com/i5x8scb,,0,5]蓝奏云盘[/urlattach]



----------------
上一篇:阿里云短信接口调用 短信发送接口 1.0.6(jzsjiale_smsapi)
下一篇:【价值2元】[兔月]帖子翻译(T) 正式版1.0破解版(gstudio_postrantext)
灌水成绩
 3

 33

 46

主题
帖子
积分
等级头衔

 ID : 795

斗之气

积分成就    威望 : 0
   贡献 : 0
   铜钱: 46
   违规 : 0
   在线时间 :1 小时
  注册时间 :2019-3-15
  最后登录 :2019-8-22
勋章
联系方式

发表于 2019-9-11 15:38:11 | 显示全部楼层
66666666666
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

2019-10-30
快速回复 返回顶部 返回列表