wordpress采集爬虫插件工具使用教程

TestWhite 2022-01-0515:34:51爬虫专栏评论141389字阅读4分37秒

步骤一 安装发布插件

安装wordpress免登陆发布插件(在用户wordpress网站上进行的操作)文章源自玩技e族-https://www.playezu.com/38829.html

(一)插件市场安装方式

 1. 使用管理员账号登录WordPress网站后台;
 2. 左侧菜单打开:“ 插件”--》“安装插件”-》输入关键词 keydatas 搜索插件,出现“简数数据采集和发布平台”点击 “现在安装”,安装后,点击“启用”即可左侧菜单会出现“简数采集平台”(见下图)
 3. 点击“简数采集平台”,务必请修改发布密码等(见下图)。(配置发布目标时需要用到)主要如下图:
 4. wordpress采集爬虫插件工具使用教程 

注意:如果提示安装失败,可按照下面方法解决:文章源自玩技e族-https://www.playezu.com/38829.html

I、 请再试一次安装就可以了,如果还不行,请联系管理员。文章源自玩技e族-https://www.playezu.com/38829.html

II、如果是安装了旧版本1.x.x(手工上传安装方式),请先卸载:文章源自玩技e族-https://www.playezu.com/38829.html

先停用1.x.x的旧版本,然后删除,如果出现“未能完整移除插件keydatas/keydatas.php”,请到/wp-content/plugins目录下删除keydatas目录,然后刷新wordpress插件页面即可。文章源自玩技e族-https://www.playezu.com/38829.html

(二)手动上传安装方式

如果Wordpress在线插件库加载失败或无法下载简数采集发布插件时,可以点击此链接下载---简数采集平台Wordpress发布插件.zip,然后点击Wordpress的安装插件,上传插件zip包安装即可(无需解压zip文件);最后点击“简数采集平台” ,务必请修改默认发布密码等(见下图)。(配置发布目标时需要用到);文章源自玩技e族-https://www.playezu.com/38829.html

wordpress采集爬虫插件工具使用教程文章源自玩技e族-https://www.playezu.com/38829.html

步骤二 添加发布目标

进入简数控制台,从”我的采集任务“列表中打开一个任务,进入采集任务管理页面,找到“发布目标管理” ==》点击按钮“+发布目标WordPress”,在配置页面中只需填写基本信息和设置发布对应字段,如下图:文章源自玩技e族-https://www.playezu.com/38829.html

wordpress采集爬虫插件工具使用教程文章源自玩技e族-https://www.playezu.com/38829.html

wordpress采集爬虫插件工具使用教程文章源自玩技e族-https://www.playezu.com/38829.html

填写后 “保存&下一步”,进入“配置映射对应字段”页面:文章源自玩技e族-https://www.playezu.com/38829.html

注意:作者建议填写wordpress系统那边已存在的用户名(不支持昵称),不存在的wp系统可能会自动创建由数字英文组成的作者,例如:1b52bdb1efe02b7d;查看wp作者详细设置文章源自玩技e族-https://www.playezu.com/38829.html

wordpress采集爬虫插件工具使用教程文章源自玩技e族-https://www.playezu.com/38829.html

这一步主要操作:把详情提取器中定义的字段(上图:值来源1)与wordpress网站的属性(上图:目标网站字段名)进行映射匹配。(系统会先做智能匹配)如果任务的详情提取器采用的是系统默认字段,那么这里可以不用做任何改动文章源自玩技e族-https://www.playezu.com/38829.html

发布时,系统会根据这里已设置的对应关系把采集到的数据内容发送给wordpress对应字段。文章源自玩技e族-https://www.playezu.com/38829.html

设置后,请“保存并关闭”即可,如果需要添加扩展参数,则 “保存&下一步”进行添加。文章源自玩技e族-https://www.playezu.com/38829.html

提示:查看Wordpress映射字段设置详细教程文章源自玩技e族-https://www.playezu.com/38829.html

步骤三 数据发布

进入该任务管理页面,找到选项卡“结果数据&发布”,在数据列表选中一条或多条数据,点击上面的“数据发布”按钮,出现发布目标选择窗口:文章源自玩技e族-https://www.playezu.com/38829.html

wordpress采集爬虫插件工具使用教程文章源自玩技e族-https://www.playezu.com/38829.html

选中刚才用户自己配置的,这里是“我的WordPress网站”。点击“发布”按钮则开始发布。(另外同时还可以发布到简数提供的wordpress测试站点)文章源自玩技e族-https://www.playezu.com/38829.html

数据发布进度和结果:文章源自玩技e族-https://www.playezu.com/38829.html

wordpress采集爬虫插件工具使用教程文章源自玩技e族-https://www.playezu.com/38829.html

点击结果中的链接,可直接进入已发布的页面(这属于用户网站内容)结果(例子为简数发布测试站):wordpress采集爬虫插件工具使用教程数据发布结束!文章源自玩技e族-https://www.playezu.com/38829.html

平台优势:

1.可以免费手动采集不限制次数,界面操作简单无需手动获取定位文章源自玩技e族-https://www.playezu.com/38829.html

2.数据库读写方式,可以远程上传图片等功能文章源自玩技e族-https://www.playezu.com/38829.html

3.批量发布等优势非常明显文章源自玩技e族-https://www.playezu.com/38829.html

平台劣势:

1.平台不能够定时采集,定时采集属于付费内容45/月,对于新闻类的站点来说不是很友好。文章源自玩技e族-https://www.playezu.com/38829.html

2.容易乱码需要手动采集前配置UTF-8模式。文章源自玩技e族-https://www.playezu.com/38829.html

 • 我们QQ群
 • QQ扫一扫
 • weinxin
 • 微信公众号
 • 公众号扫一扫
 • weinxin
TestWhite
 • 本文由 发表于 2022-01-0515:34:51
 • 请您在转载时请务必保留本文链接:https://www.playezu.com/38829.html
阿里云小店
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定