火车采集器第二期教程目录
火车采集器第二期教程
· 前言
1. 什么是采集器,采集器的工作原理,运用范围
2. 网站管理系统与采集器(CMS+LocoySpider)的运用和前景
3. 本教程的相关术语和学习要求
· 第一部分,软件与功能介绍
1. 火车采集器软件介绍,功能简介,购买及售后简介
2. 火车采集器软件的下载,环境安装
3. 火车采集器软件界面,功能菜单介绍,版本介绍
4. 重难点:火车采集器工作流程
· 第二部分,“站点”功能及操作
1. 站点的建立、删除,站点规则导入、导出
2. 站点规则制作请参考任务规则制作
· 第三部分,“任务”功能与操作,重难点内容
1. 第一步,任务的建立、删除、数据处理,任务规则导入、导出、复制
2. 第二步,添加采集网址规则:自动分析链接
2.1. 重难点:添加采集网址规则:手动设置链接格式
3. 第三步,规则标签的建立、修改、删除、复制
3.1. 第四步:使用前后截取模式采集数据
3.2. 重难点:使用正则匹配模式采集数据
3.3. 重难点:使用自定义格式获取数据
3.4. 重难点:过滤、替换、文件下载设置
3.5. 进阶篇:使用正则表达式的采集方法
4. 第四步:配置发布方式
4.1. 重难点:WEB发布方式介绍与配置
4.2. 重难点:数据库发布方式介绍与配置
5. 第五步:文件保存及任务运行时设置
· 第四部分,火车采集器内容发布模块的制作与配置
1. 免费版:WEB发布模块介绍、建立、制作、修改、加密
2. 标准版:数据库发布模块介绍、建立、制作、修改、加密
3. 重难点:DEDECMS简介,DEDECMSWeb发布模块的制作
· 第五部分,数据采集、编辑、发布,自动更新,数据库整理等
1. 采集任务的启动,停止,批量设定
2. 标准版:任务自动更新设置,采集数据库处理
· 第六部分,完整规则的制作、采集、发布
1. 论坛发布:采集Discuz 6.1论坛帖子与回复
1.1. 论坛发布:发布Discuz 6.1论坛帖子与回复(使用接口文件)
2. CMS实例:采集并实现 DEDE V5.1 图片模型内容的发布,下载附件,远程附件
3. 博客实例:实现百度空间内容的发布
4. 进阶:多特软件站全站采集与自动更新
· 第七部分,其它
1. 火车采集器多功能插件的配置与使用
2. 产品与服务订制,联系方式与报价