热门搜索: 自助建站 政府 企业 bom SubToSrt 交友 门户 简繁英

v

火车头phpcms 3.0采集模块 beta1版

程序评级:
运行环境: PHP,MySQL
程序大小: 841 KB
发布时间: 2008-4-23 13:35:04
更新时间: 2008-4-23 13:35:04
相关链接: 暂无链接
程序演示: 暂无演示
程序截图: 暂无截图/快照
下载次数:
日:6 次 周:6 次 总:184 次
相关分类: CMS系统 PHP源码
程序简介

phpcms 3.0采集模块发布(GBK|BIG5|UTF-8|zh-tw-Utf8)[10月12日beta1版]
①安装说明
  本采集系统为PHPCMS3.0的所属模块,请在PHPCMS3.0的管理后台执行以下操作安装该程式:
  1、将程序包解压后所有文件使用FTP(二进制模式)上传到PHPCMS系统根目录下的spider目录内
  2、若您的服务器为Linux系统,请将spider/下rules文件夹的目录权限设置为777
  3、进入PHPCMS后台->系统设置->添加模块 在模块目录里填入spider下一步确认安装成功后即可使用
②基本功能介绍
1、使用站点+任务方式组织节点,方便采集及管理。
2、每个站点可以定义一个全局规则,任务的规则可以从站点规则中派生,也可以自己独立修改自己的规则
3、站点规则和整个任务可以自由复制,粘贴,导入,导出,方便与大家共享自己的采集资源
4、除了系统内置的标题,作者,内容等5个标签外,用户可以完全自定义其他标签,方便扩展
5、可以无限使用排除和替换
6、可以使用系统内置的13个HTML排除标签,方便排除无用html代码
7、支持内容分页采集
8、使用Cookie,支持采集需登录的网站
9、支持三种网址添加方式,支持采集区域内网址
10、支持图片,Flash以及任何自定义格式(rar|zip|exe)的文件下载到本地服务器
11、支持gbk,utf-8,big5网站的数据发布到任何gbk,utf-8,big5的phpcms编码转换
12、支持入库自定义内容和字段,可以将内容在phpcms的任何频道,模块间发布
13、支持自动生成采集时间和文章点击率,记录来源地址
14、文章在发布前可以查看,编辑至满足要求后再发布
15、多线程无刷新采集,进度条显示等等...
③简单使用说明
1、建立你的采集站点,因为一般的站点下的栏目规则基本相同,建议在这里定义好一个整站规则,以后从该站下建立的任务的规则将从里面直接派生
2、建立你的采集任务,这里主要定义你要采集文章的入口连接以及这些文章中结构化内容的提取,请在标签中定义好规则,高级设置中则涉及该任务是否下载文件,编码设置和多线程设置的一些问题
3、可以选择测试一下任务,或直接进入采集网址的环节,系统将自动分析每一个连接,完成后将引导你进入采集内容或查看内容(可删除无用连接)
4、开始采集内容,直到所有线程完成,系统将引导你进入发布内容或查看内容(可删除无用文章内容)
5、直接使用默认的发布内容设置或修改后,发布到您选定的频道下的栏目内
6、进入你的栏目下点击管理文章,选择是否生成html形式发布文章,至此一个任务的采集基本流程完成

立即下载
点击下载! 著作权声明 我要评论 报告错误
本类推荐下载资源
本类最受关注的资源
和火车头phpcms 3.0采集模块 beta1版相关的资源
暂无相关下载资源~_~
关于我们 | 著作权声明 | 广告赞助 | 友情链接 | 合作媒体
湘ICP备06011966号
©2004 - 2008 AspJZY.com Some Rights Reserved.