怎样使用火车头采集器

2012年1月16日 | 分类: 【技术】

【怎样批量生成网址采集规则】

新版规则中使用了制表符:┠ 和 ┨

例如:

http://www.domain.name/list_1_┠0┨<0,1,3,1,False,True>.htm

【怎样把旧版本的发布文件转换为新版的】

下载LocoySpider_V7.7_Build20130410.rar,在扩展菜单中有转换工具。

【DEDECMS V5.5 UTF-8发布模块】

1、若要火车头采集文章中的远程图片发布到本站,并自动提取文章内的缩略图,需要设置:火车头采集器内容标签里的“HTML标签排除”不勾选“图像”,并且勾选文件下载选项里的“将相对地址补全为绝对地址”,这些图没必要下载到本机,所以,文件下载选项其他选项不必勾选;

2、DEDECMS V5.5 UTF-8采集模块发布参数里remote=1下载远程图片和资源(总开关:DEDECMS系统基本参数-其他选项-远程图片本地化),autolitpic=1提取第一个图片为缩略图(总开关:DEDECMS V5.5 UTF-8系统基本参数-其他选项-提取第一张图片作为缩略图),needwatermark=1图片是否加水印(总开关:DEDECMS图片水印设置-上传的图片是否使用图片水印功能,下面个“采集的图片是否使用图片水印功能”指的是DEDE内置的采集系统,你若是使用火车头,此选项可不必理会)

3、有时采集的图片过大,会撑破页面布局,这时你可以在火车头采集时自动替换“<img ”为“<img width=”宽度” height=”高度””,但这种可能会造成图片不成比例变形,推荐使用javascript来控制图片自成比例大小,即替换“<img”为“<img onload=”ResizeImage(this,580)””

4、火车头WEB在线发布模块里,同一个标签在文章发表参数的POST数据里不能出现两次,否则出错,比如很多人想让关键词和标签一致,会这样写tags=[标签:标签]&keywords=[标签:标签],这是会出错的,你可以让关键词在采集时自动截取TAGS字符来解决这个问题

5、DEDECMS采集POST数据参数arcrank建议值为-1,是文章发布后并不立刻生成,待审核的意思,这样可以确保在发表之前,能从DEDECMS V5.5 UTF-8后台进行编辑

6、火车头DEDECMS在线发布模块登录,建议使用火车头采集器内置浏览器中登录,获取COOKIE,验证码易出错

7、我的火车头采集器POST数据:title=[标签:标题]&shorttitle=[标签:SY_小标题]&tags=[标签:标签]&keywords=[标签:SY_关键词]&description=[标签:SY_摘要]&body=

[标签:内容]&typeid=[分类ID]&typeid2=&source=[标签:来源]&pubdate=[标签:时间]&click=[标签:点击]&picname=&litpic=&ddisremote=&writer=&dede_addonfields=&remote=1&autolitpic=1&needwatermark=1&sptype=hand&spsize=5&notpost=0&sortup=0&color=&arcrank=-1&money=0&ishtml=1&filename=&flags[]=&redirecturl=&channelid=1&dopost=save&templet=

8、采集模块登陆时总是提示刷新列表错误或者读取验证码失败,多半是因为验证码生成文件不在DEDECMS的后台管理路径里,而火车头采集模块地址是CMS路径地址+验证码地址,一般人CMS路径都是填成qqcampus.org/dede这样,验证码地址是/include/vdimgck.php,这样加一块就是qqcampus.org/dede/include/vdimgck.php,这是错误的,实际的是qqcampus.org/include/vdimgck.php,所以火车头采集器读取验证码失败,常用的解决方法是,CMS路径不要加后台目录,找个都加到后面每个实际路径里,或者手动关闭DEDECMS的后台登陆验证码,方法:dede/login.php找到if($validate==” || $validate != $svali)替换为if(false)

9、本次所使用火车头版本:火车采集器2009SP4正式版

10、下载dede-5.5-utf8 http://yunfile.com/file/mirrorms/b7ab6cfa/

火车头的默认数据存储软件SQLLite:

火车头的采集数据早年存在Access软件中。现在默认存储SQLLite中。

SQLite是一个小型的C程序库,实现了独立的,可嵌入的,零配置的SQL数据库引擎。

SQLLite的可视化管理软件:SQLite Expert Pro

下载:http://www.cr173.com/soft/36343

教程:
1. 安装:运行 “SQLiteExpertSetup.exe” 安装,这个版本不是最新版,当提示更新时,关闭提示窗口。
2. 注册:启动SQLiteExpertPro,Help》Register,选择license3.key,导入即可完成注册。
3. 禁止更新:Tools》Options > Updates 设置为 Never 即可