您的位置:首页 > 其它

教大家怎么采集火车头 简单有效 谨记 几个要点则可

2012-09-19 00:00 316 查看
针对一些工作上 生活上 技巧上 比较费劲 费时 又找不到人来解决 辛辛苦苦花了很久时间好不容易解决好了,下次又忘记了 或者有前车之鉴 那么其他人就能站在你的肩膀上 少走弯路 节省时间了。

下面示例一番:

1, 火车头采集软件 是比较流行的 网络资源采集器 但是太过复杂 官方上的说明也是比较费劲 如果是一个新手 很难能够短时间内熟悉的。

如果要去问别人 也是爱问不答 希望越大失望越大 自己又一时半会或者没那么多时间去摸索。别人就是知道了 也不会认真的告诉你 更加不会站在

新手不懂的人基础上告知你。真所谓缺乏开成薄公之道。 其他问题也会类似 慢慢放上来 开成薄公

为此群主站在简单思维的基础上 摸索了一些小技巧 小方法 可以快速让新手入门 完成任务:

1.标签一定要与 测试那里的一模一样

假如一个网站的规则标签和发布标签如下 那么规则上一定要跟它一模一样才行否则就是测试通过了 也是没办法发布到网站上

标题

内容

原作者

来源网址

信息来源

跳转链接

发布时间

文章摘要

2添加

http标签过滤

链接

段落



去首位空白字符

3添加替换<style>(*)</style>为空

4,添加替换<img src="[参数]">为【img】[参数1]【/img】

不能有空格

<img border=1 name=MM alt= src="[参数]">

【img】[参数1]【/img】

针对腾讯新闻图片格式 其他网站看具体源码格式在做修改 如潇湘生活网的图片显示规则是那么<img border=1 name=MM alt=[参数] src=" alt="" />

下面的也替换

<img alt="[参数]" src="[参数]">

【img】[参数1]【/img】

5,取消

勾选将相对地址不全 勾选下载图片

//////////////////////////////////// 腾讯规则:

<P style="TEXT-INDENT: 2em">(*)</p> 替换为空

///////////////////潇湘生活网通用规则 因为编辑器自定义标识引起的一些问题

<p>[参数]</p> 替换为

【b】[参数1]【/b】

增加换行功能

<strong>[参数]</stong> 替换为【b】 [参数1]【/b】 增加加粗功能

这是简单有效的采集办法比较复杂 麻烦的那就自己去慢慢研究吧 本人是没那么多咸鱼功夫 能采集到一般的新闻数据就已经相当不错 减少了 大量的工作量了
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: