火车浏览器官方论坛

标题: 火车采集器和火车浏览器的区别 [打印本页]

作者: rq204    时间: 2014-12-12 09:37
标题: 火车采集器和火车浏览器的区别
1.采集原理
火车采集器使用http协议,直接抓取网页源代码,所以速度非常快。采集器主要以字符串处理为主。
火车浏览器是通过浏览器下载网页并进行渲染显示,处理速度慢,但能显示最真实的页面信息。

2.采集流程
火车采集器是采网址,采内容,发内容三个固定流程,操作简单,能处理常用大部分采集情况。
火车浏览器是没有固定流程,用户将各种功能自由组合,可以达到各种想要的功能,更灵活。
3.目的不同
火车采集器主要是采集别人网站数据发到自己网站,主要做数据抓取处理工作。
火车浏览器既可以采别人数据发到自己网站,又可以将自己数据发到别人网站,既采集又营销。


如何选择?
1.简单的数据采集,特别是不需要登录的新闻文章类的采集,使用火车采集器。
2.追求采集速度,需要大批量进行数据采集,使用火车采集器。
3.需要登录采集,验证码识别,采集中需要判断的,请使用火车浏览器。
4.网页中内容是通过ajax或是js加密后显示出来的,请使用火车浏览器。
5.通过网页群发或是营销,网页版按键精灵,请使用火车浏览器。
6.有些情况,还可以使用火车采集器和浏览器结合的方式,进行采集。


作者: jzliuhuan    时间: 2015-4-22 10:50
提示: 该帖被管理员或版主屏蔽
作者: ohio    时间: 2015-5-27 09:01
解惑~~又想速度快,但又有验证码的咋办呢
作者: cudd@163.com    时间: 2015-6-1 11:07
还可以使用火车采集器和浏览器结合的方式,进行采集。...我就是组合用。




欢迎光临 火车浏览器官方论坛 (http://bbs.locoyposter.com/) Powered by Discuz! X3.2