火车浏览器官方论坛

标题: 火车浏览器几种采集方法的比较 [打印本页]

作者: lefengkuang2    时间: 2014-9-24 22:11
标题: 火车浏览器几种采集方法的比较
     火车浏览器推出至今,已经推出1.1BETA5版本,功用上实现了一次次飞跃.归功于火车浏览器官方认真听取用户的意见,将用户的建议和需求及时转化到系统实现上.作为始终关注火车浏览器发展的粉丝,我将平时网站采集的几种方法总结归纳发如下:
网站内容的采集,表格和列表是主要内容,也是采集的难点.有些任务,对数据的采集准确性要求高,有些任务,对时间的要求高.以上几种方法,是本人的经验积累,希望对你有用.


1.循环提取法,火车浏览器最初支持的采集方法,将某列内容采集入LIST变量,循环这个LIST变量,用动态ID实现采集其它列数据.这种采集方法速度最慢.


2.多行提取,目前公测是火车浏览器速度最快的采集方法,但不完善,网站内容行数多的情况下容易出错.


3.JavaScript提取法,根据网站的元素ID,TAG,CLASS属性遍历DOM方法,需要用户较熟悉JavaScript语法,也是一种速度较快的采集方法.


4.计数器提取法,将多列数据存入LIST变量,用计数器将多个LIST变量的值一一提取出来.


以上4种提取方法.展现了火车浏览器灵活的应用.



作者: ShineGoo    时间: 2015-2-21 14:18
学习了   
作者: lbjyuer    时间: 2016-1-14 11:43
多行提取最好用





欢迎光临 火车浏览器官方论坛 (http://bbs.locoyposter.com/) Powered by Discuz! X3.2