火车浏览器推出至今,已经推出1.1BETA5版本,功用上实现了一次次飞跃.归功于火车浏览器官方认真听取用户的意见,将用户的建议和需求及时转化到系统实现上.作为始终关注火车浏览器发展的粉丝,我将平时网站采集的几种方法总结归纳发如下:
网站内容的采集,表格和列表是主要内容,也是采集的难点.有些任务,对数据的采集准确性要求高,有些任务,对时间的要求高.以上几种方法,是本人的经验积累,希望对你有用.
1.循环提取法,火车浏览器最初支持的采集方法,将某列内容采集入LIST变量,循环这个LIST变量,用动态ID实现采集其它列数据.这种采集方法速度最慢.
2.多行提取,目前公测是火车浏览器速度最快的采集方法,但不完善,网站内容行数多的情况下容易出错.
3.JavaScript提取法,根据网站的元素ID,TAG,CLASS属性遍历DOM方法,需要用户较熟悉JavaScript语法,也是一种速度较快的采集方法.
4.计数器提取法,将多列数据存入LIST变量,用计数器将多个LIST变量的值一一提取出来.
以上4种提取方法.展现了火车浏览器灵活的应用.
|