火车浏览器官方论坛

 找回密码
 立即注册
查看: 4217|回复: 2
打印 上一主题 下一主题

火车浏览器几种采集方法的比较

[复制链接]

15

主题

37

帖子

143

积分

注册会员

Rank: 2

积分
143
跳转到指定楼层
楼主
发表于 2014-9-24 22:11:04 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
     火车浏览器推出至今,已经推出1.1BETA5版本,功用上实现了一次次飞跃.归功于火车浏览器官方认真听取用户的意见,将用户的建议和需求及时转化到系统实现上.作为始终关注火车浏览器发展的粉丝,我将平时网站采集的几种方法总结归纳发如下:
网站内容的采集,表格和列表是主要内容,也是采集的难点.有些任务,对数据的采集准确性要求高,有些任务,对时间的要求高.以上几种方法,是本人的经验积累,希望对你有用.


1.循环提取法,火车浏览器最初支持的采集方法,将某列内容采集入LIST变量,循环这个LIST变量,用动态ID实现采集其它列数据.这种采集方法速度最慢.


2.多行提取,目前公测是火车浏览器速度最快的采集方法,但不完善,网站内容行数多的情况下容易出错.


3.JavaScript提取法,根据网站的元素ID,TAG,CLASS属性遍历DOM方法,需要用户较熟悉JavaScript语法,也是一种速度较快的采集方法.


4.计数器提取法,将多列数据存入LIST变量,用计数器将多个LIST变量的值一一提取出来.


以上4种提取方法.展现了火车浏览器灵活的应用.


回复

使用道具 举报

9

主题

57

帖子

380

积分

中级会员

Rank: 3Rank: 3

积分
380
沙发
发表于 2015-2-21 14:18:00 | 只看该作者
学习了   
回复 支持 反对

使用道具 举报

0

主题

82

帖子

8943

积分

论坛元老

Rank: 8Rank: 8

积分
8943
板凳
发表于 2016-1-14 11:43:58 | 只看该作者
多行提取最好用
欢迎加Q讨论:450902399   验证信息写火车浏览器
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|火车浏览器  

GMT+8, 2024-4-28 14:00 , Processed in 0.115002 second(s), 33 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表