火车浏览器官方论坛

 找回密码
 立即注册
查看: 2896|回复: 1

可视化采集软件火车浏览器的逻辑相关操作

[复制链接]

16

主题

13

帖子

157

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
157
发表于 2016-9-23 17:52:08 | 显示全部楼层 |阅读模式

可视化采集软件火车浏览器在编辑脚本的过程中需要对逻辑进行一系列设定,比如条件判断、循环、跳转、引用等,这里就对逻辑的具体操作简单讲解下,介绍自己的经验,希望帮助朋友们解决使用中遇到的问题。

条件判断有四种形式:1.条件判断:

1)当前页面源码

2)xpathhttp://bbs.locoyposter.com/post-21-1-1.html

在使用变量判断的时候,选择判断方式必须要选择相等。3)变量判断  

4)使用代码片段

http://bbs.locoyposter.com/forum.php?mod=viewthread&tid=75&extra=page%3D1%26filter%3Dtypeid%26typeid%3D5判断值是否大于某个值等类似的判断。具体使用方法:

2.循环:

1)在一个网址需要无限反复的采集或者填写的时候,可以使用到无限循环循环一般是稍复杂的脚本中都会用到,其功能是非常强大的。其中具体有以下几种:

2)点击固定元素:当需要重复点击同一个元素的时候,比如点击下一页,便可以使用此功能

3)点击一组固定元素:当需要依次点击页面中的一组元素时,用此功能。

4)点击指定的元素列表:将需要点击元素的xpath 放在一个list变量中,再选用此功能,就可以依次点击list变量中的xpath。

5)遍历list变量,需要访问的元素放在list变量中,然后使用循环去一一访问它,比如采集网页是,list变来那个中存放的是网址,那么循环遍历是,级那个每次比昂里的网址存放在一个文本型变量中,图示“保存至变量”步骤,设置一个变量来临时存储要访问的网址,然后将变量填入“打开网页”步骤的访问地址栏,这样就可以循环打开list变量中的网址.

6)从数据库中查询数据:使用sql语句,调用数据库的数据。与列同名的变量可直接调用该列中的数据,所以使用下面的保存至变量。具体使用方法:

http://bbs.locoyposter.com/post-222-1-1.html

7)循环执行次数:可以直接填写固定值或者使用计数器变量的值来控制循环次数。

3.跳转:跳转到其他步骤

5.结束循环:循环步骤结束4.跳出本次循环:跳出当前循环的步骤,进行下一个循环

提示(跳出循环与结束循环的区别)

跳出循环:比如有 5个数,当前循环到3,使用跳出循环,则不再进行循环3的步骤,跳出这个循环后从循环数字4开始再循环。

结束循环:同样有 5个数,当前循环到3  使用结束循环,则循环结束,不再进行下面数字的循环。

6.暂停等待:这个步骤用到会比较多,有些网页打开加载比较慢(比如登录时,页面跳转时),就设置一个暂停等待的时间。等待的时间设置固定的时间,也可使用计数器变量或者随机时间。也可以使用网页中一个标志性的xpath,作为等待指定的元素,即网页中加载出这个元素后就进行下面的操作,比如一个网页中只需要进行写值时,就可以使用输入框xpath作为等待指定元素。


回复

使用道具 举报

0

主题

3

帖子

36

积分

新手上路

Rank: 1

积分
36
发表于 2016-9-27 16:19:04 | 显示全部楼层
好文。 经常来论坛学习,翻翻各种经验贴、教程贴,希望官方多发一些此类学习贴。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|火车浏览器  

GMT+8, 2022-7-1 22:57 , Processed in 2.084213 second(s), 29 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表