火车浏览器官方论坛

 找回密码
 立即注册
查看: 7852|回复: 1
打印 上一主题 下一主题

[图文] 可视化采集软件火车浏览器的变量清空和清洗示例

[复制链接]

16

主题

13

帖子

181

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
181
跳转到指定楼层
楼主
发表于 2016-7-7 14:13:18 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

    我们所熟悉的火车浏览器不止是一款可视化的采集软件,更是一个自动化的万能脚本工具,我们可以通过它使用逻辑,操作变量等,可以自由组合出功能强大又独一无二的脚本来辅助我们的工作,这里就为大家介绍一下火车浏览器变量的清空和清洗操作。

    清空变量,顾名思义就是清空变量中的内容,为什么需要清空变量呢?举例来说,当我们在循环运行一个任务时,某些变量会被重复调用来保存数据,在循环中的步骤最后就需要清空下数据,否则如果下一个循环该变量XPath提取不到值,数据就有可能混淆。再比如我们在提取网址时,每次在一页中提取网址保存至list变量后,便及时入库,那么在下一页提取网址前,需要将保存网址的list变量清空,否则下一页中的网址就会追加在上一页的网址之后,则上一页的网址就会重复入库。因此按下图清空变量即可。

     

清洗变量,则是可以去掉变量中不符合条件的数据,这里介绍下用法。首先是文本类型的变量:

(1)处理的变量:即将要处理的数据,若是勾选保存至新变量,就将处理后的数据存放在新变量中,反之,则将处理后的数据,放在处理的变量中,覆盖旧数据。

(2)删除字符串头部及尾部出现的空格

(3)删除字符串头部的字符:定义一个字符串,若你处理的数据的头部有这个字符串,则会删除。注意必须是字符串头部符合你定义的字符串才能正确的删除。

(4)删除字符串尾部的字符:定义一个需要删除的字符串,若你处理的数据尾部有这个字符串,会删除。注意必须是字符串尾部符合你定义的字符串才能正确的删除。

(5)使用分隔符将文本转换为List:将文本型变量转换成list变量的功能。

    使用分隔符:文本型变量若是以固定的分隔符间隔开,可如下图这样设置。

    使用正则表达式:若不是固定的分隔符,可以用正则表达式来写出表达式。

其次是List类型的变量,如下图:

(1)排序:将数据上下顺序颠倒

(2)内容必须包含以及内容不得包含:其中可以写多个判断条件,

条件是与的关系,则点击 ↑

条件是或的关系,则点击 |
火车浏览器的变量清空清洗操作示例大致就是上面这些了,大家还有不明白的可以联系官方客服为您解答。

回复

使用道具 举报

0

主题

16

帖子

144

积分

注册会员

Rank: 2

积分
144
沙发
发表于 2016-7-9 05:13:35 | 只看该作者
谢谢官方
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|火车浏览器  

GMT+8, 2024-11-23 09:02 , Processed in 0.064630 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表