我们所熟悉的火车浏览器不止是一款可视化的采集软件,更是一个自动化的万能脚本工具,我们可以通过它使用逻辑,操作变量等,可以自由组合出功能强大又独一无二的脚本来辅助我们的工作,这里就为大家介绍一下火车浏览器变量的清空和清洗操作。 清空变量,顾名思义就是清空变量中的内容,为什么需要清空变量呢?举例来说,当我们在循环运行一个任务时,某些变量会被重复调用来保存数据,在循环中的步骤最后就需要清空下数据,否则如果下一个循环该变量XPath提取不到值,数据就有可能混淆。再比如我们在提取网址时,每次在一页中提取网址保存至list变量后,便及时入库,那么在下一页提取网址前,需要将保存网址的list变量清空,否则下一页中的网址就会追加在上一页的网址之后,则上一页的网址就会重复入库。因此按下图清空变量即可。 清洗变量,则是可以去掉变量中不符合条件的数据,这里介绍下用法。首先是文本类型的变量: (1)处理的变量:即将要处理的数据,若是勾选保存至新变量,就将处理后的数据存放在新变量中,反之,则将处理后的数据,放在处理的变量中,覆盖旧数据。 (2)删除字符串头部及尾部出现的空格 (3)删除字符串头部的字符:定义一个字符串,若你处理的数据的头部有这个字符串,则会删除。注意必须是字符串头部符合你定义的字符串才能正确的删除。 (4)删除字符串尾部的字符:定义一个需要删除的字符串,若你处理的数据尾部有这个字符串,会删除。注意必须是字符串尾部符合你定义的字符串才能正确的删除。 (5)使用分隔符将文本转换为List:将文本型变量转换成list变量的功能。 使用分隔符:文本型变量若是以固定的分隔符间隔开,可如下图这样设置。 使用正则表达式:若不是固定的分隔符,可以用正则表达式来写出表达式。 其次是List类型的变量,如下图: (1)排序:将数据上下顺序颠倒 (2)内容必须包含以及内容不得包含:其中可以写多个判断条件, 条件是与的关系,则点击 ↑ 条件是或的关系,则点击 | 火车浏览器的变量清空清洗操作示例大致就是上面这些了,大家还有不明白的可以联系官方客服为您解答。
|