yangjielewell 发表于 2016-7-7 14:13:18

可视化采集软件火车浏览器的变量清空和清洗示例

    我们所熟悉的火车浏览器不止是一款可视化的采集软件,更是一个自动化的万能脚本工具,我们可以通过它使用逻辑,操作变量等,可以自由组合出功能强大又独一无二的脚本来辅助我们的工作,这里就为大家介绍一下火车浏览器变量的清空和清洗操作。    清空变量,顾名思义就是清空变量中的内容,为什么需要清空变量呢?举例来说,当我们在循环运行一个任务时,某些变量会被重复调用来保存数据,在循环中的步骤最后就需要清空下数据,否则如果下一个循环该变量XPath提取不到值,数据就有可能混淆。再比如我们在提取网址时,每次在一页中提取网址保存至list变量后,便及时入库,那么在下一页提取网址前,需要将保存网址的list变量清空,否则下一页中的网址就会追加在上一页的网址之后,则上一页的网址就会重复入库。因此按下图清空变量即可。http://www.locoy.com/Data/ueditor/image/20160707/1467871442932084.png   清洗变量,则是可以去掉变量中不符合条件的数据,这里介绍下用法。首先是文本类型的变量:http://www.locoy.com/Data/ueditor/image/20160707/1467871458899703.png(1)处理的变量:即将要处理的数据,若是勾选保存至新变量,就将处理后的数据存放在新变量中,反之,则将处理后的数据,放在处理的变量中,覆盖旧数据。(2)删除字符串头部及尾部出现的空格(3)删除字符串头部的字符:定义一个字符串,若你处理的数据的头部有这个字符串,则会删除。注意必须是字符串头部符合你定义的字符串才能正确的删除。(4)删除字符串尾部的字符:定义一个需要删除的字符串,若你处理的数据尾部有这个字符串,会删除。注意必须是字符串尾部符合你定义的字符串才能正确的删除。(5)使用分隔符将文本转换为List:将文本型变量转换成list变量的功能。    使用分隔符:文本型变量若是以固定的分隔符间隔开,可如下图这样设置。    使用正则表达式:若不是固定的分隔符,可以用正则表达式来写出表达式。http://www.locoy.com/Data/ueditor/image/20160707/1467871475723461.png其次是List类型的变量,如下图:http://www.locoy.com/Data/ueditor/image/20160707/1467871494104652.png(1)排序:将数据上下顺序颠倒(2)内容必须包含以及内容不得包含:其中可以写多个判断条件,条件是与的关系,则点击 ↑http://www.locoy.com/Data/ueditor/image/20160707/1467871527503091.png条件是或的关系,则点击 |http://www.locoy.com/Data/ueditor/image/20160707/1467871546142023.png火车浏览器的变量清空清洗操作示例大致就是上面这些了,大家还有不明白的可以联系官方客服为您解答。

老雷 发表于 2016-7-9 05:13:35

:lol:lol:lol:lol谢谢官方
页: [1]
查看完整版本: 可视化采集软件火车浏览器的变量清空和清洗示例