火车浏览器官方论坛

 找回密码
 立即注册
查看: 6071|回复: 7
打印 上一主题 下一主题

建议增加一个“网页源码”输出。

[复制链接]

6

主题

10

帖子

50

积分

注册会员

Rank: 2

积分
50
跳转到指定楼层
楼主
发表于 2015-1-3 16:22:18 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
做个任务,是js/ajax的,特别是瀑布流之类的加载,网页正常查看源码是不存在需要的内容的。只有在火车浏览器下才能被提取到有内容的源码。在执行任务的时候,经过各种点击,下拉,赋值,变量改变,最后得到需要的数值。
但很多情况下,火车浏览器有优势,但相对采集器又有劣势。
如果将点击操作执行之后的网页源码存储到变量,然后将变量存储到文本或者数据库,就可以让“火车采集器”直接去读这个文本,处理比浏览器方便多了。

就一句话:在“元素”增加一项“网页源代码”,可写到变量"abcdefg(自己输入啦)"。这样,就可以将这个值给变量赋值,方便操作到其他地方。
回复

使用道具 举报

11

主题

47

帖子

199

积分

注册会员

Rank: 2

积分
199
沙发
发表于 2015-1-5 15:53:05 | 只看该作者
这个想法有点意思
回复 支持 反对

使用道具 举报

71

主题

176

帖子

641

积分

高级会员

Rank: 4

积分
641
板凳
发表于 2015-1-5 18:49:24 | 只看该作者
本帖最后由 290576138 于 2015-1-5 20:35 编辑

其实吧。源代码输出功能是有的 XPATH选取多大范围输出多大。
从网页到源代码 这个还是容易的。

从源代码变成网页,这个就困难了。

现在碰到一些FLASH网站无法采集http://bbs.locoyposter.com/post-265-1-1.html



回复 支持 反对

使用道具 举报

71

主题

176

帖子

641

积分

高级会员

Rank: 4

积分
641
地板
发表于 2015-1-5 20:19:57 | 只看该作者
本帖最后由 290576138 于 2015-1-5 20:39 编辑

假如一个网页加载的过程各种跳转进行了10次,中间跳转的步骤信息。无法获取到,这个是硬伤。

源代码怎么变成网页的问题。http://bbs.locoyposter.com/post-116-1-1.html
回复 支持 反对

使用道具 举报

6

主题

10

帖子

50

积分

注册会员

Rank: 2

积分
50
5#
 楼主| 发表于 2015-1-6 09:56:53 | 只看该作者
学习了。把这段xpath内的全部输出html到变量就有源代码了。学习了
回复 支持 反对

使用道具 举报

2

主题

9

帖子

116

积分

注册会员

Rank: 2

积分
116
6#
发表于 2015-3-30 16:22:33 | 只看该作者
cudd@163.com 发表于 2015-1-6 09:56
学习了。把这段xpath内的全部输出html到变量就有源代码了。学习了

这个功能好,非常有意义
特别像HTTP请求  回来的值   有时候里面有多个值  需要我们去采集的时候,没招
回复 支持 反对

使用道具 举报

2

主题

9

帖子

116

积分

注册会员

Rank: 2

积分
116
7#
发表于 2015-4-1 10:38:23 | 只看该作者
官方已经准备在下一个版本  进行从变量循环取值的功能
我觉得这个对于网页源码 输入一个变量,功能已经算是可以实现了
回复 支持 反对

使用道具 举报

2

主题

7

帖子

38

积分

新手上路

Rank: 1

积分
38
8#
发表于 2015-4-11 13:33:38 | 只看该作者
呵,我也提过此类 的建议了, 不过估计不好实现 ,现在是要用firebug 来做,毕竟有点不方便。
此外ff和其它 浏览器完全加载后的页面代码 多少还有点不一样。

建议在写规则的时候,用ff吧,
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|火车浏览器  

GMT+8, 2024-5-11 16:42 , Processed in 0.083326 second(s), 22 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表