火车浏览器官方论坛

 找回密码
 立即注册
查看: 12685|回复: 8
打印 上一主题 下一主题

[视频] 数据采集发布防重复

[复制链接]

20

主题

49

帖子

257

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
257
跳转到指定楼层
楼主
发表于 2015-8-19 10:59:22 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
此节视频概要:
发布:
1.项目管理器读入网址,标记为已发  防止重复发布,循环中同理
采集:
1.项目管理器读入网址采集其中详细内容,采集并update 信息,防止重复采集。还有脚本的循环中读入同理
2.重复采集一个网站时,比如采集其中的网址信息的时候,已经入库的信息不再入库:(两种方式:1.设置列为unique,2.设置从数据库查询数据,如果有这个数据就不再入库)
3.关键词采集,已采集的关键词不再采集。两种情况(1.关键词放在数据库中,标记为已发  2.关键词放在文本中,使用exe中的批量查询。)


功能点:
防重复

视频播放及下载地址:http://pan.baidu.com/s/1gd4LFsJ

如果您对此节视频有任何意见和建议,可以回帖说明,感谢大家对我们软件的支持。

火车浏览器视频教程征集活动,奖励多多~~~ http://bbs.locoyposter.com/post-374-1-1.html

回复

使用道具 举报

11

主题

47

帖子

199

积分

注册会员

Rank: 2

积分
199
沙发
发表于 2015-8-29 15:06:18 | 只看该作者
好教程,我顶
回复 支持 反对

使用道具 举报

20

主题

49

帖子

257

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
257
板凳
 楼主| 发表于 2015-8-31 08:40:21 | 只看该作者

水的太明显
回复 支持 反对

使用道具 举报

0

主题

1

帖子

20

积分

新手上路

Rank: 1

积分
20
地板
发表于 2015-8-31 10:01:16 | 只看该作者
留个脚!!!!!!!!!!
回复

使用道具 举报

4

主题

33

帖子

160

积分

注册会员

Rank: 2

积分
160
5#
发表于 2016-1-19 22:47:14 | 只看该作者
管理员,我看了教程,最后那个判断那里没看明白,能否说的详细点,你最后那个判断有什么用处,直接判断网址不是可以吗,还有已采和已发你没有写出判断啊
请把最后说的详细点,谢谢
回复 支持 反对

使用道具 举报

4

主题

33

帖子

160

积分

注册会员

Rank: 2

积分
160
6#
发表于 2016-1-19 22:48:51 | 只看该作者
我说一下我的思路,看是不是正确的
  1. 新建两个字段已发已采,发布成功后,用SQL语句标注已发。
  2. 这样子写正确吗
  3. INSERT INTO links1 (网址,已采,已发) VALUES ('{-var.版块网址-}','-1',-1')
  4. {-var.版块网址-}表示已发网址变量,-1分别表示已采和已发
  5. 这样写好之后
  6. 调用数据的时候用查询语句来判断是不是已经发布过或者采集过,
  7. 这样写正确吗
  8. select title as 标题,content as 正文内容 from datamemer where 已发=1 and 已采=1
  9. 1分别表示还没采和还没发的,这样和-1进行对比,就可以判断了对吗

  10. 循环发布调用数据库
复制代码
回复 支持 反对

使用道具 举报

9

主题

57

帖子

380

积分

中级会员

Rank: 3Rank: 3

积分
380
7#
发表于 2016-5-13 16:25:27 | 只看该作者
dodd001 发表于 2016-1-19 22:48
我说一下我的思路,看是不是正确的

用where * in (select * from*)也可以的
回复 支持 反对

使用道具 举报

9

主题

57

帖子

380

积分

中级会员

Rank: 3Rank: 3

积分
380
8#
发表于 2016-5-13 16:26:50 | 只看该作者
dodd001 发表于 2016-1-19 22:48
我说一下我的思路,看是不是正确的

用where * in (select * from*)也可以的
回复 支持 反对

使用道具 举报

4

主题

33

帖子

160

积分

注册会员

Rank: 2

积分
160
9#
发表于 2016-6-5 09:57:31 | 只看该作者
我用了视频的方法,发现变量“判断”值为空,为什么,按照教程一步一步来的
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|火车浏览器  

GMT+8, 2024-4-24 11:20 , Processed in 0.101063 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表