11 28418

大神两步解释集搜客抓取原理

wangyong 于 2015-11-24 17:14 发表 置顶 [复制链接]
本帖最后由 xandy 于 2016-11-11 14:49 编辑

原理很简单:
第一步:建立一个整理箱,这里就是存储你要抓的内容
第二步:告诉程序,网页上的什么内容要丢到整理箱中。
剩下的就由程序自动做了。
开机窗口显示要领 - 使用图2.png

两个新词别怕:
1,整理箱:前面在第一步中已经说了,放东西的,放抓取内容
2,映射:就是第二步要做的事,用“映射”告诉程序:网页上哪些内容是要采的

有些网页本身比较复杂,有些网页结构很乱,就得去一点点掌握些技巧。纯小白入门,可以从一个最简单的教程开始。
所以刚接触集搜客的同学不要觉得集搜客比较难有所畏惧,教程为大家都科学的规划好了,一步一步的学习,数据抓取其实没有大家想象的那么难。

开始阅读《从入门到精通

举报 使用道具
| 回复

共 11 个关于本帖的回复 最后回复于 2019-11-1 16:16

wangyong 版主 发表于 2019-11-1 16:16:19 | 显示全部楼层
举报 使用道具
xandy 论坛元老 发表于 2015-11-25 09:51:13 | 显示全部楼层
还是从小白开始
举报 使用道具
elegantcoin 中级会员 发表于 2016-9-1 11:57:48 | 显示全部楼层
还是从小白开始
举报 使用道具
lichenghai20 新手上路 发表于 2016-9-12 08:32:13 | 显示全部楼层
还是从小白开始!看不懂啊
举报 使用道具
markjl 新手上路 发表于 2016-10-8 17:27:31 | 显示全部楼层
哪里有下载链接?
举报 使用道具
Fuller 管理员 发表于 2016-10-8 17:30:14 | 显示全部楼层
markjl 发表于 2016-10-8 17:27
哪里有下载链接?

下载软件在这里:http://www.gooseeker.com/pro/product.html

分mac版和windows版
举报 使用道具
markjl 新手上路 发表于 2016-10-8 17:43:46 | 显示全部楼层
收到,谢谢!
举报 使用道具
fujiale 新手上路 发表于 2016-12-12 21:50:11 | 显示全部楼层
感觉比火车头简单多了
举报 使用道具
kingzmf 新手上路 发表于 2016-12-30 08:53:01 | 显示全部楼层
还是从小白开始
举报 使用道具
skyup123 新手上路 发表于 2017-3-15 22:18:19 | 显示全部楼层
好棒
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 00:07