任务名称为

知网赤沙教学二层


举报 使用道具
| 回复

共 9 个关于本帖的回复 最后回复于 2022-4-1 13:48

沙发
Fuller 管理员 发表于 2022-3-31 22:59:22 | 只看该作者
第一级规则名是什么?要从第一级开始运行,由第一级输入搜索条件
举报 使用道具
板凳
kodiaxu 高级会员 发表于 2022-3-31 23:17:44 | 只看该作者
第一层为 知网赤沙教学,写写
举报 使用道具
地板
kodiaxu 高级会员 发表于 2022-3-31 23:18:15 | 只看该作者
名称为   知网赤沙教学   谢谢
举报 使用道具
5#
kodiaxu 高级会员 发表于 2022-3-31 23:18:42 | 只看该作者
Fuller 发表于 2022-3-31 22:59
第一级规则名是什么?要从第一级开始运行,由第一级输入搜索条件

任务名叫  知网赤沙教学  谢谢
举报 使用道具
6#
Fuller 管理员 发表于 2022-4-1 09:11:05 | 只看该作者
第一个动作不能用“选择”类型,选择类型只用于网页上的select节点。所以,在这里要用两个点击。第一个点击是把菜单点开,第二个点击是点每个选项。

每个动作的“交互位置”表达式那里不能填绝对定位的xpath,而是使用偏好class的xpath。因为,做了一次动作以后,就进入了列表页面。跟首页是完全不一样的结构,绝对定位xpath就失效了,就没法点击第二个选项了。还好,如果采用偏好class,xpath相同。

举报 使用道具
7#
kodiaxu 高级会员 发表于 2022-4-1 11:59:01 | 只看该作者
Fuller 发表于 2022-4-1 09:11
第一个动作不能用“选择”类型,选择类型只用于网页上的select节点。所以,在这里要用两个点击。第一个点击 ...

但是这个网页上面class定位出来的不是唯一的,有十多个,怎么办,谢谢
举报 使用道具
8#
kodiaxu 高级会员 发表于 2022-4-1 12:18:59 | 只看该作者
Fuller 发表于 2022-4-1 09:11
第一个动作不能用“选择”类型,选择类型只用于网页上的select节点。所以,在这里要用两个点击。第一个点击 ...

请问第二个点击需要一个个点击吗,具体怎么做啊
如果只是想选择第三个 “关键词” 呢
举报 使用道具
9#
Fuller 管理员 发表于 2022-4-1 13:40:42 | 只看该作者
kodiaxu 发表于 2022-4-1 11:59
但是这个网页上面class定位出来的不是唯一的,有十多个,怎么办,谢谢

可以这样写: (某某xpath)[1],表示第一个节点
举报 使用道具
10#
Fuller 管理员 发表于 2022-4-1 13:48:02 | 只看该作者
kodiaxu 发表于 2022-4-1 12:18
请问第二个点击需要一个个点击吗,具体怎么做啊
如果只是想选择第三个 “关键词” 呢
...

如果要点击多个选项,那么需要一个xpath,能够定位到多个节点,这样,爬虫就会挨个点。如果你只想点击“关键词”,这就简单了,用这个xpath
  1. (//*[@class='sort-list'])[1]/ul[position()=1]/li[position()=5]
复制代码


像下图,输入搜索框,点击搜索按钮,就能看到只搜到一个节点


给这样的网页定义规则比较麻烦,如果觉得操作起来太麻烦,可以委托我们定义采集规则。可以加入集搜客qq群(661795153),找管理员。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-24 05:12