代码如下:
jsonData = ""
config = re.search('var config = (.*?){1,};',text)
if config!= None:
    print(config.group(0))
    jsonData = jsonData+ config.group(0)
option = re.search('var option = (.*?)};',text)
if option != None:
    print(option.group(0))
    jsonData = jsonData+ option.group(0)

# print(jsonData)
f = open("/Users/wilson/Desktop/car"+file,"a",encoding ="utf-8")
f.write(jsonData)
f.close()
抓了一些基本数据,但是没有抓全,轮毂信息没有抓到,谁能帮帮我呢,我就是想把每个车型的参数配置页面里的数据都抓出来,或者参数配置页面某几项抓出来,我看网页源码,不知道抓什么元素?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2019-10-6 21:26

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 23:30