跳转至内容
  • 社区首页
  • 版块
  • 最新
  • 标签
  • 热门
折叠

GitHub中文论坛

  1. 主页
  2. 版块
  3. 综合交流
  4. 关于动态爬取json格式文件

关于动态爬取json格式文件

已定时 已固定 已锁定 已移动 综合交流
2 帖子 1 发布者 293 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • 96Jennifer9 离线
    96Jennifer9 离线
    96Jennifer
    写于 最后由 admin 编辑
    #1

    请问朋友们知道为什么打印text显示jQuery,里面的data为null?
    我跟着视频做的博主data里面都是字典表内容,这个是我的

    import requests
    
    headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36'}
    for i in range(1,2):
        param = {
            'cb': ' jQuery112408933494064226006_1636169759698',
            'pn': f' {i}',
            'pz': ' 20',
            'po': ' 1',
            'np': ' 1',
            'ut': ' bd1d9ddb04089700cf9c27f6f7426281',
            'fltt': ' 2',
            'invt': ' 2',
            'fid': ' f3',
            'fs': ' m:0 t:80',
            'fields': ' f1,f2,f3,f4,f5,f6,f7,f8,f9,f10,f12,f13,f14,f15,f16,f17,f18,f20,f21,f23,f24,f25,f22,f11,f62,f128,f136,f115,f152',
            '_': '1636169759852'
        }
        url = "http://49.push2.eastmoney.com/api/qt/clist/get"
        r = requests.get(url, params=param, headers=headers)
        print(r.text)
    

    8f83f02c-8850-4ea5-97ee-a335689b1151-image.png
    不知道哪里有问题?求解答。网址为“东方财富网”

    96Jennifer9 1 条回复 最后回复
    0
    • 96Jennifer9 96Jennifer

      请问朋友们知道为什么打印text显示jQuery,里面的data为null?
      我跟着视频做的博主data里面都是字典表内容,这个是我的

      import requests
      
      headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36'}
      for i in range(1,2):
          param = {
              'cb': ' jQuery112408933494064226006_1636169759698',
              'pn': f' {i}',
              'pz': ' 20',
              'po': ' 1',
              'np': ' 1',
              'ut': ' bd1d9ddb04089700cf9c27f6f7426281',
              'fltt': ' 2',
              'invt': ' 2',
              'fid': ' f3',
              'fs': ' m:0 t:80',
              'fields': ' f1,f2,f3,f4,f5,f6,f7,f8,f9,f10,f12,f13,f14,f15,f16,f17,f18,f20,f21,f23,f24,f25,f22,f11,f62,f128,f136,f115,f152',
              '_': '1636169759852'
          }
          url = "http://49.push2.eastmoney.com/api/qt/clist/get"
          r = requests.get(url, params=param, headers=headers)
          print(r.text)
      

      8f83f02c-8850-4ea5-97ee-a335689b1151-image.png
      不知道哪里有问题?求解答。网址为“东方财富网”

      96Jennifer9 离线
      96Jennifer9 离线
      96Jennifer
      写于 最后由 admin 编辑
      #2

      @96jennifer 原因找到了
      因为param中批量加入引号,引号与内容有空格,
      更新代码

      import requests
      
      headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36'}
      for i in range(1,55):
          param = {
              'cb': 'jQuery112408933494064226006_1636169759698',
              'pn': f'{i}',
              'pz': '20',
              'po': '1',
              'np': '1',
              'ut': 'bd1d9ddb04089700cf9c27f6f7426281',
              'fltt': '2',
              'invt': '2',
              'fid': 'f3',
              'fs': 'm:0 t:80',
              'fields': 'f1,f2,f3,f4,f5,f6,f7,f8,f9,f10,f12,f13,f14,f15,f16,f17,f18,f20,f21,f23,f24,f25,f22,f11,f62,f128,f136,f115,f152',
              '_': '1636169759852'
          }
          url = "http://90.push2.eastmoney.com/api/qt/clist/get"
          r = requests.get(url, params=param, headers=headers)
          print(r.text)
      
      1 条回复 最后回复
      0
      回复
      • 在新帖中回复
      登录后回复
      • 从旧到新
      • 从新到旧
      • 最多赞同


      • 登录

      • 第一个帖子
        最后一个帖子
      0
      • 社区首页
      • 版块
      • 最新
      • 标签
      • 热门