给你一篇微信图文,你能查到什么?

  • 2016-09-28
  • 1,020
  • 0

      • 给你一篇微信图文

        你能查到什么信息呢?

        下面我带你进入不一样的世界哦!

          • 开发

          • 教程

          • 投稿

          • 更新

          • 反馈

        • 如果对介绍不感兴趣,直接去看最后的代码

      • 我们以三篇图文为例
      •  1.http://t.cn/Rc39dil
        • 如果我们想获取这个封面图,你会怎么做呢?

      • 2

      • http://t.cn/RcujDtf

        • 如果我们想要获取这个视频,你怎么处理呢?

        • 3

      • http://t.cn/Rc3S3FG

        • 如果我们想保存这个音频文件,你怎么操作?

          • 点评

          • 上面那些都是我们可以通过,查看文章直接看到的,那么,有那些是一般我们看不到的呢?

      • 请 看

        示 例

        • 二维码

        • 可以快速分享给其他人,使其关注。

        • 公众号主页

        • 可以查看文章,以及引导用户关注!

        •  
        • 那么如何快速获得以上所有信息呢?

          • 那么我们应该从审查文章的元素开始啦!

            当然,我们可是要通过写程序最终来实现的哦!

        • 1.查看原文,无法直接找到有用信息

        • 2-1.查看普通图文源代码,可以得到以下信息

          (1):红色部分[appuin],公众号编号

          (2):绿色部分[nickname],公众号名称

          (3):蓝色部分[user_name],公众号ghid

          (4):橙色部分[round_head_img],头像

          (5):紫色部分[msg_cdn_url],封面图

            • 那么,我们就可以得到以下内容了

              2-1-1 公众号主页:

              https://mp.weixin.qq.com/mp/profile_ext?action=home&__biz=

              {appuin}#wechat_redirect

              2-1-2 公众号名称,不用说了

              2-1-4/5 两种图片同样,直接可以用

              2-2-3 公众号二维码:

              http://open.weixin.qq.com/qr/code/?username={user_name}

        • 2-2 查看含有音乐文件图文的源代码

        • 音乐参数为voice_encode_fileid后面的字符串,比如是XXX

          原始链接即为:

          https://res.wx.qq.com/voice/getvoice?mediaid=XXX

        • 2-3 查看含有视频文件图文的源代码

        • 视频参数为https://v.qq.com/iframe/preview.html?vid=YYY&中的参数YYY

          原始链接即为:

          http://v.qq.com/boke/page/d/0/v/YYY.html

        • 下面开始步入代码介绍

      • 1.抓取文章页面

        • $ch = curl_init();

          curl_setopt($ch,CURLOPT_URL,$url);

          curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);

          curl_setopt($ch,CURLOPT_USERAGENT,”Mozilla/5.0 (Linux; Android 5.0; SM-N9100 Build/LRX21V) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/37.0.0.0 Mobile Safari/537.36 MicroMessenger/6.0.2.56_r958800.520 NetType/WIFI”);

          //执行抓取

          $output = curl_exec($ch);

          //释放curl句柄

          curl_close($ch);

          //输出抓取的数据

          $str=$output;

      • 2.对抓取到的内容使用切割函数

        • //剪切content中start和end之间的的字符串

          function str_pos_str($content,$start,$end)

          {

          $u=$content;

          $uwz0=strrpos($u,$start);

          $uwz1=strrpos($u,$end);

          $ulen=$uwz1-$uwz0;

          $page=substr($u,$uwz0,$ulen);

          return $page;

          }

      • 3.对于每个要得到的字符串进行处理

        • //其他的类似

          $s=’nickname = ‘;  //切割的开始

          $e=’appmsg_type = ‘;  //切割的结尾

          $p=str_pos_str($str,$s,$e);//自定义函数

          $u=explode(‘”‘,$p);   //使用函数分离参数

          $ghname=$u[1]; //得到公众号名称

          如果仍然有疑问,可扫码关注我的个人微信平台

          qqgroup

评论

还没有任何评论,你来说两句吧