侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

php实现模拟登陆方正教务系统抓取课表

php  /  管理员 发布于 7年前   98

课程格子和超级课程表这两个应用,想必大学生都很熟悉,使用自己的学号和教务系统的密码,就可以将自己的课表导入,随时随地都可以在手机上查看。

  其实稍微了解一点php的话,我们也可以做一个类似这样的web 应用。

  1,解决掉验证码

    其实这是正方的一个小bug,当我们进入登陆界面时,浏览器会去请求服务器,服务器会生成一个验证码图片。如果我们不去请求这个图片,那么正方后台也不会生成相应的        验证码,于是这样我们就有了可乘之机,让我高兴会儿~这时,我们在不填写验证码的情况下,可以很流畅的进入。大家可以在自己的电脑上禁止访问验证码的地址,然后试试这        是不是真的~当然,这只对正方有效。

  2,php 的curl 模拟登陆

    接下来就是相关代码了,相信很多人和我一样,只喜欢看例子,对于长篇大论的讲解,转头就走……不过这个习惯还是不好……废话不多说!

//模拟登陆  function curl_request($url,$post='',$cookie='', $returnCookie=0){      $curl = curl_init();      curl_setopt($curl, CURLOPT_URL, $url);      curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0)');      curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);      curl_setopt($curl, CURLOPT_AUTOREFERER, 1);      curl_setopt($curl, CURLOPT_REFERER, "这里一定要换成教务系统登陆的url"); //填写教务系统url      if($post) {        curl_setopt($curl, CURLOPT_POST, 1);        curl_setopt($curl, CURLOPT_POSTFIELDS, http_build_query($post));      }      if($cookie) {        curl_setopt($curl, CURLOPT_COOKIE, $cookie);      }      curl_setopt($curl, CURLOPT_HEADER, $returnCookie);      curl_setopt($curl, CURLOPT_TIMEOUT, 20);      curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);      $data = curl_exec($curl);      if (curl_errno($curl)) {        return curl_error($curl);      }      curl_close($curl);      if($returnCookie){        list($header, $body) = explode("\r\n\r\n", $data, 2);        preg_match_all("/Set\-Cookie:([^;]*);/", $header, $matches);        $info['cookie'] = substr($matches[1][0], 1);        $info['content'] = $body;        return $info;      }else{        return $data;      }  }

  3,教务系统登陆页面的隐藏字段

    举个栗子

复制代码 代码如下:


    这些东西在登陆的时候也是需要带上的,顺便贴出函数,顺便暴漏了博主的学校……皇家种地大学(主要是正则表达式的运用)

//登陆页面的隐藏字段  function getView(){  $url = 'http://jw.hzau.edu.cn/default2.aspx';  $result = curl_request($url);  $pattern = '//is';  preg_match_all($pattern, $result, $matches);  $res[0] = $matches[1][0];       return $res[0] ;}  //返回教室查询页面的隐藏值  private function getViewJs($cookie,$xh){    $url = "http://jw.hzau.edu.cn/xxjsjy.aspx?xh={$xh}";    $result = curl_request($url,'',$cookie);    $pattern = '//is';    preg_match_all($pattern, $result, $matches);    $res[0] = $matches[1][0];    return $res[0] ;  }

  4,cookie 的获取

function login($xh,$pwd){    $url = 'http://jw.hzau.edu.cn/default2.aspx';    $post['__VIEWSTATE'] = $this->getView();    $post['txtUserName'] = $xh; //填写学号    $post['TextBox2'] = $pwd; //填写密码    $post['txtSecretCode'] = '';    $post['lbLanguage'] = '';    $post['hidPdrs'] = '';    $post['hidsc'] = '';    $post['RadioButtonList1'] = iconv('utf-8', 'gb2312', '学生');    $post['Button1'] = iconv('utf-8', 'gb2312', '登录');    $result = curl_request($url,$post,'', 1);    return $result['cookie'];  }

  5,让我们来试试查课表的功能,格式有点乱额,大家凑合着看,我把课表转成了一个二维关联数组

//返回课表字符串private function classresult($xh,$pwd){    date_default_timezone_set("PRC"); //时区设置    $classList = "";//声明课表变量     $cookie = $this->login($xh,$pwd);    $view = $this->getViewJs($cookie,$xh);//验证密码是否正确     //如果密码正确    if (!empty($view)) {      $url = "http://jw.hzau.edu.cn/xskbcx.aspx?xh={$xh}";      $result = curl_request($url,'',$cookie); //保存的cookies      preg_match_all('/([\w\W]*?)<\/table>/',$result,$out);      $table = $out[0][0]; //获取整个课表       preg_match_all('/
([\w\W]*?)<\/td>/',$table,$out); $td = $out[1]; $length = count($td); //获得课程列表 for ($i=0; $i < $length; $i++) { $td[$i] = str_replace("
", "", $td[$i]); $reg = "/{(.*)}/"; if (!preg_match_all($reg, $td[$i], $matches)) { unset($td[$i]); } } $td = array_values($td); //将课程列表数组重新索引 $tdLength = count($td); for ($i=0; $i < $tdLength; $i++) { $td[$i] = iconv('GB2312','UTF-8',$td[$i]); } //将课表转换成数组形式 function converttoTable($table){ $list = array( 'sun' => array('1,2' => '','3,4' => '','5,6' => '','7,8' => '','9,10' => '' ), 'mon' => array('1,2' => '','3,4' => '','5,6' => '','7,8' => '','9,10' => '' ), 'tues' => array('1,2' => '','3,4' => '','5,6' => '','7,8' => '','9,10' => '' ), 'wed' => array('1,2' => '','3,4' => '','5,6' => '','7,8' => '','9,10' => '' ), 'thur' => array('1,2' => '','3,4' => '','5,6' => '','7,8' => '','9,10' => '' ), 'fri' => array('1,2' => '','3,4' => '','5,6' => '','7,8' => '','9,10' => '' ), 'sat' => array('1,2' => '','3,4' => '','5,6' => '','7,8' => '','9,10' => '' ) ); $week = array("sun"=>"周日","mon"=>"周一","tues"=>"周二","wed"=>"周三","thur"=>"周四","fri"=>"周五","sat"=>"周六"); $order = array('1,2','3,4','5,6','7,8','9,10'); foreach ($table as $key => $value) { $class = $value; foreach ($week as $key => $weekDay) {$pos = strpos($class,$weekDay);// echo $pos;if ($pos) { $weekArrayDay = $key; //获取list数组中的第一维key foreach ($order as $key => $orderClass) { $pos = strpos($class,$orderClass); if ($pos) { $weekArrayOrder = $orderClass; //获取该课程是第几节 break; } } break;} } $list[$weekArrayDay][$weekArrayOrder] = $class; } return $list; } //调用函数 return converttoTable($td); }else{ return 0; } }

  6,再试试查询空教室的功能

//空教室查询结果  public function roomresult(){    $xh = ""; //设置学号    $pwd = ""; //学号对应的密码     $cookie = $this->login($xh,$pwd);    $url = "http://jw.hzau.edu.cn/xs_main.aspx?xh={$xh}";    $result = curl_request($url,'',$cookie); //保存的cookies     $url="http://jw.hzau.edu.cn/xxjsjy.aspx?xh={$xh}";    $post['Button2'] = iconv('utf-8', 'gb2312', '空教室查询');    $post['__EVENTARGUMENT']='';    $post['__EVENTTARGET']='';    $post['__VIEWSTATE'] = $this->getViewJs($cookie,$xh);    $post['ddlDsz'] = iconv('utf-8', 'gb2312', '单');    $post['ddlSyXn'] = '2014-2015'; //学年    $post['ddlSyxq'] = '1';    $post['jslb'] = '';    $post['xiaoq'] = '';     $post['kssj']=$_GET['start']; //提交的开始查询时间     $post['sjd']=$_GET['class'];//提交的课程节次     $post['xn']='2014-2015';//所在学年    $post['xq']='2';//所在学期    $post['xqj']='6';//当天星期几    $post['dpDataGrid1:txtPageSize']=90;//每页显示条数     $result = curl_request($url,$post,$cookie,0);         preg_match_all('/]+>[^>]+span>/',$result,$out);    $tip = iconv('gb2312', 'utf-8', $out[0][3]);//获取页面前部的提示内容    preg_match_all('/([\w\W]*?)<\/table>/',$result,$out);    $table = iconv('gb2312', 'utf-8', $out[0][0]); //获取查询列表         $this->load->view("classroom",array('tip'=>$tip,'table'=>$table));  }

  总结起来就是这些了,每个学校的教务系统都不尽相同,这时我们可以借助火狐浏览器的 firebug 抓包,看看到底提交了哪些东西。

以上所述就是本文的全部内容了,希望大家能够喜欢。

您可能感兴趣的文章:

  • PHP函数分享之curl方式取得数据、模拟登陆、POST数据
  • PHP实现微信模拟登陆并给用户发送消息的方法【文字,图片,图文】
  • php模拟登陆的实现方法分析
  • php中通过curl模拟登陆discuz论坛的实现代码
  • php 论坛采集程序 模拟登陆,抓取页面 实现代码
  • PHP简单实现模拟登陆功能示例
  • php实现微信模拟登陆、获取用户列表及群发消息功能示例
  • PHP 模拟登陆MSN并获得用户信息
  • php通过curl模拟登陆DZ论坛
  • PHP模拟登陆163邮箱发邮件及获取通讯录列表的方法
  • PHP 模拟登陆功能实例详解


  • 上一条:
    php结合正则批量抓取网页中邮箱地址
    下一条:
    PHP网络操作函数汇总
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • Laravel从Accel获得5700万美元A轮融资(0个评论)
    • PHP 8.4 Alpha 1现已发布!(0个评论)
    • 用Time Warden监控PHP中的代码处理时间(0个评论)
    • 在PHP中使用array_pop + yield实现读取超大型目录功能示例(0个评论)
    • Property Hooks RFC在PHP 8.4中越来越接近现实(0个评论)
    • 近期文章
    • 智能合约Solidity学习CryptoZombie第四课:僵尸作战系统(0个评论)
    • 智能合约Solidity学习CryptoZombie第三课:组建僵尸军队(高级Solidity理论)(0个评论)
    • 智能合约Solidity学习CryptoZombie第二课:让你的僵尸猎食(0个评论)
    • 智能合约Solidity学习CryptoZombie第一课:生成一只你的僵尸(0个评论)
    • 在go中实现一个常用的先进先出的缓存淘汰算法示例代码(0个评论)
    • 在go+gin中使用"github.com/skip2/go-qrcode"实现url转二维码功能(0个评论)
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(0个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 欧盟关于强迫劳动的规定的官方举报渠道及官方举报网站(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2016-10
    • 2016-11
    • 2017-06
    • 2017-07
    • 2017-08
    • 2017-09
    • 2017-11
    • 2017-12
    • 2018-01
    • 2018-02
    • 2018-03
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2020-07
    • 2020-09
    • 2021-02
    • 2021-03
    • 2021-04
    • 2021-05
    • 2021-06
    • 2021-07
    • 2021-08
    • 2021-09
    • 2021-10
    • 2021-11
    • 2021-12
    • 2022-01
    • 2022-02
    • 2022-05
    • 2022-06
    • 2022-07
    • 2022-08
    • 2022-09
    • 2022-10
    • 2022-11
    • 2022-12
    • 2023-01
    • 2023-02
    • 2023-03
    • 2023-04
    • 2023-05
    • 2023-06
    • 2023-07
    • 2023-08
    • 2023-09
    • 2023-10
    • 2023-11
    • 2023-12
    • 2024-01
    • 2024-02
    • 2024-03
    • 2024-04
    • 2024-05
    • 2024-06
    • 2024-07
    • 2024-09
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客