侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

python爬虫租房信息在地图上显示的方法

Python  /  管理员 发布于 7年前   266

本人初学python是菜鸟级,写的不好勿喷。

python爬虫用了比较简单的urllib.parse和requests,把爬来的数据显示在地图上。接下里我们话不多说直接上代码:

1.安装python环境和编辑器(自行度娘)

2.本人以58品牌公寓为例,爬取在杭州地区价格在2000-4000的公寓。

#-*- coding:utf-8 -*-from bs4 import BeautifulSoupfrom urllib.parse import urljoinimport requestsimport csvimport time

以上是需要引入的模块

url = "http://hz.58.com/pinpaigongyu/pn/{page}/?minprice=2000_4000"#已完成的页数序号,初时为0page = 0

以上的全局变量

csv_file = open(r"c:\users\****\Desktop\houoseNew.csv","a+",newline='')csv_writer = csv.writer(csv_file, delimiter=',')

自定义某个位置来保存爬取得数据,本人把爬取得数据保存为csv格式便于编辑(其中”a+”表示可以多次累加编辑在后面插入数据,建议不要使用“wb”哦!newline=”表示没有隔行)

while True:  #为了防止网站屏蔽ip,设置了时间定时器每隔5秒爬一下。打完一局农药差不多都爬取过来了。  time.sleep(5)  page +=1  #替换URL中page变量  print (url.format(page=page)+"ok")  response = requests.get(url.format(page=page))  html=BeautifulSoup(response.text)  #寻找html中DOM节点li  house_list = html.select(".list > li")  # 循环在读不到新的房源时结束  if not house_list:    break  for house in house_list:    #根据hml的DOM节点获取自己需要的数据    house_title = house.select("h2")[0].string    house_url = urljoin(url, house.select("a")[0]["href"])    house_pic = urljoin(url, house.select("img")[0]["lazy_src"])    house_info_list = house_title.split()    # 如果第一列是公寓名 则取第二列作为地址    if "公寓" in house_info_list[0] or "青年社区" in house_info_list[0]:      house_location = house_info_list[0]    else:      house_location = house_info_list[1]    house_money = house.select(".money")[0].select("b")[0].string    csv_writer.writerow([house_title, house_location, house_money,house_pic ,house_url]) #最后不要忘记关闭节流 csv_file.close()

如果网站屏蔽了你的ip,你可以做一个ip地址数组放在http的头部具体度娘一下吧。

接下来我们写html

只是简单的写了一下写的不好见谅。用的是高德地图,具体的js api可以到高德开发者上去看。

<body><div id="container"></div><div class="control-panel">  <div class="control-entry">    <label>选择工作地点:</label>    <div class="control-input">      <input id="work-location" type="text">    </div>  </div>  <div class="control-entry">    <label>选择通勤方式:</label>    <div class="control-input">      <input type="radio" name="vehicle" value="SUBWAY,BUS" onClick="takeBus(this)" checked/> 公交+地铁      <input type="radio" name="vehicle" value="SUBWAY" onClick="takeSubway(this)"/> 地铁      <input type="radio" name="vehicle" value="WALK" onClick="takeWalk(this)"/> 走路      <input type="radio" name="vehicle" value="BIKE" onClick="takeBike(this)"/> 骑车    </div>  </div>  <div class="control-entry">    <label>导入房源文件:</label>    <div class="control-input">      <input type="file" name="file" id="fileCsv"/>      <button style="margin-top: 10px;width: 50%;" onclick="changeCsv()">开始</button>    </div>  </div></div><div id="transfer-panel"></div><script>  var map = new AMap.Map("container", {    resizeEnable: true,    zoomEnable: true,    center: [120.1256856402492, 30.27289264553506],    zoom: 12  });  //添加标尺  var scale = new AMap.Scale();  map.addControl(scale);  //公交到达圈对象  var arrivalRange = new AMap.ArrivalRange();  //经度,纬度,时间(用不到),通勤方式(默认是地铁+公交+走路+骑车)  var x, y, t, vehicle = "SUBWAY,BUS";  //工作地点,工作标记  var workAddress, workMarker;  //房源标记队列  var rentMarkerArray = [];  //多边形队列,存储公交到达的计算结果  var polygonArray = [];  //路径规划  var amapTransfer;  //信息窗体对象  var infoWindow = new AMap.InfoWindow({    offset: new AMap.Pixel(0, -30)  });  //地址补完的使用  var auto = new AMap.Autocomplete({    //通过id指定输入元素    input: "work-location"  });  //添加事件监听,在选择补完的地址后调用workLocationSelected  AMap.event.addListener(auto, "select", workLocationSelected);  function takeBus(radio) {    vehicle = radio.value;    loadWorkLocation()  }  function takeSubway(radio) {    vehicle = radio.value;    loadWorkLocation()  }  function takeWalk(radio){    vehicle = radio.value;    loadWorkLocation()  }  function takeBike(radio) {    vehicle = radio.value;    loadWorkLocation()  }  //获取加载的文件  function changeCsv() {    $("#fileCsv").csv2arr(function (res) {      $.each(res, function (k, p) {        if (res[k][1]) {          //addMarkerByAddress(地址,价格,展示的图片)          addMarkerByAddress(res[k][1], res[k][2],res[k][3])        }      })    });  }  function workLocationSelected(e) {    workAddress = e.poi.name;    loadWorkLocation();  }  function loadWorkMarker(x, y, locationName) {    workMarker = new AMap.Marker({      map: map,      title: locationName,      icon: 'http://webapi.amap.com/theme/v1.3/markers/n/mark_r.png',      position: [x, y]    });  }  function loadWorkRange(x, y, t, color, v) {    arrivalRange.search([x, y], t, function (status, result) {      if (result.bounds) {        for (var i = 0; i < result.bounds.length; i++) {          //新建多边形对象          var polygon = new AMap.Polygon({map: map,fillColor: color,fillOpacity: "0.4",strokeColor: color,strokeOpacity: "0.8",strokeWeight: 1          });          //得到到达圈的多边形路径          polygon.setPath(result.bounds[i]);          polygonArray.push(polygon);        }      }    }, {      policy: v    });  }  function addMarkerByAddress(address, money,imgUrl) {    var geocoder = new AMap.Geocoder({      city: "杭州",      radius: 1000    });    geocoder.getLocation(address, function (status, result) {      var iconValue = "";      var _money=money;      if (money.indexOf("-") > -1) {        _money = money.split("-")[1];      }      //如果价格高于3000元/月在地图上显示红色,低于的话显示蓝色      if (parseFloat(_money) > 3000) {        iconValue="http://webapi.amap.com/theme/v1.3/markers/n/mark_r.png";      }else{        iconValue = "http://webapi.amap.com/theme/v1.3/markers/n/mark_b.png";      }      if (status === "complete" && result.info === 'OK') {        var geocode = result.geocodes[0];        rentMarker = new AMap.Marker({          map: map,          title: address,          icon:iconValue,          animation:"AMAP_ANIMATION_DROP",          position: [geocode.location.getLng(), geocode.location.getLat()]        })        ;        rentMarkerArray.push(rentMarker);        //鼠标点击标记显示相应的内容        rentMarker.content = "<img src='https:/article/"+imgUrl+"'/><div>房源:<a target = '_blank' href='http://bj.58.com/pinpaigongyu/?key=" + address + "'>" + address + "</a><p>价格:"+money+"</p><div>"        rentMarker.on('click', function (e) {          infoWindow.setContent(e.target.content);          infoWindow.open(map, e.target.getPosition());          if (amapTransfer) amapTransfer.clear();          amapTransfer = new AMap.Transfer({map: map,policy: AMap.TransferPolicy.LEAST_TIME,city: "杭州市",panel: 'transfer-panel'          });          amapTransfer.search([{keyword: workAddress          }, {keyword: address          }], function (status, result) {          })        });      }    })  }  function delWorkLocation() {    if (polygonArray) map.remove(polygonArray);    if (workMarker) map.remove(workMarker);    polygonArray = [];  }  function delRentLocation() {    if (rentMarkerArray) map.remove(rentMarkerArray);    rentMarkerArray = [];  }  function loadWorkLocation() {    //首先清空地图上已有的到达圈    delWorkLocation();    var geocoder = new AMap.Geocoder({      city: "杭州",      radius: 1000    });    geocoder.getLocation(workAddress, function (status, result) {      if (status === "complete" && result.info === 'OK') {        var geocode = result.geocodes[0];        x = geocode.location.getLng();        y = geocode.location.getLat();        //加载工作地点标记        loadWorkMarker(x, y);        //加载60分钟内工作地点到达圈        loadWorkRange(x, y, 60, "#3f67a5", vehicle);        //地图移动到工作地点的位置        map.setZoomAndCenter(12, [x, y]);      }    })  }</script></body>

想要获取完整的代码github:https://github.com/DIVIBEAR/pythonDemo.git
新手上路,老司机们勿喷!

以上所述是小编给大家介绍的python爬虫租房信息在地图上显示的方法详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对站的支持!


  • 上一条:
    python仿evething的文件搜索器实例代码
    下一条:
    详解如何设置Python环境变量?
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 在python语言中Flask框架的学习及简单功能示例(0个评论)
    • 在Python语言中实现GUI全屏倒计时代码示例(0个评论)
    • Python + zipfile库实现zip文件解压自动化脚本示例(0个评论)
    • python爬虫BeautifulSoup快速抓取网站图片(1个评论)
    • vscode 配置 python3开发环境的方法(0个评论)
    • 近期文章
    • 在windows10中升级go版本至1.24后LiteIDE的Ctrl+左击无法跳转问题解决方案(0个评论)
    • 智能合约Solidity学习CryptoZombie第四课:僵尸作战系统(0个评论)
    • 智能合约Solidity学习CryptoZombie第三课:组建僵尸军队(高级Solidity理论)(0个评论)
    • 智能合约Solidity学习CryptoZombie第二课:让你的僵尸猎食(0个评论)
    • 智能合约Solidity学习CryptoZombie第一课:生成一只你的僵尸(0个评论)
    • 在go中实现一个常用的先进先出的缓存淘汰算法示例代码(0个评论)
    • 在go+gin中使用"github.com/skip2/go-qrcode"实现url转二维码功能(0个评论)
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(0个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2016-10
    • 2016-11
    • 2018-04
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2022-01
    • 2023-07
    • 2023-10
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客