侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

itchat和matplotlib的结合使用爬取微信信息的实例

微信(小程序)  /  管理员 发布于 7年前   170

前几天无意中看到了一片文章,《用 Python 爬了爬自己的微信朋友(实例讲解)》,这篇文章写的是使用python中的itchat爬取微信中朋友的信息,其中信息包括,昵称、性别、地理位置等,然后对这些信息进行统计并且以图像形式显示。文章对itchat的使用写的很详细,但是代码是贴图,画图使用R中的包画,我对着做了一遍,并且把他没有贴画图的代码做了一遍,画图是使用matplotlib。由于他没有贴代码,所以我把我写的贴出来供以后复制。

首先是安装itchat的包,可以使用清华大学的镜像:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple itchat

爬取微信好友男女比例:

import itchat itchat.login()friends=itchat.get_friends(update=True)[0:]male=female=other=0for i in friends[1:]: sex=i['Sex'] if sex==1:  male+=1 elif sex==2:  female+=1 else:  other+=1   total=len(friends[1:])malecol=round(float(male)/total*100,2)femalecol=round(float(female)/total*100,2)othercol=round(float(other)/total*100,2)print('男性朋友:%.2f%%' %(malecol)+'\n'+'女性朋友:%.2f%%' % (femalecol)+'\n'+'性别不明的好友:%.2f%%' %(othercol))print("显示图如下:")

 画图:柱状图和饼状图,图片如下:

import numpy as npimport matplotlib.pyplot as pltimport matplotlib as mpl#解决中文乱码不显示问题mpl.rcParams['font.sans-serif'] = ['SimHei'] #指定默认字体 mpl.rcParams['axes.unicode_minus'] = False #解决保存图像是负号'-'显示为方块的问题  map = { 'Female': (malecol, '#7199cf'), 'Male': (femalecol, '#4fc4aa'), 'other': (othercol, '#e1a7a2')} fig = plt.figure(figsize=(5,5))# 整体图的标题ax = fig.add_subplot(111)#添加一个子图ax.set_title('Gender of friends') xticks = np.arange(3)+0.15# 生成x轴每个元素的位置bar_width = 0.5# 定义柱状图每个柱的宽度names = map.keys()#获得x轴的值values = [x[0] for x in map.values()]# y轴的值colors = [x[1] for x in map.values()]# 对应颜色 bars = ax.bar(xticks, values, width=bar_width, edgecolor='none')# 画柱状图,横轴是x的位置,纵轴是y,定义柱的宽度,同时设置柱的边缘为透明ax.set_ylabel('Proprotion')# 设置标题ax.set_xlabel('Gender')ax.grid()#打开网格ax.set_xticks(xticks)# x轴每个标签的具体位置ax.set_xticklabels(names)# 设置每个标签的名字ax.set_xlim([bar_width/2-0.5, 3-bar_width/2])# 设置x轴的范围ax.set_ylim([0, 100])# 设置y轴的范围for bar, color in zip(bars, colors): bar.set_color(color)# 给每个bar分配指定的颜色 height=bar.get_height()#获得高度并且让字居上一点 plt.text(bar.get_x()+bar.get_width()/4.,height,'%.2f%%' %float(height))#写值plt.show()#画饼状图fig1 = plt.figure(figsize=(5,5))# 整体图的标题ax = fig1.add_subplot(111)ax.set_title('Pie chart')labels = ['{}\n{} %'.format(name, value) for name, value in zip(names, values)]ax.pie(values, labels=labels, colors=colors)#并指定标签和对应颜色plt.show()

爬取其他信息,对省份分类并根据个数对其排序

#用来爬去各个变量def get_var(var): variable=[] for i in friends:  value=i[var]  variable.append(value) return variable #调用函数得到各个变量,并把数据存到csv文件中,保存到桌面NickName=get_var('NickName')Sex=get_var('Sex')Province=get_var('Province')City=get_var('City')Signature=get_var('Signature') pros=set(Province)#去重prosarray=[]for item in pros: prosarray.append((item,Province.count(item)))#获取个数def by_num(p): return p[1]prosdsored=sorted(prosarray,key=by_num,reverse=True)#根据个数排序

画省份图:

#画图figpro = plt.figure(figsize=(10,5))# 整体图的标题axpro = figpro.add_subplot(111)#添加一个子图axpro.set_title('Province')xticks = np.linspace(0.5,20,20)# 生成x轴每个元素的位置bar_width = 0.8# 定义柱状图每个柱的宽度pros=[]values = []count=0for item in prosdsored: pros.append(item[0]) values.append(item[1]) count=count+1 if count>=20:  break colors = ['#FFEC8B','#FFE4C4','#FFC125','#FFB6C1','#CDCDB4','#CDC8B1','#CDB79E','#CDAD00','#CD96CD','#CD853F','#C1FFC1','#C0FF3E','#BEBEBE','#CD5C5C','#CD3700','#CD2626','#8B8970','#8B6914','#8B5F65','#8B2252']# 对应颜色 bars = axpro.bar(xticks, values, width=bar_width, edgecolor='none')axpro.set_ylabel('人数')# 设置标题axpro.set_xlabel('省份')axpro.grid()#打开网格axpro.set_xticks(xticks)# x轴每个标签的具体位置axpro.set_xticklabels(pros)# 设置每个标签的名字axpro.set_xlim(0,20)# 设置x轴的范围axpro.set_ylim([0, 100])# 设置y轴的范围 for bar, color in zip(bars, colors): bar.set_color(color)# 给每个bar分配指定的颜色 height=bar.get_height()#获得高度并且让字居上一点 plt.text(bar.get_x()+bar.get_width()/4.,height,'%.d' %float(height))#写值 plt.show()

还可以对数据进行保存:可用excel打开

#保存数据from pandas import DataFramedata={'NickName':NickName,'Sex':Sex,'Province':Province,'City':City,'Signature':Signature}frame=DataFrame(data) frame.to_csv('data.csv',index=True)

以上这篇itchat和matplotlib的结合使用爬取微信信息的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。


  • 上一条:
    Ruby微信开发的几个开源项目介绍
    下一条:
    轻松实现TensorFlow微信跳一跳的AI
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 微信模板消息改版后发送规则记录(微信订阅消息参数值内容限制说明)(1个评论)
    • 微信支付v3对接所需工具及命令(0个评论)
    • 2023年9月1日起:微信小程序必须备案才能上线运营(0个评论)
    • 腾讯官方客服回应了:微信好友上限约10000个!(1个评论)
    • 2023年做微信小程序的老铁注意:新增收费项、微信小程序获取手机号也收费了(2个评论)
    • 近期文章
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(0个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 欧盟关于强迫劳动的规定的官方举报渠道及官方举报网站(0个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf文件功能(0个评论)
    • Laravel从Accel获得5700万美元A轮融资(0个评论)
    • 在go + gin中gorm实现指定搜索/区间搜索分页列表功能接口实例(0个评论)
    • 在go语言中实现IP/CIDR的ip和netmask互转及IP段形式互转及ip是否存在IP/CIDR(0个评论)
    • PHP 8.4 Alpha 1现已发布!(0个评论)
    • Laravel 11.15版本发布 - Eloquent Builder中添加的泛型(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2016-10
    • 2017-10
    • 2018-01
    • 2020-03
    • 2021-06
    • 2021-10
    • 2022-03
    • 2023-02
    • 2023-06
    • 2023-07
    • 2023-08
    • 2023-10
    • 2023-11
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客