侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

详解用Python实现自动化监控远程服务器

Python  /  管理员 发布于 7年前   197

最近发现Python课器做很多事情,在监控服务器有其独特的优势,耗费资源少,开发周期短。

首先我们做一个定时或者实时脚本timedtask.py,让其定时监控目标服务器,两种方式:

第一种:

#!/usr/bin/env python# -*- coding: utf-8 -*-# @Time  : 2017/11/27 15:59# @Desc  : 定时任务,以需要的时间间隔执行某个命令# @File  : timedtask.py# @Software: PyCharm import time, osfrom monitorserver import alltask  def roll_back(cmd, inc = 60):  while True:    #执行方法,函数    alltask()    time.sleep(inc) roll_back("echo %time%", 5)

第二种:

#!/usr/bin/env python# -*- coding: utf-8 -*-# @Time  : 2017/11/27 15:59# @Desc  : 定时任务,以需要的时间间隔执行某个命令# @File  : timedtask.py# @Software: PyCharm import time, os def roll_back(cmd, inc = 60):  while True:    #监控代码文件所在位置    os.system('python /home/../monitorserver.py');    time.sleep(inc) roll_back("echo %time%", 5)

做过监控应该都知道,我们主要监控服务器,负载均衡、磁盘、内存、CPU、网络接口(流量)、端口代码,主要针对这些,我做了以下远程监控,第一种和第二种监控代码一样,代码monitorserver.py如下:

#!/usr/bin/env python# -*- coding: utf-8 -*-# @Time  : 2017/11/27 15:59# @Desc  : 服务器监控代码# @File  : monitorserver.py# @Software: PyCharm import pexpectimport re import timeimport threading """主方法127.0.0.1#远程服务器ip地址"""def ssh_command(user, host, password, command):  ssh_new_key = 'Are you sure you want to continue connecting'  child = pexpect.spawn('ssh -l %s %s %s' % (user, host, command))  i = child.expect([pexpect.TIMEOUT, ssh_new_key, 'password: '])  if i == 0:    print 'ERROR!'    print 'SSH could not login. Here is what SSH said:'    print child.before, child.after    return None  if i == 1:    child.sendline('yes')    child.expect('password: ')    i = child.expect([pexpect.TIMEOUT, 'password: '])    if i == 0:      print 'ERROR!'      print 'SSH could not login. Here is what SSH said:'      print child.before, child.after      return None  child.sendline(password)  return child  """内存监控"""def mem_info():   child = ssh_command("远程服务器用户名", "127.0.0.1", "远程服务器密码", "cat /proc/meminfo")  child.expect(pexpect.EOF)  mem = child.before  mem_values = re.findall("(\d+)\ kB", mem)  MemTotal = mem_values[0]  MemFree = mem_values[1]  Buffers = mem_values[2]  Cached = mem_values[3]  SwapCached=mem_values[4]  SwapTotal = mem_values[13]  SwapFree = mem_values[14]  print '******************************内存监控*********************************'  print "*******************时间:", time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()), "******************"  print "总内存:",MemTotal  print "空闲内存:", MemFree  print "给文件的缓冲大小:",Buffers  print "高速缓冲存储器使用的大小:", Cached  print "被高速缓冲存储用的交换空间大小:", SwapCached  print "给文件的缓冲大小:", Buffers  if int(SwapTotal) == 0:    print u"交换内存总共为:0"  else:    Rate_Swap = 100 - 100*int(SwapFree)/float(SwapTotal)    print u"交换内存利用率:", Rate_Swap  Free_Mem = int(MemFree) + int(Buffers) + int(Cached)  Used_Mem = int(MemTotal) - Free_Mem  Rate_Mem = 100*Used_Mem/float(MemTotal)  print u"内存利用率:", str("%.2f" % Rate_Mem), "%"  """内核线程、虚拟内存、磁盘、陷阱和 CPU 活动的统计信息"""def vm_stat_info():  child = ssh_command("远程服务器用户名", "127.0.0.1", "远程服务器密码", "vmstat 1 2 | tail -n 1")  child.expect(pexpect.EOF)  vmstat_info = child.before.strip().split()  processes_waiting = vmstat_info[0]  processes_sleep = vmstat_info[1]  swpd = vmstat_info[2]  free = vmstat_info[3]  buff = vmstat_info[4]  cache = vmstat_info[5]  si = vmstat_info[6]  so = vmstat_info[7]  io_bi = vmstat_info[8]  io_bo = vmstat_info[9]  system_interrupt = vmstat_info[10]  system_context_switch = vmstat_info[11]  cpu_user = vmstat_info[12]  cpu_sys = vmstat_info[13]  cpu_idle = vmstat_info[14]  cpu_wait = vmstat_info[15]  st=vmstat_info[16]  print '****************************内核线程、虚拟内存、磁盘、陷阱和 CPU 活动的统计信息监控****************************'  print "*******************时间:", time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()), "******************"  print "等待运行进程的数量:", processes_waiting  print "处于不间断状态的进程:", processes_sleep  print "使用虚拟内存(swap)的总量:", swpd  print "空闲的内存总量:", free  print "用作缓冲的内存总量:", buff  print "用作缓存的内存总量:", cache  print "交换出内存总量 :", si  print "交换入内存总量 :", so  print "从一个块设备接收:", io_bi  print "发送到块设备:", io_bo  print "每秒的中断数:", system_interrupt  print "每秒的上下文切换数:", system_context_switch  print "用户空间上进程运行的时间百分比:", cpu_user  print "内核空间上进程运行的时间百分比:", cpu_sys  print "闲置时间百分比:", cpu_idle  print "等待IO的时间百分比:", cpu_wait  print "从虚拟机偷取的时间百分比:", st  '''cpu监控'''def cpu_info():  child = ssh_command("远程服务器用户名", "127.0.0.1", "远程服务器密码", "cat /proc/cpuinfo")  child.expect(pexpect.EOF)  cpuinfo = child.before  cpu_num = re.findall('processor.*?(\d+)', cpuinfo)[-1]  cpu_num = str(int(cpu_num) + 1)  print '***************************************cpu监控***************************************'  print "*******************时间:", time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()), "******************"  print u"CPU数目:", cpu_num  li = cpuinfo.replace('\t', '').split('\r')  CPUinfo = {}  procinfo = {}  nprocs = 0  for line in li:    if line.find("processor") > -1:      CPUinfo['CPU%s' % nprocs] = procinfo      nprocs = nprocs + 1    else:      if len(line.split(':')) == 2:        procinfo[line.split(':')[0].strip()] = line.split(':')[1].strip()      else:        procinfo[line.split(':')[0].strip()] = ''  for processor in CPUinfo.keys():    print "CPU属于的名字及其编号、标称主频:",CPUinfo[processor]['model name']    print "CPU属于其系列中的哪一代的代号:", CPUinfo[processor]['model']    print "CPU制造商:", CPUinfo[processor]['vendor_id']    print "CPU产品系列代号:", CPUinfo[processor]['cpu family']    print "CPU的实际使用主频:", CPUinfo[processor]['cpu MHz']  """负载均衡"""def load_stat():  child = ssh_command("远程服务器用户名", "127.0.0.1", "远程服务器密码", "cat /proc/loadavg")  child.expect(pexpect.EOF)  loadavgs = child.before.strip().split()  print '************************负载均衡监控****************************'  print "*******************时间:",time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()),"******************"  print "系统5分钟前的平均负载:", loadavgs[0]  print "系统10分钟前的平均负载:", loadavgs[1]  print "系统15分钟前的平均负载:", loadavgs[2]  print "分子是正在运行的进程数,分母为总进程数:",loadavgs[3]  print "最近运行的进程id:", loadavgs[4]   """获取网络接口的输入和输出"""def ionetwork():  child = ssh_command("远程服务器用户名", "127.0.0.1", "远程服务器密码", "cat /proc/net/dev")  child.expect(pexpect.EOF)  netdata = child.before  li = netdata.strip().split('\n')  print '************************获取网络接口的输入和输出监控****************************'  print "*******************时间:",time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()),"******************"  net = {}  for line in li[2:]:    line = line.split(":")    eth_name = line[0].strip()    # if eth_name != 'lo':    net_io = {}    net_io['Receive'] = round(float(line[1].split()[0]) / (1024.0 * 1024.0), 2)    net_io['Transmit'] = round(float(line[1].split()[8]) / (1024.0 * 1024.0), 2)    net[eth_name] = net_io  print net  """ 磁盘空间监控"""def disk_stat():  child = ssh_command("远程服务器用户名", "127.0.0.1", "远程服务器密码", "df -h")  child.expect(pexpect.EOF)  disk = child.before  disklist = disk.strip().split('\n')  disklists=[]  for disk in disklist:    disklists.append(disk.strip().split())  print '************************磁盘空间监控****************************'  print "*******************时间:", time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()), "******************"  for i in disklists[1:]:    print "\t文件系统:", i[0],    print "\t容量:", i[1],    print "\t已用:", i[2],    print "\t可用:", i[3],    print "\t已用%挂载点:", i[4]  """ 端口监控一般是远程服务器用户名用户"""def getComStr():  child = ssh_command("远程服务器用户名", "127.0.0.1", "远程服务器密码", "netstat -tpln")  child.expect(pexpect.EOF)  Com = child.before  print '******************************端口监控*********************************'  print "*******************时间:", time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()), "******************"  print Com   """获取网络接口的输入和输出"""def cpu():  child = ssh_command("远程服务器用户名", "127.0.0.1", "远程服务器密码", 'cat /proc/stat | grep "cpu "')  child.expect(pexpect.EOF)  child1 = ssh_command("远程服务器用户名", "127.0.0.1", "远程服务器密码", 'cat /proc/stat | grep "cpu "')  child1.expect(pexpect.EOF)  cpus = child.before.strip().split()  cpus1 = child1.before.strip().split()  print '************************cpu使用情况****************************'  print "*******************时间:",time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()),"******************"  T1=int(cpus[1])+int(cpus[2])+int(cpus[3])+int(cpus[4])+int(cpus[5])+int(cpus[6])+int(cpus[8])+int(cpus[9])  T2=int(cpus1[1]) + int(cpus1[2]) + int(cpus1[3]) + int(cpus1[4] )+ int(cpus1[5] )+int( cpus1[6] )+ int(cpus1[8] )+ int(cpus1[9])  Tol=T2-T1  Idle=int(cpus1[4]) - int(cpus[4])  print '总的cpu时间1:',T1  print '总的cpu时间2:', T2  print '时间间隔内的所有时间片:', Tol  print '计算空闲时间idle:', Idle  print "计算cpu使用率:",100*(Tol-Idle)/Tol,"%" """第一种执行"""def alltask():  try:    threads = []    t1 = threading.Thread(target=mem_info)    threads.append(t1)    t2 = threading.Thread(target=vm_stat_info)    threads.append(t2)    t3 = threading.Thread(target=cpu_info)    threads.append(t3)    t4 = threading.Thread(target=load_stat)    threads.append(t4)    t5 = threading.Thread(target=ionetwork)    threads.append(t5)    t6 = threading.Thread(target=disk_stat)    threads.append(t6)    t7 = threading.Thread(target=getComStr)    threads.append(t7)    t8 = threading.Thread(target=cpu)    threads.append(t8)    for n in range(len(threads)):      threads[n].start()  except Exception, e:    print str(e) """第二种执行"""if __name__ == '__main__':  try:    threads = []    t1 = threading.Thread(target=mem_info)    threads.append(t1)    t2 = threading.Thread(target=vm_stat_info)    threads.append(t2)    t3 = threading.Thread(target=cpu_info)    threads.append(t3)    t4 = threading.Thread(target=load_stat)    threads.append(t4)    t5 = threading.Thread(target=ionetwork)    threads.append(t5)    t6 = threading.Thread(target=disk_stat)    threads.append(t6)    t7 = threading.Thread(target=getComStr)    threads.append(t7)    t8 = threading.Thread(target=cpu)    threads.append(t8)    for n in range(len(threads)):      threads[n].start()  except Exception, e:    print str(e)

监控结果如下:

接下来做的是把监控结果可视化,即可,可惜没时间做,就交给各位了!!!

花了两天时间整理的,分享给大家,希望对各位有帮助!!!

以上所述是小编给大家介绍的用Python实现自动化监控远程服务器详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对站的支持!


  • 上一条:
    python反编译学习之字节码详解
    下一条:
    Python实现打砖块小游戏代码实例
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 在python语言中Flask框架的学习及简单功能示例(0个评论)
    • 在Python语言中实现GUI全屏倒计时代码示例(0个评论)
    • Python + zipfile库实现zip文件解压自动化脚本示例(0个评论)
    • python爬虫BeautifulSoup快速抓取网站图片(1个评论)
    • vscode 配置 python3开发环境的方法(0个评论)
    • 近期文章
    • 在windows10中升级go版本至1.24后LiteIDE的Ctrl+左击无法跳转问题解决方案(0个评论)
    • 智能合约Solidity学习CryptoZombie第四课:僵尸作战系统(0个评论)
    • 智能合约Solidity学习CryptoZombie第三课:组建僵尸军队(高级Solidity理论)(0个评论)
    • 智能合约Solidity学习CryptoZombie第二课:让你的僵尸猎食(0个评论)
    • 智能合约Solidity学习CryptoZombie第一课:生成一只你的僵尸(0个评论)
    • 在go中实现一个常用的先进先出的缓存淘汰算法示例代码(0个评论)
    • 在go+gin中使用"github.com/skip2/go-qrcode"实现url转二维码功能(0个评论)
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(0个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2016-10
    • 2016-11
    • 2018-04
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2022-01
    • 2023-07
    • 2023-10
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客