侯体宗的博客
  • 首页
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

Python中使用支持向量机(SVM)算法

Python  /  管理员 发布于 7年前   165

在机器学习领域,支持向量机SVM(Support Vector Machine)是一个有监督的学习模型,通常用来进行模式识别、分类(异常值检测)以及回归分析。

其具有以下特征:

   (1)SVM可以表示为凸优化问题,因此可以利用已知的有效算法发现目标函数的全局最小值。而其他分类方法都采用一种基于贪心学习的策略来搜索假设空间,这种方法一般只能获得局部最优解。
  (2) SVM通过最大化决策边界的边缘来实现控制模型的能力。尽管如此,用户必须提供其他参数,如使用核函数类型和引入松弛变量等。
  (3)SVM一般只能用在二类问题,对于多类问题效果不好。

1. 下面是代码及详细解释(基于sklearn包):

from sklearn import svmimport numpy as npimport matplotlib.pyplot as plt#准备训练样本x=[[1,8],[3,20],[1,15],[3,35],[5,35],[4,40],[7,80],[6,49]]y=[1,1,-1,-1,1,-1,-1,1]##开始训练clf=svm.SVC() ##默认参数:kernel='rbf'clf.fit(x,y)#print("预测...")#res=clf.predict([[2,2]]) ##两个方括号表面传入的参数是矩阵而不是list##根据训练出的模型绘制样本点for i in x:  res=clf.predict(np.array(i).reshape(1, -1))  if res > 0:    plt.scatter(i[0],i[1],c='r',marker='*')  else :    plt.scatter(i[0],i[1],c='g',marker='*')##生成随机实验数据(15行2列)rdm_arr=np.random.randint(1, 15, size=(15,2))##回执实验数据点for i in rdm_arr:  res=clf.predict(np.array(i).reshape(1, -1))  if res > 0:    plt.scatter(i[0],i[1],c='r',marker='.')  else :    plt.scatter(i[0],i[1],c='g',marker='.')##显示绘图结果plt.show()

结果如下图:

从图上可以看出,数据明显被蓝色分割线分成了两类。但是红色箭头标示的点例外,所以这也起到了检测异常值的作用。

2.在上面的代码中提到了kernel='rbf',这个参数是SVM的核心:核函数

重新整理后的代码如下:      

from sklearn import svmimport numpy as npimport matplotlib.pyplot as plt##设置子图数量fig, axes = plt.subplots(nrows=2, ncols=2,figsize=(7,7))ax0, ax1, ax2, ax3 = axes.flatten()#准备训练样本x=[[1,8],[3,20],[1,15],[3,35],[5,35],[4,40],[7,80],[6,49]]y=[1,1,-1,-1,1,-1,-1,1]'''  说明1:    核函数(这里简单介绍了sklearn中svm的四个核函数,还有precomputed及自定义的)      LinearSVC:主要用于线性可分的情形。参数少,速度快,对于一般数据,分类效果已经很理想  RBF:主要用于线性不可分的情形。参数多,分类结果非常依赖于参数  polynomial:多项式函数,degree 表示多项式的程度-----支持非线性分类  Sigmoid:在生物学中常见的S型的函数,也称为S型生长曲线  说明2:根据设置的参数不同,得出的分类结果及显示结果也会不同  '''##设置子图的标题titles = ['LinearSVC (linear kernel)',      'SVC with polynomial (degree 3) kernel',      'SVC with RBF kernel',   ##这个是默认的     'SVC with Sigmoid kernel']##生成随机试验数据(15行2列)rdm_arr=np.random.randint(1, 15, size=(15,2))def drawPoint(ax,clf,tn):  ##绘制样本点  for i in x:    ax.set_title(titles[tn])    res=clf.predict(np.array(i).reshape(1, -1))    if res > 0:      ax.scatter(i[0],i[1],c='r',marker='*')    else :      ax.scatter(i[0],i[1],c='g',marker='*')   ##绘制实验点  for i in rdm_arr:    res=clf.predict(np.array(i).reshape(1, -1))    if res > 0:      ax.scatter(i[0],i[1],c='r',marker='.')    else :      ax.scatter(i[0],i[1],c='g',marker='.')if __name__=="__main__":  ##选择核函数  for n in range(0,4):    if n==0:      clf = svm.SVC(kernel='linear').fit(x, y)      drawPoint(ax0,clf,0)    elif n==1:      clf = svm.SVC(kernel='poly', degree=3).fit(x, y)      drawPoint(ax1,clf,1)    elif n==2:      clf= svm.SVC(kernel='rbf').fit(x, y)      drawPoint(ax2,clf,2)    else :      clf= svm.SVC(kernel='sigmoid').fit(x, y)      drawPoint(ax3,clf,3)  plt.show()

结果如图:

由于样本数据的关系,四个核函数得出的结果一致。在实际操作中,应该选择效果最好的核函数分析。

3.在svm模块中还有一个较为简单的线性分类函数:LinearSVC(),其不支持kernel参数,因为设计思想就是线性分类。如果确定数据

可以进行线性划分,可以选择此函数。跟kernel='linear'用法对比如下:

from sklearn import svmimport numpy as npimport matplotlib.pyplot as plt##设置子图数量fig, axes = plt.subplots(nrows=1, ncols=2,figsize=(7,7))ax0, ax1 = axes.flatten()#准备训练样本x=[[1,8],[3,20],[1,15],[3,35],[5,35],[4,40],[7,80],[6,49]]y=[1,1,-1,-1,1,-1,-1,1]##设置子图的标题titles = ['SVC (linear kernel)',      'LinearSVC']##生成随机试验数据(15行2列)rdm_arr=np.random.randint(1, 15, size=(15,2))##画图函数def drawPoint(ax,clf,tn):  ##绘制样本点  for i in x:    ax.set_title(titles[tn])    res=clf.predict(np.array(i).reshape(1, -1))    if res > 0:      ax.scatter(i[0],i[1],c='r',marker='*')    else :      ax.scatter(i[0],i[1],c='g',marker='*')  ##绘制实验点  for i in rdm_arr:    res=clf.predict(np.array(i).reshape(1, -1))    if res > 0:      ax.scatter(i[0],i[1],c='r',marker='.')    else :      ax.scatter(i[0],i[1],c='g',marker='.')if __name__=="__main__":  ##选择核函数  for n in range(0,2):    if n==0:      clf = svm.SVC(kernel='linear').fit(x, y)      drawPoint(ax0,clf,0)    else :      clf= svm.LinearSVC().fit(x, y)      drawPoint(ax1,clf,1)  plt.show()

结果如图所示:

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。


  • 上一条:
    详解用Python处理HTML转义字符的5种方式
    下一条:
    Python中支持向量机SVM的使用方法详解
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 在python语言中Flask框架的学习及简单功能示例(0个评论)
    • 在Python语言中实现GUI全屏倒计时代码示例(0个评论)
    • Python + zipfile库实现zip文件解压自动化脚本示例(0个评论)
    • python爬虫BeautifulSoup快速抓取网站图片(1个评论)
    • vscode 配置 python3开发环境的方法(0个评论)
    • 近期文章
    • 在windows10中升级go版本至1.24后LiteIDE的Ctrl+左击无法跳转问题解决方案(0个评论)
    • 智能合约Solidity学习CryptoZombie第四课:僵尸作战系统(0个评论)
    • 智能合约Solidity学习CryptoZombie第三课:组建僵尸军队(高级Solidity理论)(0个评论)
    • 智能合约Solidity学习CryptoZombie第二课:让你的僵尸猎食(0个评论)
    • 智能合约Solidity学习CryptoZombie第一课:生成一只你的僵尸(0个评论)
    • 在go中实现一个常用的先进先出的缓存淘汰算法示例代码(0个评论)
    • 在go+gin中使用"github.com/skip2/go-qrcode"实现url转二维码功能(0个评论)
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(95个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2016-10
    • 2016-11
    • 2018-04
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2022-01
    • 2023-07
    • 2023-10
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客