使用TensorFlow实现二分类的方法示例-侯体宗的博客

使用TensorFlow实现二分类的方法示例
技术 / 管理员发布于 8年前 233

使用TensorFlow构建一个神经网络来实现二分类，主要包括输入数据格式、隐藏层数的定义、损失函数的选择、优化函数的选择、输出层。下面通过numpy来随机生成一组数据，通过定义一种正负样本的区别，通过TensorFlow来构造一个神经网络来实现二分类。

一、神经网络结构

输入数据：定义输入一个二维数组（x1,x2），数据通过numpy来随机产生，将输出定义为0或1，如果x1+x2<1,则y为1，否则y为0。

隐藏层：定义两层隐藏层，隐藏层的参数为(2,3)，两行三列的矩阵，输入数据通过隐藏层之后，输出的数据为(1,3)，t通过矩阵之间的乘法运算可以获得输出数据。

损失函数：使用交叉熵作为神经网络的损失函数，常用的损失函数还有平方差。

优化函数：通过优化函数来使得损失函数最小化，这里采用的是Adadelta算法进行优化，常用的还有梯度下降算法。

输出数据：将隐藏层的输出数据通过（3,1）的参数，输出一个一维向量，值的大小为0或1。

二、TensorFlow代码的实现

import tensorflow as tffrom numpy.random import RandomState if __name__ == "__main__":  #定义每次训练数据batch的大小为8，防止内存溢出  batch_size = 8  #定义神经网络的参数  w1 = tf.Variable(tf.random_normal([2,3],stddev=1,seed=1))  w2 = tf.Variable(tf.random_normal([3,1],stddev=1,seed=1))  #定义输入和输出  x = tf.placeholder(tf.float32,shape=(None,2),name="x-input")  y_ = tf.placeholder(tf.float32,shape=(None,1),name="y-input")  #定义神经网络的前向传播过程  a = tf.matmul(x,w1)  y = tf.matmul(a,w2)  #定义损失函数和反向传播算法  #使用交叉熵作为损失函数  #tf.clip_by_value(t, clip_value_min, clip_value_max,name=None)  #基于min和max对张量t进行截断操作，为了应对梯度爆发或者梯度消失的情况  cross_entropy = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y,1e-10,1.0)))  # 使用Adadelta算法作为优化函数，来保证预测值与实际值之间交叉熵最小  train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)  #通过随机函数生成一个模拟数据集  rdm = RandomState(1)  # 定义数据集的大小  dataset_size = 128  # 模拟输入是一个二维数组  X = rdm.rand(dataset_size,2)  #定义输出值，将x1+x2 < 1的输入数据定义为正样本  Y = [[int(x1+x2 < 1)] for (x1,x2) in X]  #创建会话运行TensorFlow程序  with tf.Session() as sess:    #初始化变量 tf.initialize_all_variables()    init = tf.initialize_all_variables()    sess.run(init)    #设置神经网络的迭代次数    steps = 5000    for i in range(steps):      #每次选取batch_size个样本进行训练      start = (i * batch_size) % dataset_size      end = min(start + batch_size,dataset_size)      #通过选取样本训练神经网络并更新参数      sess.run(train_step,feed_dict={x:X[start:end],y_:Y[start:end]})      #每迭代1000次输出一次日志信息      if i % 1000 == 0 :        # 计算所有数据的交叉熵        total_cross_entropy = sess.run(cross_entropy,feed_dict={x:X,y_:Y})        # 输出交叉熵之和        print("After %d training step(s),cross entropy on all data is %g"%(i,total_cross_entropy))    #输出参数w1    print(w1.eval(session=sess))    #输出参数w2    print(w2.eval(session=sess))    '''    After 0 training step(s),cross entropy on all data is 0.0674925    After 1000 training step(s),cross entropy on all data is 0.0163385    After 2000 training step(s),cross entropy on all data is 0.00907547    After 3000 training step(s),cross entropy on all data is 0.00714436    After 4000 training step(s),cross entropy on all data is 0.00578471    [[-1.96182752 2.58235407 1.68203771]     [-3.46817183 1.06982315 2.11788988]]    [[-1.82471502]     [ 2.68546653]     [ 1.41819501]]    '''

上面的TensorFlow二分类我是参考Google深度学习框架，al_kk评论说这个损失函数的定义存在问题，之前没有仔细的去考虑这个问题，al_kk提醒之后，我发现这个损失函数的定义的确存在问题，经过测试发现这个模型也存在一些问题。其实，我们的主要目的是想去学习一个x1+x2=1的直线，来区分0和1两类不同的类别，下面我对这个模型进行了一些修改并说明一下为什么这个损失函数的定义存在问题。

一、为什么说这个损失函数的定义存在问题呢？

上面程序中定义的输入的y的shape为[1]，也就是y的类别为0或1，对于单分类问题交叉熵损失函数的定义应该为

其中n为y的种类，在上面的例子中需要包含0和1的y_*log(y)(y_表示真实类别，y表示预测类别)，而上面的例子中只包含了一个y_*log(y)，在上例中正确的损失函数定义应该为loss = y_*log(y) + (1-y_) * log(1-y)。为了便于大家理解，我引用al_kk：“如果只有一个类别的交叉熵即y_ * log(y)，如果真实类别y_为0，那么无论预测值y为任何值的时候，损失函数始终为0”。除此之外，大家可以想一下，当预测值始终为1的时候，那么损失函数是不是就会一直为0，这也是为什么输出预测值y的时候，y的值都是大于1的。如果将y的shape改为[2]的话，就可以使用y_*log(y)。

二、修改之后的二分类程序

import tensorflow as tfimport numpy as npfrom numpy.random import RandomStateimport matplotlib.pyplot as plt if __name__ == "__main__":  #定义神经网络的参数  w = tf.Variable(tf.random_normal([2,1],stddev=1,seed=1))  b = tf.Variable(tf.random_normal([1],stddev=1,seed=1))  #定义输入和输出  x = tf.placeholder(tf.float32,shape=(None,2),name="x-input")  y_ = tf.placeholder(tf.float32,shape=(None,1),name="y-input")  #定义神经网络的前向传播过程  y = tf.nn.sigmoid(tf.matmul(x,w) + b)  #基于min和max对张量t进行截断操作，为了应对梯度爆发或者梯度消失的情况  cross_entropy = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y,1e-10,1.0))+(1-y_) * tf.log(tf.clip_by_value(1-y,1e-10,1.0)))  # 使用Adadelta算法作为优化函数，来保证预测值与实际值之间交叉熵最小  train_step = tf.train.AdamOptimizer(0.01).minimize(cross_entropy)  #通过随机函数生成一个模拟数据集  rdm = RandomState(1)  # 定义数据集的大小  dataset_size = 100  # 模拟输入是一个二维数组  X = rdm.rand(dataset_size,2)  #定义输出值，将x1+x2 < 1的输入数据定义为正样本  Y = [[int(x1+x2 < 1)] for (x1,x2) in X]  #创建会话运行TensorFlow程序  with tf.Session() as sess:    #初始化变量 tf.initialize_all_variables()    init = tf.initialize_all_variables()    sess.run(init)    #设置神经网络的迭代次数    steps = 500    for i in range(steps):      #通过选取样本训练神经网络并更新参数      for (input_x,input_y) in zip(X,Y):        input_x = np.reshape(input_x,(1,2))        input_y = np.reshape(input_y,(1,1))        sess.run(train_step,feed_dict={x:input_x,y_:input_y})      #每迭代1000次输出一次日志信息      if i % 100 == 0:        # 计算所有数据的交叉熵        total_cross_entropy = sess.run(cross_entropy,feed_dict={x:X,y_:Y})        # 输出交叉熵之和        print("After %d training step(s),cross entropy on all data is %g"%(i,total_cross_entropy))    #预测输入X的类别    pred_Y = sess.run(y,feed_dict={x:X})    index = 1    for pred,real in zip(pred_Y,Y):      print(pred,real)

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

上一条：
pandas dataframe添加表格框线输出的方法
下一条：
Tensorflow分类器项目自定义数据读入的实现

0条评论 (评论内容有缓存机制,请悉知!)

最新最热

相关文章
Apifox桌面端被曝遭供应链投毒：CDN 脚本被篡改，窃取 SSH 密钥与 Git 凭证(0个评论)
智能合约Solidity学习CryptoZombie第四课:僵尸作战系统(0个评论)
智能合约Solidity学习CryptoZombie第三课:组建僵尸军队(高级Solidity理论)(0个评论)
智能合约Solidity学习CryptoZombie第二课:让你的僵尸猎食(0个评论)
智能合约Solidity学习CryptoZombie第一课:生成一只你的僵尸(0个评论)

近期文章
Claude Opus 4.8 正式发布，传闻:"Opus 4.8可能是蒸馏的Mythos!"(0个评论)
OpenAI GPT-5.5正式发布：更会编程和使用计算机的最强模型!(0个评论)
opencode AI智能体自主规划开发游戏:王者荣耀模拟战游戏初体验!英雄角色开发中...(0个评论)
opencode AI智能体自主规划开发游戏:王者荣耀模拟战游戏初体验!(0个评论)
opencode + Oh-my-openagent,我的第一个免费的ai编程智能体管家:Sisyphus(0个评论)
Google AI Studio升级全栈 vibe coding体验，可直接构建带登录和数据库的应用(0个评论)
Apifox桌面端被曝遭供应链投毒：CDN 脚本被篡改，窃取 SSH 密钥与 Git 凭证(0个评论)
在go语言中实现字符串可逆性压缩及解压缩功能(0个评论)
使用go + gin + jwt + qrcode实现网站生成登录二维码在app中扫码登录功能(0个评论)
在windows10中升级go版本至1.24后LiteIDE的Ctrl+左击无法跳转问题解决方案(0个评论)

近期评论
test1 在
opencode + Oh-my-openagent,我的第一个免费的ai编程智能体管家:Sisyphus中评论 test..
122 在
学历：一种延缓就业设计，生活需求下的权衡之选中评论工作几年后，报名考研了，到现在还没认真学习备考，迷茫中。作为一名北漂互联网打工人..
Zita 在
Google AI Studio升级全栈 vibe coding体验，可直接构建带登录和数据库的应用中评论 111222..
123 在
Clash for Windows作者删库跑路了，github已404中评论按理说只要你在国内，所有的流量进出都在监控范围内，不管你怎么隐藏也没用，想搞你分..
原梓番博客在
在Laravel框架中使用模型Model分表最简单的方法中评论好久好久都没看友情链接申请了，今天刚看，已经添加。..

Top