对python打乱数据集中X,y标签对的方法详解
Python  /  管理员 发布于 7年前   337
今天踩过的两个小坑:
一.用random的shuffle打乱数据集中的数据-标签对
index=[i for i in range(len(X_batch))]# print(type(index))index=random.shuffle(index)
结果shuffle完以后index变成None了,看了下api,这样说明的:
这个函数如果返回值,就返回None,所以用index=balabala就把index的内容改变了。去掉index=random.shuffle(index)等号前面的值,这样利用shuffle函数就可以直接将index的内容打乱,并且不返回任何值。
因此以上方式就可以打乱index的顺序,并以新顺序输出batch中的数据。
二.整体引用index这个list中的数据
因为index是一个list,所以代码这样写:
X_batch=X_batch[index]Y_batch=Y_batch[index]
是有问题的,报错是:TypeError: list indices must be integers or slices, not list.
这是因为我的X_batch,Y_batch都是list,直接引用index是错误的。而可以直接引用的方法是如果X_batch,Y_batch是数组,index是数组,就可以。
所以代码改成了:
X_batch,Y_batch=data_generator(data_path)index=[i for i in range(len(X_batch))]# print(type(index))random.shuffle(index)index=np.array(index)X_batch=[np.array(X_batch)[index]]Y_batch=[np.array(Y_batch)[index]]
参考代码:
以上这篇对python打乱数据集中X,y标签对的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
122 在
学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..123 在
Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..原梓番博客 在
在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..博主 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..1111 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
Copyright·© 2019 侯体宗版权所有·
粤ICP备20027696号