python实现Excel文件转换为TXT文件
Python  /  管理员 发布于 7年前   193
在处理数据的时候经常需要读取TXT文件类型的数据转换为可执行的list,但是当我们有Excel的文件,如何将Excel文件转换为每行固定长度的TXT文件呢!如果数据量很少的情况下,人工处理还好,可是在大数据的情况下就显得不可能了,这时如果我们利用程序执行这一命令就轻松多了,废话不多说,下面介绍代码。
首先在python中import两个必要的包(我们面向的对象是.csv的Excel文件)
import numpy as npimport csv
接下来,就是读取Excel文件,在读取的文件路径上本文采用绝对路径的方式:
with open('F:/Data/DATA/airquality1.csv','rb') as csv_file: all_lines = csv.reader(csv_file) for one_line in all_lines: list_file.append(one_line) #逐行读取Excel文件中的每一行append列表中 list_file.remove(list_file[0]) #该行表示我们去除Excel文件的第一行,因为第一行往往都是数据的名称介绍,如果没有介绍就不用该行代码了 arr_file = np.array(list_file) #转换为矩阵形式 label = arr_file[:,0] #第一列 //该行表示我们取Excel文件中第一列数据进行实验,下述贴出数据样式(或者Excel只有第一列有数据)
然后进行一次额外的筛选,筛选的目的是因为我们所采集到的数据中一般都有一些数据缺失的情况,也就是显示为“NULL”的情况,或者其他的形式,可以根据自己数据的缺失情况进行灵活更改(如果没有数据缺失这部分代码就不需要了):
for i in range(len(label)): if label[i] == 'NULL': #注意我们文件中数据缺失时记录为“NULL”,注意替换 label[i] = label[i -1]
上述步骤已经完成了在Excel上的各种操作,接下来就是将我们读取到的Excel文件存储到指定的TXT文件中了:
file = open("F:/Data/DATA/airquality48.txt", "w") for n in range(int(len(label)/48)): #该行命令用来计算数据的长度,因为我们要存储的TXT文件中要使得每行包含48个数据,所以这里使用48 file.write(label[n*48:n*48+48]) #将提取好的数据写入到TXT文件中 file.write('\n') #注意转换后文件最后一行空白需要删除(写完48个数据进行换行)
好了,上述就行所描述的程序步骤,下面用结果展示下本程序所使用的数据样式及运行结果,为了避免出错先完整的贴下整体程序:
# EXCEL.CSV文件转换成TXT #import numpy as npimport csvdef loadCSVfile1(): list_file = [] with open('F:/Data/DATA/airquality1.csv','rb') as csv_file: all_lines = csv.reader(csv_file) for one_line in all_lines: list_file.append(one_line) list_file.remove(list_file[0]) arr_file = np.array(list_file) label = arr_file[:,0] #第一列 # 处理文件中null情况 for i in range(len(label)): if label[i] == 'NULL': label[i] = label[i -1] #将数据以天为单位写入TXT文件中 file = open("F:/Data/DATA/airquality48.txt", "w") for n in range(int(len(label)/48)): file.write(label[n*48:n*48+48]) file.write('\n') #注意转换后文件最后一行空白需要删除 return labelloadCSVfile1()
本程序所使用的Excel数据样式为:
程序的运行结果将转换为下述TXT样式(每行包含48个数据):
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
122 在
学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..123 在
Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..原梓番博客 在
在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..博主 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..1111 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
Copyright·© 2019 侯体宗版权所有·
粤ICP备20027696号