python 的 openpyxl模块 读取 Excel文件的方法
Python  /  管理员 发布于 7年前   360
Python 的 openpyxl 模块可以让我们能读取和修改 Excel 文件。
首先让我们先理解一些 Excel 基础概念。
1 Excel 基础概念
Excel 文件也称做为工作簿。每个工作簿可以包含多个工作表(Sheet)。用户当前查看的表或关闭 Excel 前最后查看的表,称为活动表。
每一张表都是由列和行构成的。列是以 A 开始的字母表示;而行是以 1 开始的数字表示的。由特定行和列所指定的方格称为单元格。每个单元格都可以包含一个数字或文本。这些单元格就构成了这张表。
2 安装 openpyxl
通过 pip 就可以安装最新版的 openpyxl。
pip install openpyxl
3 读取 Excel
假设有这样一份世界人口统计 Excel 文档,内容如下:
3.1 加载
wb = openpyxl.load_workbook('population.xlsx')print('wb 类型 :')print(type(wb), '\n')
运行结果:
wb 类型 : <class 'openpyxl.workbook.workbook.Workbook'>
导入 openpyxl 模块之后,就可以使用 openpyxl.load_workbook()
函数来加载 Excel 文档咯。这个 Excel 文件表示为 Workbook 对象。
注意:load_workbook()
函数中的文件,必须在当前工作目录。可以导入 os 模块,利用 os.getcwd() 来获悉当前工作目录。os 还提供了 chdir() 方法,可以改变当前工作目录。
import osprint('当前工作目录 :')print(os.getcwd(), '\n')
运行结果:
3.2 读取 Excel 工作表(sheet)
...print('取得所有工作表的表名 :')print(wb.sheetnames, '\n')print('取得某张工作表 :')sheet = wb['Sheet3']print(type(sheet))print('表名 - ' + sheet.title, '\n')print('取得活动工作表 :')active_sheet = wb.activeprint('表名 - ' + active_sheet.title, '\n')
运行结果:
取得所有工作表的表名 : ['Sheet1', 'Sheet2', 'Sheet3']
取得某张工作表 : <class 'openpyxl.worksheet.worksheet.Worksheet'>
表名 - Sheet3
取得活动工作表 : 表名 - Sheet1
3.3 读取单元格 (Cell)
...print('取得 A1 单元格 :')cell = active_sheet['A1']print(cell)print(cell.value, '\n')print('取得 B1 单元格 :')cell = active_sheet['B1']print(cell)print(cell.value, '\n')print('行号为 ' + str(cell.row) + ',列号为 ' + str(cell.column) + ' 的单元格,其值为 ' + cell.value, '\n')print('单元格 ' + cell.coordinate + ' 其值为 ' + cell.value, '\n')print('取得 C1 单元格的值 :')print(active_sheet['C1'].value, '\n')print('通过指定行与列,来获取单元格:')print(active_sheet.cell(row=1, column=2))print(active_sheet.cell(row=1, column=2).value)print('迭代行与列,来获取单元格的值:')for i in range(1, 8, 2): print(i, active_sheet.cell(row=i, column=2).value)print('\n')
运行结果:
取得 A1 单元格 : <Cell 'Sheet1'.A1> 排名
取得 B1 单元格 : <Cell 'Sheet1'.B1> 国家
行号为 1,列号为 2 的单元格,其值为 国家
单元格 B1 其值为 国家
取得 C1 单元格的值 : 人口
通过指定行与列,来获取单元格: <Cell 'Sheet1'.B1> 国家 迭代行与列,来获取单元格的值: 1 国家 3 印度 5 印度尼西亚 7 巴基斯坦
可以通过单元格的名字(比如:A1)来获取 Cell 对象。
3.4 获取工作表大小
print('获取工作表的大小:')print('总行数 -> ' + str(active_sheet.max_row))print('总列数 -> ' + str(active_sheet.max_column))
运行结果:
获取工作表的大小: 总行数 -> 11 总列数 -> 4
Worksheet 对象的 max_row 与 max_column,可以获取工作表的总行数与总列数,即工作表的大小。
3.5 列转换函数
openpyxl 提供了两个函数,用于转换列号:
import openpyxlfrom openpyxl.utils import get_column_letter, column_index_from_string...print('列转换函数:')print('[数字转换为字母]')print('第 1 列 -> ' + get_column_letter(1))print('第 2 列 -> ' + get_column_letter(2))print('第 37 列 -> ' + get_column_letter(37))print('第 818 列 -> ' + get_column_letter(818))print('[字母转换为数字]')print('第 A 列 -> ' + str(column_index_from_string('A')))print('第 CC 列 -> ' + str(column_index_from_string('CC')))
运行结果:
[数字转换为字母] 第 1 列 -> A 第 2 列 -> B 第 37 列 -> AK 第 818 列 -> AEL [字母转换为数字] 第 A 列 -> 1 第 CC 列 -> 81
3.6 切片
我们可以对 Worksheet 对象切片,取得表格中的一个矩形区域,迭代遍历这个区域中的所有 Cell 对象。
print(tuple(active_sheet['A2':'D4']))for row_objects in active_sheet['A2':'D4']: for cell_object in row_objects: print(cell_object.coordinate, cell_object.value) print('-- 当前行获取结束 --')
运行结果:
((<Cell 'Sheet1'.A2>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.C2>, <Cell 'Sheet1'.D2>), (<Cell 'Sheet1'.A3>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.C3>, <Cell 'Sheet1'.D3>), (<Cell 'Sheet1'.A4>, <Cell 'Sheet1'.B4>, <Cell 'Sheet1'.C4>, <Cell 'Sheet1'.D4>)) A2 1 B2 中国 C2 13.83亿人(2016) D2 9634057 -- 当前行获取结束 -- A3 2 B3 印度 C3 1339180127 D3 2973190 -- 当前行获取结束 -- A4 3 B4 美国 C4 324459463 D4 9147420 -- 当前行获取结束 --
3.7 获取指定行或指定列
我们可以使用 Worksheet 对象的 rows 和 columns 属性,来获取指定行或者列:
print('获取特定行:')print(list(active_sheet.rows)[2])for cell_object in list(active_sheet.rows)[2]: print(cell_object.value)print('获取特定列:')print(list(active_sheet.columns)[2])for cell_object in list(active_sheet.columns)[2]: print(cell_object.value)
运行结果:
获取特定行: (<Cell 'Sheet1'.A3>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.C3>, <Cell 'Sheet1'.D3>) 2 印度 1339180127 2973190 获取特定列: (<Cell 'Sheet1'.C1>, <Cell 'Sheet1'.C2>, <Cell 'Sheet1'.C3>, <Cell 'Sheet1'.C4>, <Cell 'Sheet1'.C5>, <Cell 'Sheet1'.C6>, <Cell 'Sheet1'.C7>, <Cell 'Sheet1'.C8>, <Cell 'Sheet1'.C9>, <Cell 'Sheet1'.C10>, <Cell 'Sheet1'.C11>) 人口 13.83亿人(2016) 1339180127 324459463 263991379 209288278 197015955 190886311 164669751 143989754 129163276
读取 Excel 步骤,总结如下:
总结
以上所述是小编给大家介绍的python 的 openpyxl模块 读取 Excel文件的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
122 在
学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..123 在
Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..原梓番博客 在
在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..博主 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..1111 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
Copyright·© 2019 侯体宗版权所有·
粤ICP备20027696号