微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

对于同一工作簿的多个工作表,使用Pandas到pd.read_excel()

我有一个大型电子表格文件(.xlsx),我正在使用python pandas进行处理.碰巧我需要来自该大文件中两个选项卡的数据.其中一个标签有大量数据,另一个标签只有几个方格.

当我在任何工作表上使用pd.read_excel()时,它看起来像整个文件被加载(不只是我感兴趣的工作表).因此,当我使用该方法两次(每张一次)时,我实际上必须让整个工作簿被读取两次(即使我们只使用指定的工作表).

我使用它错了还是仅限于这种方式?

谢谢!

解决方法:

试试pd.ExcelFile

xls = pd.ExcelFile('path_to_file.xls')
df1 = pd.read_excel(xls, 'Sheet1')
df2 = pd.read_excel(xls, 'Sheet2')

如@HaPsantran所述,在ExcelFile()调用期间读入整个Excel文件(似乎没有解决方法).这样,您只需每次要访问新工作表时都不必阅读相同的文件.

请注意,pd.read_excel()的sheet_name参数可以是工作表的名称(如上所示),指定工作表编号的整数(例如0,1等),工作表名称或索引列表或无.如果提供了列表,则返回一个字典,其中键是表名/索引,值是数据帧.认是简单地返回第一张表(即sheet_name = 0).

如果指定None,则返回所有工作表,作为{sheet_name:dataframe}字典.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐