Pandas模块中内置了大量函数和类型,可以快速处理日常各种文件,下面文章中将从常见的几种文件类型为例,讲解了pandas是如何快速读取这些文件的,有需要的朋友可以一起来看看这篇文章。
一、Pandas读取文件
1、txt文件
这是一种常见文本文件格式,如果要对这文件进行读取的操作时,也是比较简单的,有特定的方式读取,可以直接使用pandas模块中的read_table函数就行,在测试之前,要保证txt文件是格式化的,不然读取的结果会有误,filename是文件名,header是否包含列标题,sep是每行数据的分隔符,最终读取的数据类型是DataFrame,代码如下:
import pandas as pd def readTxt (filename) : 读取txt文件.. data=pd. read_table (filename, header =None, sep=',) return data if name_ ==“_main__”: data=readTxt(“test. txt”) print (data[:2])
2、excel文件
它是一种常见的文件格式,在读取的时候,可以直接使用read_excel函数,读取的形式也比较的简单,直接传入一个文件名就可以了,最后返回的类型也是一个DataFrame类型,如下:
import pandas as pd def readExcel (filename) : data=pd. read_excel (filename) return data if name_ ==“_main__”: data=readExcel (“hello.xls”) print (data.ix[:2,:3])
3、csv文件
在Python中,想要读取cvs文件的数据时,可以使用的函数为read_csv,在读取的时候,有两个参数,其中filename为文件名,header为是否包含列标题,最终返回结果也是DataFrame类型,举个例子:
import pandas as pd adef readCsv (filename): 读取csv文件’”” data=pd. read. csv (filename, header=None ) return data if__name__==”_main__" : data=readCsv(“test. csv”) print (data. ix[:3, 1:4])
4、json文件
这是Python中一种比较常用的数据存储格式,要读取文件内容的时候,所使用的函数为read_json,在这个函数中,可以包含两个参数,其中filename表示的是要读取的文件名,如果出现中文乱码的话,设置encoding编码为uft-8就行,最终结果也是DataFrame类型。
到此这篇关于如何使用Pandas模块读取各类型文件?Pandas模块读取的文件类型有哪些?的文章就分享到这里了,文章中介绍了四种pandas可读取的文件类型,希望对大家的学习带来帮助。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。