对熊猫来说相当新鲜所以忍受我…
我有一个巨大的csv,有很多行的表.我想简单地将每个数据帧拆分为2,如果它包含超过10行.
如果为true,我希望第一个数据帧包含前10个数据帧,其余数据帧包含第二个数据帧.
即split_dataframe(df,2(如果> 10))?
解决方法:
如果满足条件,这将返回拆分的DataFrame,否则返回原始和None(然后您需要单独处理).请注意,这假设拆分只需要每df发生一次,而拆分的第二部分(如果它超过10行(意味着原始长度超过20行))就可以了.
df_new1, df_new2 = df[:10, :], df[10:, :] if len(df) > 10 else df, None
请注意,您也可以使用df.head(10)和df.tail(len(df) – 10)根据您的需要获得正面和背面.您还可以使用各种索引方法:如果需要,您可以提供第一个维度索引,例如df [:10]而不是df [:10,:](尽管我喜欢明确地编码您正在使用的维度) .您也可以使用df.iloc和df.ix以类似的方式进行索引.
但是要注意使用df.loc,因为it is label-based and the input will never be interpreted as an integer position..loc只会在你碰巧有一个从0开始没有间隙的整数的索引标签的情况下“意外地”工作.
但是您还应该考虑pandas提供的各种选项,用于将DataFrame的内容转储为HTML,还可能考虑LaTeX,以便为演示文稿制作更好的表格(而不仅仅是复制和粘贴).简单地谷歌搜索如何将DataFrame转换为这些格式,为这个应用程序提供了大量的教程和建议.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。