微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 如何提供现有DataFrame的可重现副本?

2018-09-18_reproducible_dataframe.ipynb

这似乎是一个显而易见的问题.然而,许多提出有关熊猫问题的用户都是新手,而且缺乏经验.提出问题的一个关键组成部分是How to create a Minimal, Complete, and Verifiable example,它解释了什么,但不是真正的问题.

例如,作为提问的人,我可能需要遵循:

import pandas as pd

df = pd.read_csv('flavors_of_cacao.csv')

然后是一些其他代码,产生错误或不产生所需的结果

在Stack Overflow上提问时应该提供的事情.

>一个写得很好的连贯问题
>产生错误代码
>错误堆栈
>可能是某些代码的预期结果
>数据,易于使用的形式

解决方法:

从pandas DataFrame提供样本数据的最快方法

回答这个问题的方法不止一种.但是,这个答案并不意味着提供详尽的解决方案.它提供了最简单的方法.对于好奇,Stack Overflow上还提供了其他更详细的解决方案.

>提供可共享数据集的链接(可能在GitHub上或Google上的共享文件中).如果它是一个大型数据集并且目标是优化某些方法,这将特别有用.缺点是数据可能在将来不再可用,这降低了帖子的好处.
>提供df.head(10).to_clipboard的输出(sep =’,’,index = False)

import pandas as pd

df = pd.read_csv('flavors_of_cacao.csv')

提供pandas.DataFrame.to_clipboard的输出

df.head(10).to_clipboard(sep=',', index=False)

如果您有多索引DataFrame或0 … n以外的索引,请使用index = True并在您的问题中提供关于哪些列是索引的注释.

注意:执行上一行代码时,不会显示任何输出.代码的结果现在在剪贴板中.

将剪贴板粘贴到Stack Overflow

"Company 
(Maker-if kNown)","Specific Bean Origin
or Bar Name",REF,"Review
Date","Cocoa
Percent","Company
Location",rating,"Bean
Type","broad Bean
Origin"
A. Morin,Agua Grande,1876,2016,63%,France,3.75, ,Sao Tome
A. Morin,Kpime,1676,2015,70%,France,2.75, ,Togo
A. Morin,Atsane,1676,2015,70%,France,3.0, ,Togo
A. Morin,Akata,1680,2015,70%,France,3.5, ,Togo
A. Morin,quilla,1704,2015,70%,France,3.5, ,Peru
A. Morin,Carenero,1315,2014,70%,France,2.75,Criollo,Venezuela
A. Morin,Cuba,1315,2014,70%,France,3.5, ,Cuba
A. Morin,Sur del Lago,1315,2014,70%,France,3.5,Criollo,Venezuela
A. Morin,Puerto Cabello,1319,2014,70%,France,3.75,Criollo,Venezuela
A. Morin,Pablino,1319,2014,70%,France,4.0, ,Peru

可以复制到剪贴板,然后是:

pd.read_clipboard(sep=',')

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐