python – 如何提供现有DataFrame的可重现副本？

2018-09-18_reproducible_dataframe.ipynb

这似乎是一个显而易见的问题.然而,许多提出有关熊猫问题的用户都是新手,而且缺乏经验.提出问题的一个关键组成部分是How to create a Minimal, Complete, and Verifiable example,它解释了什么,但不是真正的问题.

例如,作为提问的人,我可能需要遵循：

import pandas as pd

df = pd.read_csv('flavors_of_cacao.csv')

然后是一些其他代码,产生错误或不产生所需的结果

在Stack Overflow上提问时应该提供的事情.

>一个写得很好的连贯问题
>产生错误的代码
>错误堆栈
>可能是某些代码的预期结果
>数据,易于使用的形式

解决方法:

从pandas DataFrame提供样本数据的最快方法

回答这个问题的方法不止一种.但是,这个答案并不意味着提供详尽的解决方案.它提供了最简单的方法.对于好奇,Stack Overflow上还提供了其他更详细的解决方案.

>提供可共享数据集的链接(可能在GitHub上或Google上的共享文件中).如果它是一个大型数据集并且目标是优化某些方法,这将特别有用.缺点是数据可能在将来不再可用,这降低了帖子的好处.
>提供df.head(10).to_clipboard的输出(sep =’,’,index = False)

码

import pandas as pd

df = pd.read_csv('flavors_of_cacao.csv')

提供pandas.DataFrame.to_clipboard的输出

df.head(10).to_clipboard(sep=',', index=False)

如果您有多索引DataFrame或0 … n以外的索引,请使用index = True并在您的问题中提供关于哪些列是索引的注释.

注意：执行上一行代码时,不会显示任何输出.代码的结果现在在剪贴板中.

将剪贴板粘贴到Stack Overflow

"Company 
(Maker-if kNown)","Specific Bean Origin
or Bar Name",REF,"Review
Date","Cocoa
Percent","Company
Location",rating,"Bean
Type","broad Bean
Origin"
A. Morin,Agua Grande,1876,2016,63%,France,3.75, ,Sao Tome
A. Morin,Kpime,1676,2015,70%,France,2.75, ,Togo
A. Morin,Atsane,1676,2015,70%,France,3.0, ,Togo
A. Morin,Akata,1680,2015,70%,France,3.5, ,Togo
A. Morin,quilla,1704,2015,70%,France,3.5, ,Peru
A. Morin,Carenero,1315,2014,70%,France,2.75,Criollo,Venezuela
A. Morin,Cuba,1315,2014,70%,France,3.5, ,Cuba
A. Morin,Sur del Lago,1315,2014,70%,France,3.5,Criollo,Venezuela
A. Morin,Puerto Cabello,1319,2014,70%,France,3.75,Criollo,Venezuela
A. Morin,Pablino,1319,2014,70%,France,4.0, ,Peru

可以复制到剪贴板,然后是：

pd.read_clipboard(sep=',')

python – 如何提供现有DataFrame的可重现副本？

相关推荐