手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
人工智能
栏目导航
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
子栏目导航
Git
GitHub
SVN
Jenkins
Vim
vmware
Hyper-v
SSH
Jmeter
sysTemd
Maven
Webpack
Zookeeper
k8s
Phpstorm
JVM
IDEA
Appium
Cypress
pandas
Eclipse
HBuilder
编程工具
Markdown
Mac
Pytest
Selenium
istio
Gradle
Tensorflow
Homebrew
编程之家
pandas
如何在Pandas选中的列数据框上应用具有多个参数的函数
我有以下数据框:importpandasaspddata={'gene':['a','b','c','d','e'],'count':[61,320,34,14,33],'gene_length':[152,86,92,170,111]}df=pd.DataFrame(data)df=
作者:编程之家 时间:2022-09-06
在Python中格式化数据透视表
我试图根据不同列中的计数重新格式化表格.df=pd.DataFrame({'Number':[1,2,3,4,5],'X':['X1','X2','X3','X3','X3'],'Y':['Y2','Y1','Y1','Y1',&
作者:编程之家 时间:2022-09-06
python – Pandas Dataframe to_csv格式输出
我找不到控制每列数据帧输出的方法.从以下代码:df.to_csv('dfnc.txt',sep='',float_format='%.8f',cols=['cycle','passs','ip','lon','lat'],index=False)我明白了:1.
作者:编程之家 时间:2022-09-06
python – 为什么np.percentile为高百分位数返回NaN?
这段代码:printlen(my_series)printnp.percentile(my_series,98)printnp.percentile(my_series,99)得到:14221#Thisistheserieslength1644.2#98thpercentilenan#99thpercentile?98为什么98可以正常运行但是99可以使用nan?解决方法:np.percentile将nan
作者:编程之家 时间:2022-09-06
在pandas dataframe中写一个用户定义的fillna函数,用条件填充np.nan不同的值
考虑以下pandas数据帧:importpandasaspdchange=[0.475,0.625,0.1,0.2,-0.1,-0.75,0.1,-0.1,0.2,-0.2]position=[1.0,1.0,nan,nan,nan,-1.0,nan,nan,nan,nan]date=['20150101','20150102','20150103','201501
作者:编程之家 时间:2022-09-06
Python Pandas DataFrame read_csv UnicodeDecodeError
我有一个129MB的CSV文件,包含849,275行和18列.我正在尝试使用read_csv将CSV文件读入pandasDataFrame.当我使用encoding=’cp1252’时:read_file=pd.read_csv('myfile.csv',encoding='cp1252')错误很长,但最终在底部说:UnicodeDecodeError:'charmap'codeccan'tdecod
作者:编程之家 时间:2022-09-06
python – 获取pandas数据帧中最大条目的行和列名称(argmax)
df.idxmax()沿轴(行或列)返回最大值,但我想在整个数据帧上返回arg_max(df),它返回一个元组(行,列).我想到的用例是特征选择,其中我有一个相关矩阵,并希望“递归地”删除具有最高相关性的特征.我预处理相关矩阵以考虑其绝对值并将对角元素设置为-1.然后我建议使用rec_drop,它递归地
作者:编程之家 时间:2022-09-06
python – Pandas DataFrame,用另一列的值替换列的值
我的boosting_dfPandasDataFrame如下:skuboost1boost2boost3boost40affffdfgafgggreplace1bfffffffffreplace2cddfbddfreplace3ddfgddfgddreplace对于每一行,如果’sku’的值与值bo
作者:编程之家 时间:2022-09-06
python – 在pandas数据帧中进行行相关的正确方法
我想计算两个PandasDataFrame行之间的相关性.当所有条目都是数字类型时,很容易计算两行之间的相关性,如下所示:importpandasaspdimportnumpyasnpexample_df=pd.DataFrame(np.random.randn(10,30),np.arange(10))example_df.iloc[1,:].corr(example_df.iloc[2,:])
作者:编程之家 时间:2022-09-06
python – 使用相邻日期的平均数据填充数据空白
想象一下,每30分钟测量一次多个变量的数据框.每个数据框内的系列在可能的不同位置都有间隙.这些差距将由某种运行方式取代,比方说/–2天.例如,如果在第4天07:30我缺少数据,我想在第2,3,5和6天的07:30用平均测量值替换NaN条目.注意,也有可能,例如,第5天,07:30也是NaN–在这种
作者:编程之家 时间:2022-09-06
python – 解释Scikit-Learn模型输出,额外的树分类器不同的措施
我有一组数据,我正在使用ExtraTreesClassifier开发一个预测模型,如下面的代码所示,在最初的代码集上显示et_scores看起来非常令人失望我运行时看到下面的内容并且它看起来更好,然后我做了一个学习图,事情看起来不太热.总而言之,令人困惑.初始代码:fromsklearn.ensembleimport
作者:编程之家 时间:2022-09-06
python – Pandas:将datetime列转换为int
我有一个datetime64类型的列,它已经存在了几天In[88]:printdf.days.head()0756days1262days272days3173days412daysName:days,dtype:timedelta64[ns]我想将其转换为int64,我执行以下操作:df['days']=df['days'].astype(int)/(24*3600*10*
作者:编程之家 时间:2022-09-06
python – 熊猫 – 绘图系列
我有一个由datetime列索引的数据帧,我获得了各种时间范围的value_count().例如,data['leadsource_ch_disp_name'].ix[rng[0]].value_counts()回报Unknown223Sponsorship889Reseller145Referral52dtype:int64这是一个系列.我想用5个不同的
作者:编程之家 时间:2022-09-06
python – 将Pandas DataFrame行合并到一列中的字符串中
鉴于此DataFramer3valuer1r212312413213414214312131141311341411431……
作者:编程之家 时间:2022-09-06
使用Python在给定的集群中心中集群数据
我有一个一维数值数据集(但我的问题也适用于一个n维数值数据集)我想要聚类,我已经知道了聚类中心的值.所以我只想将每个数据点映射到其关联的聚类中心(最接近数据点的聚类中心).我可以编写一个adhoc函数,但我真的更喜欢使用优化的Python科学库来处理pandas.Series或numpy.arrays,
作者:编程之家 时间:2022-09-06
Pandas / Python将两个数据帧组合在一起,形成重复的行
好吧,这似乎应该很容易与合并或连接操作,但我不能破解它.我在熊猫工作.我有两个数据帧,它们之间有重复的行,我希望以不重复行或列的方式组合它们.它会像这样工作df1:ABa1b2c3df2:ABb2c3d4df3=df1combinedwithdf2ABa1b2c3d4我尝试过
作者:编程之家 时间:2022-09-06
python – 这是read_csv的正确行为和数据值NA吗?
(我在GitHub上开了一个issue.)以下行为对我来说似乎不正确.看起来如果read_csv的默认值是na_values=False,那么包括’NA’在内的任何值都不应该被解释为NaN,但这似乎不是这种情况.这种行为在thispost中被注意到(见@JianxunLi对答案的评论),其中’NA’实际上意味着’北美’.我
作者:编程之家 时间:2022-09-06
python – 从url读取csv
如果只是粘贴到浏览器中,我有以下csvurl正常工作:http://www.google.com/finance/historical?q=JSE%3AMTN&startdate=Nov1,2011&enddate=Nov30,2011&output=csv但是我似乎无法使用pandas下载csv.我收到错误:urllib.error.HTTPERROR:HTTPERROR400:BadRequest码:imp
作者:编程之家 时间:2022-09-06
python – 在pandas plot legend中显示非ascii(日语)字符
如果我这样做:importpandasaspdpd.DataFrame(data=nr.random((2,2)),columns=[u'é',u'日本']).plot()结果:所以é出现了,但不是日本.谷歌搜索后,我发现这个page似乎为matplotlib提供了解决方案.我下载了字体文件here并让它与matplotlib一起使用:importmatplotli
作者:编程之家 时间:2022-09-06
python – 如何使用tsplot设置多个标记?
我有关于pandasDataFrame中时间序列的数据,我想为这些行提供单独的标记.到目前为止,我只使用marker=’o’参数设法对两行使用相同的标记.我正在使用http://stanford.edu/~mwaskom/software/seabornutorialimeseries_plots.html#specifying-input-data-with-long-form-datafr
作者:编程之家 时间:2022-09-06
python – Pandas合并错误TypeError:’>’和’str’实例之间不支持’>’
我有一个包含几个表的数据集,每个表都有国家,年份和一些指标.我已将所有excel表转换为csv文件,然后将它们合并到一个表中.问题是我有一些拒绝合并的表,并出现以下消息TypeError:’>’‘int’和’str’实例之间不支持我尽我所能,但没有运气,仍然出现同样的错误!此外,我尝试了数百个
作者:编程之家 时间:2022-09-06
python – 在pandas df中填写缺少的日期
我有一个数据对应于DB列表和差异行,其中包含它们正在使用的日期.DBDatesUSAGEABC03-06-2018INUSEABC07-06-2018INUSEXYZ04-06-2018INUSEXYZ08-06-2018INUSE我想要的是拥有与
作者:编程之家 时间:2022-09-06
python – 在pandas数据帧中随机播放一列
如何在pandas中只对一列数据进行洗牌?我有一个包含生产数据的Dataframe,我想加载到dev进行测试.但是,数据包含个人身份信息,因此我想要对这些列进行随机播放.列:FirstNameLastNameBirthdateSSNOtherData如果原始数据帧是由read_csv创建的,并且我想将数据转换为第二个数据帧以
作者:编程之家 时间:2022-09-06
有效地获取稀疏数据的移动平均值并在python中过滤阈值以上
我正在接受一些基因组分析,我有点陷入困境.我有一些非常稀疏的数据,需要找到移动平均值超过某个阈值的地方,将每个点标记为1或0.数据是唯一类型,因此我无法使用可用的程序进行分析.每个点代表人类基因组上的一个点(碱基对).对于每个数据集,有200,000,000个潜在点.该数据基本上是~1
作者:编程之家 时间:2022-09-06
python – 将Pandas的“findall”结果列表拆分为多个项目,按uniques分组
我已经下载了我的Twitter档案,我正在尝试对我最常谈话的人做一些分析.推文CSV列如下所示:tweet_id,in_reply_to_status_id,in_reply_to_user_id,retweeted_status_id,retweeted_status_user_id,timestamp,source我使用read_csv()将tweets.csv文件导入名为“indata”的数据框中.
作者:编程之家 时间:2022-09-06
python – Pandas DataFrame:如何在滚动窗口中设置Union Aggregation
我有一个Dataframe,其中包含一列中的id和另一列中的日期:importpandasaspddf=pd.DataFrame([['2018-01-01',{1,2,3}],['2018-01-02',{3}],['2018-01-03',{3,4,5}],['2018-01-04&
作者:编程之家 时间:2022-09-06
python – Pandas Dataframe在由索引分隔的部分中进行插值
我的示例代码如下:importpandasaspddictx={'col1':[1,'nan','nan','nan',5,'nan',7,'nan',9,'nan','nan','nan',13],\'col2':[20,'nan','nan&#
作者:编程之家 时间:2022-09-06
python – 将Dataframe与不同日期合并?
我想将单独的数据帧(df2)与主数据帧(df1)合并,但是如果对于给定的行,df1中的日期不存在于df2中,则在df1中搜索基础日期之前的最近日期.我尝试使用pd.merge,但它会删除具有不匹配日期的行,并且只保留两个df中匹配的行.df1=[['2007-01-01','A'],['2007-01-02','B'],
作者:编程之家 时间:2022-09-06
python – 使用字典替换数据框中的Internet首字母缩略词
我正在开发一个文本挖掘项目,我正在尝试使用手动编写的字典替换文本中存在的缩写,俚语和互联网首字母缩略词(在数据框列中).我面临的问题是代码在dataframe列中的第一个单词停止,并且不会用dict中的查找单词替换它这是我使用的示例字典和代码:abbr_dict={"abt":"about","b/c"
作者:编程之家 时间:2022-09-06
python – pandas groupby适用于多个列
我试图将相同的函数应用于groupby对象的多个列,例如:In[51]:dfOut[51]:abgroup00.7386280.242605grp110.4113150.340703grp120.3287850.780767grp130.0599920.853132grp140.0413800.368674grp150.181592
作者:编程之家 时间:2022-09-06
上一页
22
23
24
25
26
27
28
29
下一页
小编推荐
热门标签
更多
python
JavaScript
java
HTML
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot
react-native