手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
人工智能
栏目导航
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
子栏目导航
Git
GitHub
SVN
Jenkins
Vim
vmware
Hyper-v
SSH
Jmeter
sysTemd
Maven
Webpack
Zookeeper
k8s
Phpstorm
JVM
IDEA
Appium
Cypress
pandas
Eclipse
HBuilder
编程工具
Markdown
Mac
Pytest
Selenium
istio
Gradle
Tensorflow
Homebrew
编程之家
pandas
python – NLTK ConditionalFreqDist到Pandas数据帧
我正在尝试使用nltk.ConditionalFreqDist生成的表,但我似乎无法找到任何关于将表写入csv文件或导出为其他格式的文档.我喜欢在pandasdataframe对象中使用它,这也很容易写入csv.我能找到的唯一一个推荐的picklingtheCFDobject并没有真正解决我的问题.我编写了以下函数来将nltk.
作者:编程之家 时间:2022-09-06
python – 具有布尔条件的Groupby在Pandas中的一列中为True
这是我想要使用groupby的数据框ValueBoolean1Boolean25.175603FalseFalse5.415855FalseFalse5.046997FalseFalse4.607749TrueFalse5.140482FalseFals
作者:编程之家 时间:2022-09-06
python – 屏蔽匹配多个条件的数据帧
如果满足两个条件,我想掩码(或指定’NA’)数据帧中列的值.如果条件是按行执行的,那么这将是相对简单的,例如:mask=((df['A']<x)&(df['B']<y))df.loc[mask,'C']='NA'但我在如何在我的数据框架中执行此任务时遇到了一些麻烦,其结构或多或少类似于:df=pd.DataFrame(
作者:编程之家 时间:2022-09-06
python – 在pandas MultiIndex中重命名一个级别的项目
我有一个pandasDataFrame,其结构与此类似:NameLocationPositionData1Data2Fooloc112345presentabsentFoo2loc267890absentpresent其中Name,Location和Position是MultiIndex级别.但是我需要重命名索引的一个单一级
作者:编程之家 时间:2022-09-06
python – Pandas head命令没有给出预期的结果
我不能让熊猫的功能为我工作.这是一个简单的例子.我使用以下命令将kaggle数据集读入数据框:importpandasaspdtrain_data=pd.read_csv('kaggle_train.csv',header=None)然后我使用head命令询问前五个数据行:train_data.head()我没有获得前五行数据,而是得到了这个输出:<c
作者:编程之家 时间:2022-09-06
python – pandas将数据帧值替换为同一行中的其他列值
我有这个pandas数据帧BU|DATA1DATA201-TTzone01noData02-FFnoDatazone02....我需要用BU列中的相应行替换“noData”字符串,但只使用两个第一个字符并添加“zone”字BU|DATA1DATA201-TTzone01zone
作者:编程之家 时间:2022-09-06
python – 来自两个不同数据帧的平均值
我喜欢:materialplantOrder24990899524568789,509871024990899529448609,1007081166621306218364103166621306278309139240758306255146035276009306238501581,8
作者:编程之家 时间:2022-09-06
python – 如何计算前n天意味着使用熊猫?
我想计算每天前10天的方法.例如,在结果表中,在A列中,’1/11/2000’表示44,它是从’1/1/2000’到’1/10/2000’的A值的平均值.原始数据:ABC1/1/20006062881/2/20004699281/3/20002023941/
作者:编程之家 时间:2022-09-06
python – pandas中的groupby()和索引值
我有pandas.DataFrame和Multiindex,因此:avaldog1cat2bfox3rat4我想要一个系列,其条目是1级索引值的列表,所以:a[dog,cat]b[fox,rat]以下确实有效,但速度很慢且不够优雅:fff=df.groupby(level=0)['val'].
作者:编程之家 时间:2022-09-06
python – 计算由长度不等的索引的二维列表给出的DataFrame行组的平均值
我有一个有n行的DataFrame.我还有一个二维索引数组.该数组也有n行,但每行的长度可以变化.我需要根据索引对DataFrame行进行分组并计算列的平均值.例如:如果我有DataFramedf和arrayind,我需要得到[df.loc[ind[n],col_name].mean()forninind].我已经使用applypandas函数
作者:编程之家 时间:2022-09-06
python – 计算pandas中列中第n个元素的平均值
我有以下数据帧:df1indexyearweekabc-10201710452619-9201711372314-8201712216619-7201713473692-6201714826518-5201
作者:编程之家 时间:2022-09-06
应用函数和返回多列的最pythonic方法是什么?
在使用Pandas时,我经常会遇到一个现有函数,它接受多个参数并返回多个值:deffoo(val_a,val_b):"""Someexamplefunctionthattakesinandreturnsmultiplevalues.Canbealotmorecomplex."""sm=val_a+val_bsb=val_a-val_b
作者:编程之家 时间:2022-09-06
python – 在多个条件下从数据框中过滤行,得到ValueError
我正在从多个标准上名为join的数据帧中过滤我的行:joined[(joined.gvkey_x==gvkey)&(year-3<=joined.year_y<=year)]我想要数据帧中满足给定条件的所有行.我发回了这个错误:ValueError:ThetruthvalueofaSeriesisambiguous.Usea.empty,a.bool(),a.item(),a.any
作者:编程之家 时间:2022-09-06
使用pandas DataFrame.eval函数来改变inplace的子集
我知道这在pandas中有效(df是数据帧,op是列,mult是浮点变量):df.eval("op=op*@mult",inplace=True)但是可以在行的子集(就地)上执行此操作吗?这给了我一个错误(ex_date是timestamp类型的局部变量,df的索引是时间戳):df.eval("df.loc[df.index<@ex_date,op]=op*@mult
作者:编程之家 时间:2022-09-06
python – SQL Server DATE作为字符串检索到pandas中
当我从SQLServer将“Date”变量拉入Python/Pandas时,它将作为“对象”出现.我已经安装并尝试了几个驱动程序(代码中显示的注释驱动程序),每次都有相同的结果:importpandasaspdimportpyodbcconn_str=(r'Driver={SQLServerNativeClient11.0};'#r'Driver=
作者:编程之家 时间:2022-09-06
python – 在保留原始列标题的同时旋转列
我想通过Column和groupby索引计算yes和no值的数量.我有这个数据帧:col0col1col2AyesnoAnonoByesyesByesno我要这个:col1col2yesnoyesnoA1102B2011我尝试使用df.pivot_table(index=’m
作者:编程之家 时间:2022-09-06
python – 正确地做Pandas …而不是使用循环
我刚刚开始使用Pandas,我发现很难对待像数据帧这样的数据帧.每隔一段时间,我就无法解决如何在不迭代行的情况下做某事.例如,我有一个包含预算信息的数据框.我想从’简短描述’中提取’供应商’,这是一个三种可能形式之一的字符串:>blahblahblahtovendorname>blahblahbla
作者:编程之家 时间:2022-09-06
python – 将多行合并为一行
pd.read_csv()的数据:NameJobPlaceAgeJohnNoneNoneNoneNoneDoctorNoneNoneNoneNoneUKNoneNoneNoneNone50AlexNoneNoneNoneNoneEngrNoneNoneNoneNoneUSNoneNoneNoneNone45单行的信息包
作者:编程之家 时间:2022-09-06
python – 访问Pandas列中不规则出现的第一个列表值项
我有一个pandas数据帧,在其中一个列中,列表值出现在某些值中.我需要能够提取列表的第一项,如果它是一个列表,如果它不是一个列表,那么该值将保持不变.我正在努力使用lambda函数实现它:df1=pd.DataFrame({'Fruits':['Apple',['Banana',6],'Kiwi','Cheese']})df1['Fruits']=df
作者:编程之家 时间:2022-09-06
如何在新数据帧中存储多索引数据帧的子集?
我有一个像这样的多索引数据框:importpandasaspdimportnumpyasnpdf=pd.DataFrame({'ind1':list('aaaaaaaaabbbbbbbbb'),'ind2':list('cccdddeeecccdddeee'),'ind3':list(range
作者:编程之家 时间:2022-09-06
python – 计算两个Dataframe列之间的组合
我想重新格式化一个数据帧,以便显示两列组合的计数.这是一个示例数据帧:my_df=pd.DataFrame({'a':['first','second','first','first','third','first'],'b':['foo','foo',
作者:编程之家 时间:2022-09-06
如果pandas系列的值是一个列表,如何获取每个元素的子列表?
使用两个Pandas系列:series1和series2,我愿意制作series3.series1的每个值都是一个列表,series2的每个值都是series1的对应索引.>>>print(series1)0[481,12,11,220,24,24,645,153,15,13,6...1[64,80,79,147,14,20,56,288,12,208,26...4
作者:编程之家 时间:2022-09-06
python – 为什么`set_index`为列名创建索引标签?
我有一个CSV文件,开头像这样:Year,Boys,Girls1996,333490,3159951997,329577,3135181998,325903,309998当我把它读入熊猫并设置一个索引时,它并没有达到我的预期:df=pd.read_csv('../data/myfile.csv')df.set_index('Year',inplace=True)df.head()为什么列标签有索引
作者:编程之家 时间:2022-09-06
python – Pandas – 基于Boollean DataFrame替换DataFrame中的值
我正在使用Pandasv0.20.2并且我有DataFrame,如下所示:df=pd.DataFrame(dict(a=[0,1],b=[3,4],c=[6,7]),index=['spam','ham'])#abc#spam036#ham147我有另一个掩码的DataFrame:mask=pd.DataFrame(dict(a=[True,Fals
作者:编程之家 时间:2022-09-06
python – Pandas – 基于条件的重复行
如果行符合条件,我正在尝试创建重复行.在下表中,我创建了一个基于groupby的累积计数,然后是groupby的MAX的另一个计算.df['PathID']=df.groupby(DateCompleted).cumcount()+1df['MaxPathID']=df.groupby(DateCompleted)['PathID'].transform(max)DateCompletedPath
作者:编程之家 时间:2022-09-06
python中唯一的二进制字符串
我有一个类似于这个表的xlsx文件:nameplacelinkterrymike12<longbeach>http://www.google.com/xyzjessicamike12<longbeach>http://www.google.com/abcamandaalbert189<washington>
作者:编程之家 时间:2022-09-06
python – pandas range_date极其缓慢地降低了功能
我给出了一个样本数据集,并希望从原始样本数据集中选择多个样本,例如1000个样本块,每个样本块包含来自原始样本数据的500个数据点.我在python中写了这个小函数:importtimeitimportpandasaspdimportnumpyasnpsample_data=np.random.randn(10000,15)index=pd.date_r
作者:编程之家 时间:2022-09-06
python – 加入两个没有公共列的DataFrame进行计算
我正在尝试根据我在两个不同数据集中的信息进行计算.我需要第一个数据帧的所有信息重复与第二个数据帧的信息一样多次.例:DataFrame1:namepriceA1B2DataFrame2:currencyvalueDollar1Euro2预期产量:DataFrame合并:name
作者:编程之家 时间:2022-09-06
Python pandas dataframe:为另一列的每个唯一值找到max
我有一个大型数据帧(从500k到1M行),其中包含例如这3个数字列:ID,A,B我想过滤结果,以获得如下图所示的表,其中,对于列id的每个唯一值,我有A和B的最大值和最小值.我能怎么做?编辑:我更新了下面的图像,以便更清楚:当我从列中获得最大值或最小值时,我还需要获取与其他列相关的数据解决
作者:编程之家 时间:2022-09-06
python – 在qcut十分之后选择/过滤垃圾箱
我试图通过十分位数对数据进行分箱后访问标签(即位置指示器):q=pd.qcut(df["revenue"],10)q.head():7(317.942,500.424]81(317.942,500.424]83(150.65,317.942]84[0.19,150.65]85(317.942,500.424]Name:revenue,dtype:category
作者:编程之家 时间:2022-09-06
上一页
20
21
22
23
24
25
26
27
下一页
小编推荐
热门标签
更多
python
JavaScript
java
HTML
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot
react-native