手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
人工智能
栏目导航
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
子栏目导航
Git
GitHub
SVN
Jenkins
Vim
vmware
Hyper-v
SSH
Jmeter
sysTemd
Maven
Webpack
Zookeeper
k8s
Phpstorm
JVM
IDEA
Appium
Cypress
pandas
Eclipse
HBuilder
编程工具
Markdown
Mac
Pytest
Selenium
istio
Gradle
Tensorflow
Homebrew
编程之家
pandas
python – pandas.Series.interpolate()什么都不做.为什么?
我有一个DatetimeIndex的数据框.这是列之一:>>>y.out_brd2013-01-0111:25:000.044642862013-01-0111:30:00NaN2013-01-0111:35:00NaN2013-01-0111:40:000.0059523812013-01-0111:45:000.017857142013-01-0111:50:000.00
作者:编程之家 时间:2022-09-06
python – 返回将pandas dataframe作为参数的函数输出
我有一个pandas数据框,看起来像:d={'some_col':['A','B','C','D','E'],'alert_status':[1,2,0,0,5]}df=pd.DataFrame(d)我工作中的很多任务需要在熊猫中完成相同的任务.我开始编写标准化函数,将数据帧作为参数并返回一些东西.这是一个简单的:
作者:编程之家 时间:2022-09-06
python – 熊猫:两个布尔系列的总和
在Python中:In[1]:True+TrueOut[1]:2所以在以下设置之后:importpandasaspdser1=pd.Series([True,True,False,False])ser2=pd.Series([True,False,True,False])我想要的是找到ser1和ser2的元素总和,将booleans视为加法的整数,如Python示例中所示.但是Pandas将添
作者:编程之家 时间:2022-09-06
python – 递归地将子文件夹中的文件读入列表,并将每个子文件夹的文件合并为每个子文件夹一个csv
我试图找出如何使用pandas递归导航文件夹子文件夹,将每个文件放在子文件夹中,并将其合并为每个子文件夹一个CSV文件.所以我在类似于下面的结构中有多个文件.我想获取每个子文件夹并将其各自的CSV合并到每个子文件夹的一个文件中.请参阅第二个插图文件夹树.我之前没有使用过熊猫,但
作者:编程之家 时间:2022-09-06
IPython Notebook和Pandas自动完成
我注意到如果我要键入df.column_name(),我可以使用IPython笔记本中的选项卡自动填充column_name.现在,为列做某事的正确语法是df[‘column_name’],我无法自动完成(我假设因为它是一个字符串?).是否有任何其他符号或方式来简单地键入列名称.我正在寻找一种解决方案,允许我在此df[
作者:编程之家 时间:2022-09-06
python – Pandas转换类型并将无效值设置为na
是否可以将pandas系列值转换为特定类型并设置那些无法转换的元素?我发现了Series.astype(dtype,copy=True,raise_on_error=True)并设置了raise_on_error=True以避免异常,但这不会将无效项设置为na…更新更确切地说,我想指定一个列应转换为的类型.对于包含值[123,’abc’,
作者:编程之家 时间:2022-09-06
python – 在pandas中如何在移动窗口的基础上计算’Countif’?
特定A=pd.DataFrame([[1,5,-2],[2,4,-4],[3,3,-1],[4,2,2],[5,1,4]],columns=['A','B','C'],index=[1,2,3,4,5])假设您想要计算观察次数<在滚动的基础上,在最后3个观察中,C列为0.在excel中,您可以使用条件在指定窗口上滑动'countif'计算,
作者:编程之家 时间:2022-09-06
在Python中,如何将字典转换为df列,其中键与df.index值匹配?
我有一个数据帧和一个字典,dict的键与数据帧的索引值相同,如下所示:A=pd.DataFrame([[1,5,2],[2,4,4],[3,3,1],[4,2,2],[5,1,4]],columns=['A','B','C'],index=["1a","2a","3a","4a",&
作者:编程之家 时间:2022-09-06
python – 通过连接传播pandas系列元数据
我希望能够将元数据附加到一系列数据帧(特别是原始文件名),以便在连接两个数据帧后,我可以看到每个系列来自哪里的元数据.我看到有关_metadata(here,here)的github问题,包括一些与当前_metadata属性(here)相关的问题,但在pandas文档中没有任何内容.到目前为止,我可以修改_metadat
作者:编程之家 时间:2022-09-06
python – numpy.argmax比MATLAB慢[〜,idx] = max()?
我正在为正态分布编写Bayseian分类器.我在python和MATLAB中都有几乎相同的代码.但是,MATLAB代码的运行速度比我的Python脚本快50倍.我是Python的新手,所以也许我做的事情非常糟糕.我假设它是我循环数据集的地方.可能numpy.argmax()比[〜,idx]=max()慢得多?循环数据框架很慢?字典的
作者:编程之家 时间:2022-09-06
python – 作为虚拟列的范围(列表)
我有两列有开始和结束范围.我想为这列之间的范围制作虚拟列.我可以通过apply方法制作它,但它很慢.我可以不申请(因为我有~2-5M行).整个DataFrame:startend0363613131229293101043535542446
作者:编程之家 时间:2022-09-06
python – 如何有效地将Pandas中的类似数据帧组合成一个巨大的数据帧
我有7000列数据框Date,X_1Date,X_2...每个数据帧大约有2500行.日期有时会重叠,但不保证会这样做.我想将它们组合成表单的数据框DateX_1X_2etc.我尝试使用combine_first7000次,但它确实很慢,因为它必须创建7000个新对象,每个对象比最后一个略大.是否有更有效的
作者:编程之家 时间:2022-09-06
python – 防止matplotlib在零处重新调整我的轴
我有一个熊猫时间序列:timeSeries2010-01-1602:00:005124502010-01-1602:00:015124502010-01-1602:00:025124502010-01-1602:00:03512450...我想绘制它,所以我这样做:timeSeries.plot()但是当我这样做时,我得到一个y轴从0开始的图.在图表的顶部,mat
作者:编程之家 时间:2022-09-06
python – 获取每列中某个值的频率
我有一个数据框,其中所有缺失值都用?表示.我需要的数量?每列.我尝试过的方法是:mydata.replace('?','')mydata.isnull().sum()返回:A10A20A30A40A50A60...A160dtype:int64应该不是这样的,因为有?在CSV文件中,我从中获取了数据.解
作者:编程之家 时间:2022-09-06
数据分析总编
numpy pandas之基础 pandas之处理丢失数据 pandas之数据处理 Matplotlib
作者:编程之家 时间:2022-09-06
python – Groupby by One列,并根据月份获取值的总和
我有一个pandas数据帧,其中包含在特定日期带来的项目及其量化.例如.dateItemqty2016-01-04Rice32016-01-04Ball32016-01-10Rice52016-02-02Coffee102016-02-06Rice3..........数据为期2年,2016年
作者:编程之家 时间:2022-09-06
python – 如何在数据透视表上添加总和和计数
这是我的数据集customer_idhoursize1011118217这是我的代码table=a.pivot_table(index=['customer_id'],columns='hour',fill_value
作者:编程之家 时间:2022-09-06
检查下一行中的值,以便将某些规则应用于Python中的当前行
我有一个包含两列的数据框:id和issues;基于此数据框,我创建了一个新列:issues_v1使用:mydf['Issue_v1']='"'+mydf['issues']+'"'+','这是我的示例数据,抱歉更新截图有问题,所以我必须输入以下格式:idissuesissues_v11001A&quo
作者:编程之家 时间:2022-09-06
python – 如何将来自许多数据帧的数据组合成一个数据帧,并将数组作为数据值
如果我有许多panda数据帧,具有相同的索引结构,我想创建一个具有相同索引结构的数据帧,但数据值是np.arrays(实际上我想要np.matrix.)合并似乎可以很好地完成简单的操作df1df2添加了元素,但np.array((df1,df2))根本不能做我想要的.pandas有没有这样做的方法而不用逐个元素重建整
作者:编程之家 时间:2022-09-06
python – Pandas将ISO字符串转换为datetime64
我希望快速将约10-20MISO日期时间字符串以微秒精度投射到datetime64,以用作pandas中的DataFrame索引.我在大熊猫0.9上,已经尝试过在git上建议的解决方案,但我发现它花了20到30分钟,或者从未完成.我想我已经找到了问题.比较这两个的速度:rng=date_range('1/1/2000',periods=2
作者:编程之家 时间:2022-09-06
在Python中将多个CSV文件合并到电子表格的单独选项卡中
我有一个代码,可以在目录中生成多个CSV文件.我想在excel中生成一个报告,该报告将包含CSV文件作为单独的选项卡.我使用了以下代码:importpandasaspdimportosimportcsvimportglobpath="/MyScripts"all_files=glob.glob(os.path.join(path,"*.csv"))df_from_ea
作者:编程之家 时间:2022-09-06
python – 检查多个cols中的字符串是否存在,并将输出提供给pandas中的单独cols
我的数据帧如下:col1col2col3col40a-I--12.41-a-I-2.62a-I-a-I233-a-Ia-I44--a-I55a-Ia-I-6.2456-aa7.237aa-8我想要的是
作者:编程之家 时间:2022-09-06
python – pandas.DataFrame列中值组合的可能性
我的DataFrame表示每列中的属性,如果适用,则表示每行中的是/否值:d_att={'attribute1':['yes','yes','no'],'attribute2':['no','yes','no'],'attribute3':['no&#
作者:编程之家 时间:2022-09-06
python – 理解MultiIndex
所以我在csv中有这样的示例数据集:–nameteamdatescoreJohnA3/9/12100JohnB3/9/1299JaneB4/9/12102PeterA9/9/12103JosieC11/9/12111RachelA30/10/1298KateB31/10/12
作者:编程之家 时间:2022-09-06
python – 使用pandas选择满足特定条件的组中的所有元素
我有一个按ID分组的df.对于每个id组,我想返回列a大于该组的a的平均值的所有行.我尝试了以下方法:df=pd.DataFrame(data={"a":np.arange(10),"b":np.arange(10)[::-1],"c":np.random.choice(a=np.arange(10),size=10)},index=pd.Index(data=np.random.choice(a
作者:编程之家 时间:2022-09-06
Python – 在str.split()之后获取最后一个元素
我使用pandas,我有数据,数据看起来像这样FirstNameLastNameStudentIDFirstName2LastName2StudentID2然后我使用str.split()基于’space’拆分它所以数据在DataFrame中看起来像这样[[FirstName,LastName,StudentID],[FirstName2,LastName2,StudentID2]]如何仅为
作者:编程之家 时间:2022-09-06
python – 通过使用pandas中groupby()的百分比从Train集中获取验证集
拥有具有多类目标变量类别的训练数据集train.groupby('category').size()02220140602760314804220544062312071960864840我想通过获得每个类的百分比(比如说20%)从列车集中获取新的验证数据集,以避免在验证集中丢失类
作者:编程之家 时间:2022-09-06
python -df.columns和df2.columns是同一个对象?
我有一个数据帧df2,它是另一个数据帧的副本:In[5]:df=DataFrame({"A":[1,2,3],"B":[4,5,6],"C":[7,8,9]})In[6]:dfOut[6]:ABC014712582369In[7]:df2=df.copy()因此不是同一个对象:In[8]:dfisdf2Out[8]:FalseIn[
作者:编程之家 时间:2022-09-06
python – 使用str.contains将字符串的一部分替换为分隔符
在我转向excel宏的可怕世界之前,你是我最后的希望堡垒,我有一个来自excel的庞大数据框架,我正在操纵,Pandas已被证明对编辑非常有用,因为excel非常挣扎.我的最后一期如下:现在,我有一个列,列出超过100k行的用户兴趣.问题是数据从未经过验证,所以我有潜在的有用信息,我需要操作10
作者:编程之家 时间:2022-09-06
python – 从Pandas.DataFrame中的时间戳位置计算速度
我对Pandas很新,但熟悉Numpy和Python.假设我有一个X的“Pandas.DataFrame”,Y点(float64)由时间(日期时间)索引,我怎么能从中进行pythonically计算速度,假设我已经知道如何计算点之间的欧氏距离?编辑:我刚刚阅读了关于pandas.Series.diff()的帮助,但我仍然想用另一个函数“替换”di
作者:编程之家 时间:2022-09-06
上一页
19
20
21
22
23
24
25
26
下一页
小编推荐
热门标签
更多
python
JavaScript
java
HTML
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot
react-native