手机版
热门标签
站点地图
我要投稿
广告合作
联系我们
搜 索
广告位招租
广告位招租
切换导航
首页
编程教程
编程导航
编程百科
编程问答
编程博文
编程实例
硬件设备
网络运营
软件教程
移动数码
办公软件
操作系统
人工智能
栏目导航
▸ 编程语言
▸ 前端开发
▸ 移动开发
▸ 开发工具
▸ 程序设计
▸ 行业应用
▸ CMS系统
▸ 服务器
▸ 数据库
公众号推荐
微信公众号搜
"智元新知"
关注
微信扫一扫可直接关注哦!
子栏目导航
Git
GitHub
SVN
Jenkins
Vim
vmware
Hyper-v
SSH
Jmeter
sysTemd
Maven
Webpack
Zookeeper
k8s
Phpstorm
JVM
IDEA
Appium
Cypress
pandas
Eclipse
HBuilder
编程工具
Markdown
Mac
Pytest
Selenium
istio
Gradle
Tensorflow
Homebrew
编程之家
pandas
python – 高效地将最后’n’行CSV读入DataFrame
一些方法可以做到这一点:>阅读整个CSV,然后使用df.tail>以某种方式反转文件(对于大文件最好的方法是什么?)然后使用nrows参数来读取>以某种方式查找CSV中的行数,然后使用skiprows并读取所需的行数.>也许做块读取丢弃初始块(虽然不知道这将如何工作)可以用更简单的方式完成吗?如果不
作者:编程之家 时间:2022-09-06
python – 在DataFrame中组合重复的列
如果我的数据框具有包含相同名称的列,是否有办法将具有相同名称的列与某种功能(即总和)组合在一起?例如:In[186]:df["NY-WEB01"].head()Out[186]:NY-WEB01NY-WEB01DateTime2012-10-1816:00:005.62.82012-10-1817:00:0018.612.
作者:编程之家 时间:2022-09-06
python – 计算DataFrame每行中Series中项的出现次数
我有一个看起来像这样的pandas.DataFrame.COL1COL2COL3C1NoneNoneC1C2NoneC1C1NoneC1C2C3对于此数据帧中的每一行,我想计算每个C1,C2,C3的出现次数,并将此信息作为列附加到此数据帧.例如,第一行具有1个C1,0个C2和0
作者:编程之家 时间:2022-09-06
python – 如何使用pandas将浮动列嵌入
这段代码一直有效,直到我将python2.x升级到3.x.我有一个由3列ipk1,ipk2,ipk3组成的df.ipk1,ipk2,ipk3由浮点数0–4.0组成,我想将它们分成字符串.数据看起来像这样:ipk1ipk2ipk3ipk4ipk5jk03.253.313.313.313.34P13.37
作者:编程之家 时间:2022-09-06
python – 用于显示的pandas整数格式
我已经看到this和this格式化浮点数以便在pandas中显示,但我有兴趣为整数做同样的事情.现在,我有pd.options.display.float_format='{:,.2f}'.format这对我的数据中的浮点数很有用,但是要么会在转换为浮点数的整数上留下恼人的尾随零,要么我将使用不用逗号格式化的普通整数.
作者:编程之家 时间:2022-09-06
如何从数据框表面绘图/ 3d图?
我是pandas和matplotlib的新手.无法获得绘制我的DataFrame的确切参考,其架构如下所示schema=StructType([StructField("x",IntegerType(),True),StructField("y",IntegerType(),True),StructField("z",IntegerType(),True)])喜欢绘制3d图形w.r.t.x,y和z这是我使用
作者:编程之家 时间:2022-09-06
python – 替换Pandas中的列之间的重复值
我有一个简单的数据帧:df=[{'col1':'A','col2':'B','col3':'C','col4':'0'},{'col1':'M','col2':'0','col3'
作者:编程之家 时间:2022-09-06
python – Pandas中的数据透视表小计
我有以下数据:EmployeeAccountCurrencyAmountLocationTest2BasicUSD3000AirportTest2NetUSD2000AirportTest1BasicUSD4000TownTest1NetUSD3000TownTest3
作者:编程之家 时间:2022-09-06
python – Pandas数据帧datetime到时间再到秒
我有一个数据帧.列包含时间戳.我想删除日期并将时间转换为秒.首先我将它们转换为日期时间:In:df_time=pd.to_datetime(df["Timestamp"])Out:02017-11-0713:09:0012017-11-0713:11:0022017-11-0713:13:0032017-11-0713:15:00dtype:datetime64[
作者:编程之家 时间:2022-09-06
python – 基于不同列中的值重复行
我有一个交易数据框.每行代表两个项目的交易(将其视为2个事件票据或其他事务的交易).我想根据销售数量复制每一行.这是示例代码:#dictionaryoftransactionsd={'1':['20','NYC','2'],'2':['30','NYC','2'],'3':['5&
作者:编程之家 时间:2022-09-06
python – Pandas – 在DataFrame中的任何位置查找值索引
我是Python&的新手大熊猫.我想在我的pandas数据帧中找到某个值的索引(比如说security_id),因为这是列开始的位置.(列数上方的行数不明,行数不相关,左侧有许多空“列”.)据我所知,isin方法只返回值是否存在的布尔值,而不是索引.如何找到该值的索引?解决方法:假设您的DataFrame如
作者:编程之家 时间:2022-09-06
使用python读取大型xlsx文件的一部分
我有一个包含100万行的大型.xlsx文件.我不想一次打开整个文件.我想知道我是否可以读取一大块文件,处理它然后读取下一个块?(我更喜欢用熊猫.)解决方法:是.熊猫支持分块阅读.你会去阅读这样的excel文件.importpandasaspdxl=pd.ExcelFile("myfile.xlsx")forsheet_nameinx
作者:编程之家 时间:2022-09-06
python – 用于在pandas数据帧中从单个行创建多个行的矢量化实现
对于输入表中的每一行,我需要通过基于每月分隔日期范围来生成多行.(请参阅以下示例输出).有一种简单的迭代方法可以逐行转换,但在大型数据帧上却非常慢.任何人都可以建议使用矢量化方法,例如使用apply(),map()等来实现目标吗?输出表是一个新表.输入:ID,START_DATE,END_DATE
作者:编程之家 时间:2022-09-06
python – 将逗号分隔字符串的数据帧转换为单热编码
我有一个由一列组成的大型数据帧(‘数据’).列中的每一行都由一个字符串组成,每个字符串由逗号分隔的类别组成.我希望对这些数据进行热编码.例如,data={"mesh":["A,B,C","C,B",""]}从这里我想得到一个包含以下内容的数据框:indexAB.C01
作者:编程之家 时间:2022-09-06
python – 在DataFrame的开头(最左端)插入一列
我有30列的数据框,并希望添加一个新列开始.解决方法:DataFrame.insertdf=pd.DataFrame({'A':['x']*3,'B':['x']*3})dfAB0xx1xx2xxseq=['a','b','c']#Thisworksin-place.df.in
作者:编程之家 时间:2022-09-06
python – PySpark.将Dataframe传递给pandas_udf并返回一个系列
我正在使用PySpark的新pandas_udf装饰器,我试图让它将多列作为输入并返回一个系列作为输入,但是,我得到一个TypeError:无效的参数示例代码@pandas_udf(df.schema,PandasUDFType.SCALAR)deffun_function(df_in):df_in.loc[df_in['a']<0]=0.0return(df_in['a']-
作者:编程之家 时间:2022-09-06
python – 获取pandas DataFrame的名称
如何获取DataFrame的名称并将其作为字符串打印?例:boston(var名称分配给csv文件)boston=read_csv('boston.csv')print('ThewinneristeamAbasedonthe%stable.)%boston解决方法:您可以使用以下命令对数据框命名,然后在任意位置调用名称:importpandasaspddf
作者:编程之家 时间:2022-09-06
python – 将大写应用于pandas数据帧中的列
我在将大写字母应用于DataFrame中的列时遇到了问题.数据帧是df.1/2ID是需要应用UPPERCASE的列标题.问题是这些值由三个字母和三个数字组成.例如,rrr123是其中一个值.df['1/2ID']=map(str.upper,df['1/2ID'])我收到一个错误:TypeError:描述符’upper’需要’str’对象但
作者:编程之家 时间:2022-09-06
python – 具有2行标头的pandas数据帧并导出到csv
我有一个数据帧df=pd.DataFrame(columns=["AA","BB","CC"])df.loc[0]=["a","b","c1"]df.loc[1]=["a","b","c2"]df.loc[2]=["a","b","c3&q
作者:编程之家 时间:2022-09-06
python – Pandas:将列拆分成多行
参见英文答案>Howtounnest(explode)acolumninapandasDataFrame? 11个我有一个关于将数据帧列中的列表拆分为多行的问题.假设我有这个数据帧:JobpositionJobtypeid0[6]
作者:编程之家 时间:2022-09-06
python – pd.to_numeric将整个系列转换为NaN
我正在尝试使用pd.to_numeric转换列,但由于某种原因,它将所有值(除了一个)转换为NaN:In[]:pd.to_numeric(portfolio["PrincipalRemaining"],errors="coerce")Out[]:1NaN2NaN3NaN4NaN5NaN6NaN7
作者:编程之家 时间:2022-09-06
python – 在seaborn热图上显示日期
我正在尝试使用seaborn库从pandas数据帧创建热图.这是代码:test_df=pd.DataFrame(np.random.randn(367,5),index=pd.DatetimeIndex(start='01-01-2000',end='01-01-2001',freq='1D'))ax=sns.heatmap(test_df.T)ax.xaxis.set_major
作者:编程之家 时间:2022-09-06
R foverlaps相当于Python
我试图用Python重写一些R代码,并且无法通过一些特定的代码.我发现R中的foverlaps函数在执行基于时间的连接时非常有用,但是在Python3中没有找到任何可行的函数.我正在做的是连接两个数据表,其中一个表中的时间落在另一个表中的start_time和end_time之间.两个表的周期性不同–ta
作者:编程之家 时间:2022-09-06
python – Pandas groupby和聚合输出应包括所有原始列(包括未聚合的列)
我有以下数据框架,并希望:>按月分组记录>每个唯一UPC_ID的SumQTY_SOLD和NET_AMT(每月)>在结果数据框中包括其余列我认为我可以做到这一点的方式是第一:创建一个月份列来聚合D_DATES,然后通过UPC_ID对QTY_SOLD求和.脚本:#Convertdatetodatetimeobjectdf['D_DATE']=pd.t
作者:编程之家 时间:2022-09-06
python – 在Pandas中添加几个月的日期
我试图弄清楚如何在Pandas数据帧中添加3个月的日期,同时保持日期格式,以便我可以使用它来查找范围.这就是我尝试过的:#createdataframedf=pd.DataFrame([pd.Timestamp('20161011'),pd.Timestamp('20161101')],columns=['date'])#createafuturemon
作者:编程之家 时间:2022-09-06
python – 过滤掉超过一定数量NaN的行
在Pandas数据框中,我想过滤掉所有超过2个NaN的行.基本上,我有4列,我想只保留至少2列有限值的那些行.有人可以建议如何实现这一目标吗?解决方法:以下应该有效df.dropna(thresh=2)见onlinedocs我们在这里做的是删除任何NaN行,其中一行中有2个或更多非NaN值.例:In[25]:imp
作者:编程之家 时间:2022-09-06
python – 将MultiIndex数据帧重塑为表格格式
给出一个MultiIndex示例:idx=pd.MultiIndex.from_product([[0,1,2],['a','b','c','d']])df=pd.DataFrame({'value':np.arange(12)},index=idx)dfvalue0a0b1c2d
作者:编程之家 时间:2022-09-06
python – Pandas在连接后重新计算索引
我有一个问题,我通过沿行轴连接(垂直堆叠)生成一个pandas数据帧.每个组成数据帧都有一个自动生成的索引(递增数字).连接后,我的索引被搞砸了:它计数到n(其中n是相应数据帧的形状[0]),并在下一个数据帧重新开始.我试图“重新计算索引,给定当前的顺序”,或“重新索引”(或者我认为)
作者:编程之家 时间:2022-09-06
如何从内存中删除多个pandas(python)数据帧以节省RAM?
我有许多数据帧作为预处理的一部分创建.由于我有6GB内存限制,我想从RAM中删除所有不必要的数据帧,以避免在scikit-learn中运行GRIDSEARCHCV时内存不足.1)是否只有列出的功能,当前加载到内存中的所有数据帧?我尝试了dir()但它提供了许多除dataframe之外的其他对象.2)我创建了一个
作者:编程之家 时间:2022-09-06
python – Pandas重采样错误:仅对DatetimeIndex或PeriodIndex有效
在DataFrame上使用panda的重采样功能以将刻度数据转换为OHLCV时,会遇到重采样错误.我们该如何解决错误?data=pd.read_csv('tickdata.csv',header=None,names=['Timestamp','Price','Volume']).set_index('Timestamp')data.head()#Resampledatainto
作者:编程之家 时间:2022-09-06
上一页
64
65
66
67
68
69
70
71
下一页
小编推荐
热门标签
更多
python
JavaScript
java
HTML
reactjs
C#
Android
CSS
Node.js
sql
r
python-3.x
MysqL
jQuery
c++
pandas
Flutter
angular
IOS
django
linux
swift
typescript
路由器
JSON
路由器设置
无线路由器
h3c
华三
华三路由器设置
华三路由器
电脑软件教程
arrays
docker
软件图文教程
C
vue.js
laravel
spring-boot
react-native