我有一个包含两列的数据框:id和issues;基于此数据框,我创建了一个新列:issues_v1使用:
mydf['Issue_v1']='"'+ mydf['issues']+ '"' +','
这是我的示例数据,抱歉更新截图有问题,所以我必须输入以下格式:
id issues issues_v1
1001 A "A",
1001 A "A"
1001 NaN NaN
1002 A "A",
1002 A "A"
1002 NaN NaN
但是,我想在这里应用的规则是让B列(问题)中的值检查下一行中的值,如果是NaN,则给我“A”而不是“,”,否则返回“A”,当然,如果当前行为null,则返回null.
仅供参考,如果excel中的逻辑(类似)应该是:
= IF(ISBLANK(B2), “”,IF(ISBLANK(B3), “” “” &安培; B2&安培; “” “” “” “” &安培; B2&安培; “” “”))
那么如何使用Python实现相同的目标呢?谢谢
解决方法:
让我们分两个阶段使用Series.mask执行此操作:
m = df.issues.notna()
a = df['issues'].mask(m, '"' + df.issues + '"')
b = pd.Series('', index=a.index).mask(df.issues.shift(-1).notna() & m, ',')
df['issues_v1'] = (a + b)
df
id issues issues_v1
0 1001 A "A",
1 1001 A "A"
2 1001 NaN NaN
3 1002 A "A",
4 1002 A "A"
5 1002 NaN NaN
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。