AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

在多个不同切片上应用聚合函数

时间：2020-09-14分类：设计模式作者：编程之家

我有一个数据数组,其中包含有关人员和项目的一些信息：

person_id | project_id | action | time
--------------------------------------
        1 |          1 |      w |    1
        1 |          2 |      w |    2
        1 |          3 |      w |    2
        1 |          3 |      r |    3
        1 |          3 |      w |    4
        1 |          4 |      w |    4
        2 |          2 |      r |    2
        2 |          2 |      w |    3

我想用一些名为“first_time”和“first_time_project”的字段来扩充这些数据,这些字段共同确定第一次看到该人的任何操作,并且第一次开发人员看到了对项目的任何操作.最后,数据应如下所示：

person_id | project_id | action | time | first_time | first_time_project
------------------------------------------------------------------------
        1 |          1 |      w |    1 |          1 |                  1
        1 |          2 |      w |    2 |          1 |                  2
        1 |          3 |      w |    2 |          1 |                  2
        1 |          3 |      r |    3 |          1 |                  2
        1 |          3 |      w |    4 |          1 |                  2
        1 |          4 |      w |    4 |          1 |                  4
        2 |          2 |      r |    2 |          2 |                  2
        2 |          2 |      w |    3 |          2 |                  2

我这样做的天真的方式是编写几个循环：

for (pid in unique(data$person_id)) {
    data[data$pid==pid,"first_time"] = min(data[data$pid==pid,"time"])
    for (projid in unique(data[data$pid==pid,"project_id"])) {
        data[data$pid==pid & data$project_id==projid,"first_time_project"] = min(data[data$pid==pid & data$project_id==projid,"time"]
    }
}

现在,通过双嵌套循环看到这将变得非常缓慢并不是天才.但是,我无法想办法在R中处理这个问题.我有点仿效sql的group by选项.我知道也许可以提供帮助,但我无法弄清楚如何做多片.

关于如何将我的代码从冰冷的速度变慢到更快的东西的任何提示？我现在对蜗牛感到高兴.

解决方法

试试大道：

transform(data,first_time = ave(time,person_id,FUN = min),first_time_project = ave(time,project_id,drop = TRUE,FUN = min)
)

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

迭代器模式（Iterator）

迭代器模式（Iterator）迭代器模式（Iterator）[Cursor]意图：提供一种方法顺序访问一个聚合对象中的每个元素，而又不想暴露该对象的内部表示。应用：STL标准库迭代器实现、Java集合类型迭代器等模式结构：心得：迭代...

作者：Florian 时间：2024-07-31

高性能IO模型浅析

高性能IO模型浅析服务器端编程经常需要构造高性能的IO模型，常见的IO模型有四种：（1）同步阻塞IO（BlockingIO）：即传统的IO模型。（2）同步非阻塞IO（Non-blockingIO）：默认创建的socket都是阻塞的，非阻塞IO要求...

作者：Florian 时间：2024-07-31

策略模式（Strategy）

策略模式（Strategy）策略模式（Strategy）[Policy]意图：定义一系列算法，把他们封装起来，并且使他们可以相互替换，使算法可以独立于使用它的客户而变化。应用：排序的比较方法、封装针对类的不同的算法、消除条件...

作者：Florian 时间：2024-07-31

访问者模式（Visitor）

访问者模式（Visitor）访问者模式（Visitor）意图：表示一个作用于某对象结构中的各元素的操作，它使你在不改变各元素的类的前提下定义作用于这些元素的新操作。应用：作用于编译器语法树的语义分析算法。模式结构：...

作者：Florian 时间：2024-07-31

命令模式（Command）

命令模式（Command）命令模式（Command）[Action/Transaction]意图：将一个请求封装为一个对象，从而可用不同的请求对客户参数化。对请求排队或记录请求日志，以及支持可撤消的操作。应用：用户操作日志、撤销恢复操...

作者：Florian 时间：2024-07-31

生成器模式（Builder）

生成器模式（Builder）生成器模式（Builder）意图：将一个对象的构建和它的表示分离，使得同样的构建过程可以创建不同的表示。应用：编译器词法分析器指导生成抽象语法树、构造迷宫等。模式结构：心得：和工厂模式不...

作者：Florian 时间：2024-07-31

设计模式学习心得

设计模式学习心得《设计模式：可复用面向对象软件的基础》一书以更贴近读者思维的角度描述了GOF的23个设计模式。按照书中介绍的每个设计模式的内容，结合网上搜集的资料，我将对设计模式的学习心得总结出来。网络上关...

作者：Florian 时间：2024-07-31

工厂方法模式（Factory Method）

工厂方法模式（Factory Method）工厂方法模式（Factory Method）[Virtual Constructor]意图：定义一个用于创建对象的接口，让子类决定实例化哪一个类，使一个类的实力化延迟到子类。应用：多文档应用管理不同类型的文...

作者：Florian 时间：2024-07-31

单例模式（Singleton）

单例模式（Singleton）单例模式（Singleton）意图：保证一个类只有一个实例，并提供一个访问它的全局访问点。应用：Session或者控件的唯一示例等。模式结构：心得：单例模式应该是设计模式中最简单的结构了，它的目的...

作者：Florian 时间：2024-07-31

装饰者模式（Decorator）

装饰者模式（Decorator）装饰者模式（Decorator）[Wrapper]意图：动态的给一个对象添加一些额外的职责，就增加功能来说，比生成子类更为灵活。应用：给GUI组件添加功能等。模式结构：心得：装饰器（Decorator）和被装...

作者：Florian 时间：2024-07-31