AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

Apache Spark 开源集群计算环境

程序名称：Apache Spark

授权协议: BSD

操作系统: 跨平台

开发语言: Scala

Apache Spark 介绍

Apache Spark 是一种与 Hadoop
相似的开源集群计算环境，但是两者之间还存在一些不同之处，这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越，换句话说，Spark
启用了内存分布数据集，除了能够提供交互式查询外，它还可以优化迭代工作负载。

Spark 是在 Scala 语言中实现的，它将 Scala 用作其应用程序框架。与
Hadoop 不同，Spark 和 Scala 能够紧密集成，其中的 Scala 可以像操作本地集合对象一样轻松地操作分布式数据集。

尽管创建 Spark 是为了支持分布式数据集上的迭代作业，但是实际上它是对 Hadoop 的补充，可以在 Hadoo 文件系统中并行运行。通过名为
Mesos 的第三方集群框架可以支持此行为。Spark 由加州大学伯克利分校 AMP 实验室 (Algorithms, Machines, and
People Lab) 开发，可用来构建大型的、低延迟的数据分析应用程序。

一个简单的计算：

file = spark.textFile("hdfs://...")
 
file.flatMap(line => line.split(" "))
    .map(word => (word, 1))
    .reduceByKey(_ + _)

Apache Spark 官网

http://spark.apache.org/

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

分布式应用网格

相关推荐

Memcached Session Manager

memcached-session-manager 将session存储到memchached实现方案时。他主要功能是修改tomcat的session存储机制，使之能够把session序列化存放到memcached中。

作者：编程之家时间：2021-10-21

Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作，以提升性能。

作者：编程之家时间：2021-10-21

EasyTomcat 是一个用来帮助简化 Tomcat 和MySQL 管理的系统，你可以启动、停止和配置 Tomcat和MySQL

作者：编程之家时间：2021-10-21

riak-session-manager

riak-session-manager 是使用 Riak 来存储Tomcat session 信息的项目。配置方法：

作者：编程之家时间：2021-10-21

tomcat-redis-session-manager

tomcat-redis-session-manager 是一个用来将 Tomcat 的 Session 数据存储在 Redis 库中的项目。

作者：编程之家时间：2021-10-21

Tomcat Extensions for JDeveloper 11g

这是一款在 Oracle 的 JDeveloper 开发环境下管理Tomcat 的插件，如下图所示：

作者：编程之家时间：2021-10-21

扩展Tomcat 6.x，使用redis存放session信息!是一个Eclipse项目,最好用EGit来Clone(因为里面有个中文文件名的说明文件).

作者：编程之家时间：2021-10-21

dhcpcd 是一个兼容 RFC2131的DHCP客户端程序，支持DHCP的全部功能并且体积非常小，只有差不多 46k。

作者：编程之家时间：2021-10-21

phpDHCPAdmin 是一个基于 Web 的动态主机配置协议(DHCP Daemon)的管理工具，可单独设置组、用户级别；PXE、多子网；空间租赁管理功能。可对数据进行可视化展示、分类。适合大规模的 dhcpd 环境管理。

作者：编程之家时间：2021-10-21

JDHCP 项目的目的是为 Java 应用增加简单操作 DHCP 协议的方法，DHCP是动态主机配置协议的简称。使用这个API可以轻松的发送、接收和解析DHCP消息，可用于编写DHCP的客户端、服务器端应用。

作者：编程之家时间：2021-10-21