微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Apache Gobblin 分布式数据集成框架

程序名称:Apache Gobblin

授权协议: Apache-2.0

操作系统: 跨平台

开发语言: Java

Apache Gobblin 介绍

Gobblin 是 Hadoop 通用数据摄取框架,可以从各种数据源中提取,转换和加载海量数据。比如:数据库,rest
APIs,filers,等等。Gobblin 处理日常规划任务需要所有数据摄取
ETLs,包括作业/任务规划,任务分配,错误处理,状态管理,数据质量检测,数据发布等等。

Gobblin
通过同样的执行框架从不同数据源摄取数据,在同一个地方管理所有不同数据源的元数据。同时结合了其他特性,比如自动伸缩,容错,数据质量保证,可扩展和处理数据模型改革等等。Gobblin
变得更容易使用,是个高效的数据摄取框架。

Apache Gobblin 官网

https://github.com/apache/incubator-gobblin

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐