BDS定位
BDS针对开源HBase目前存在的同步迁移痛点,自主研发的一套数据迁移的平台,用于HBase集群的无缝迁移、主备容灾、异地多活、在线离线业务分离、HBase数据归档、对接RDS实时增量数据等等。目的在于帮助阿里云上客户解决自建HBase、EMR HBase、ApSara HBase的数据导入导出,从而方便云上客户围绕HBase构建高可用、灵活的业务系统。
使用场景
BDS在云上目前主要有以下几个使用场景:
新旧集群无缝迁移
在线离线业务分离
主备容灾
RDS实时数据同步到HBase、Phoenix
新旧集群无缝迁移
使用范围
业务流程
在线离线业务分离
业务架构
通过BDS,将在线业务数据实时同步到离线集群,结合Spark、MR等大数据组件进行离线的数据分析,从而不影响在线业务的查询。
主备容灾
业务流程
通过BDS在主备集群之间实现实时数据的双向同步,当主集群出现问题,可以切换到备集群,尽可能减少对业务产生的影响,当主集群服务恢复之后,通过BDS同步服务补齐主集群遗漏的数据。
RDS实时数据同步到HBase、Phoenix
业务架构
通过BDS将RDS数据实时同步到HBase集群
结合Spark、MR等大数据组件进行离线的数据分析,从而不影响在线业务的查询
做RDS的历史库
BDS优势
功能性
迁移同步对业务方无感知
不停服数据迁移,同时搞定历史数据迁移、实时增量数据的同步
对业务端应用代码无侵入
迁移同步对业务影响小
迁移过程中基本不会和集群的HBase交互,只读写集群的HDFS
可以动态调整迁移的速度和并发读
正确性
保证数据迁移的不丢失
数据的抽样校验
稳定性
高效性
总结
BDS已经在阿里云上线了,方便云上的客户在自建HBase、EMR HBase、ApSara HBase之间进行数据的迁移和实时数据同步。
在云上已经服务40多个客户,帮助客户实现集群之间的无缝迁移,集群的升配,主备容灾,数据迁移同步规模达到400多T(单副本)。
云上有迁移需求的客户,可以查看《BDS服务介绍》,或者联系侧田:
https://help.aliyun.com/document_detail/120883.html
对BDS实现原理及方案比较感兴趣的朋友,可以查看《BDS-HBase数据同步方案的设计与实践》:
https://yq.aliyun.com/articles/704977
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。