微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

​Tera 特性数据模型系统架构系统依赖系统构建使用示例反馈与技术支持 分布式表格系统

程序名称:​Tera 特性数据模型系统架构系统依赖系统构建使用示例反馈与技术支持

授权协议: BSD

操作系统: Linux

开发语言: C/C++

​Tera 特性数据模型系统架构系统依赖系统构建使用示例反馈与技术支持 介绍

tera
一个性能、可伸缩的数据库系统,被设计用来管理搜索引擎万亿量级的超链与网页信息。为实现数据的实时分析与高效访问,我们使用按行键、列名和时间戳全局排序的三维数据模型组织数据,使用多级Cache系统,充分利用新一代服务器硬件大内存、SSD盘和万兆网卡的性能优势,做到模型灵活的同时,实现了高吞吐与水平扩展。

特性

数据模型

tera使用了bigtable的数据模型,可以将一张表格理解为这样一种数据结构:
map >
其中RowKey、ColumnFamily、Qualifier和Value是字符串,Timestamp是一个64位整形。ColumnFamliy需要建表时指定,是访问控制、版本保留等策略的基本单位。

系统架构

系统主要由Tabletserver、Master和ClientSDK三部分构成。其中Tabletserver是核心服务器,承载着所有的数据管理与访问;Master是系统的仲裁者,负责表格的创建、schema更新与负载均衡;ClientSDK包含供管理员使用的命令行工具teracli和给用户使用的SDK。
表格被按RowKey全局排序,并横向切分成多个Tablet,每个Tablet负责服务RowKey的一个区间,表格又被纵向且分为多个LocalityGroup,一个Tablet的多个Localitygroup在物理上单独存储,可以选择不同的存储介质,以优化访问效率。

系统依赖

  • 使用分布式文件系统(HDFS、NFS等)持久化数据与元信息

  • 使用zookeeper选主与协调

  • 使用Sofa-pbrpc实现跨进程通信

系统构建

参考BUILD

使用示例

参考wiki

反馈与技术支持

[email protected]

​Tera 特性数据模型系统架构系统依赖系统构建使用示例反馈与技术支持 官网

https://github.com/Baidu/tera

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐