微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

HBase实战 | HBase在B站Saber平台的实践

Saber平台建设之路

标准化指标输出,通用指标模型设计

  • HBase表存储指标明细数据

  • RowKey设计准则:

    • rowkey=指标列+时间列+存储粒度

    • 指标列:提供灵活的拼装规则,主要由指标ID+维度1+维度2...而针对移动端APP埋点上报的流数据质量,则可划分为:指标ID、维度枚举值、流数据ID、客户端版本号。PS:而维度枚举值的取值范围为(长度为2):01.一致性,02.完整性,03.唯一性,04.准确性,05.规范性,06到99.自定义

    • 时间列:该列采用认格式,即“YYYYMMDD”

    • 存储粒度:该列采用枚举值,1:天粒度,2:小时粒度,3:分钟粒度。


  • 列族设计

    • 列族根据存储粒度来进行列族的划分,例如针对天粒度的则只有一个列,针对小时粒度则有24列,针对分钟粒度则有1440列。

图片


图片


图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片


图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片



版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐