本周学习了hadoop的前三个短视频,
笔记如下:
存储框架:
HDFS(分布式文件存储系统),HBASE(分布式数据库系统),KAFKA(分布式消息缓存系统)
运算框架:(帮助用户把逻辑在多机器上运行)
mapreduce,离线批处理,
spark,离线批处理/实时流式计算,
storm 只能做实时流式计算。
辅助类的工具:
HIVE 数据仓库工具(不是数据库,可以接收sql翻译成mapreduce或者spark运行)
FLUME 数据采集
SQOOP 数据迁移
ELASTIC SEARCH 分布式搜索引擎
HDFS:对用户提供一个统一个目录树,
存储用户的文件时:会切成若干文件块分布式存储在多台DATA NODE的服务器中,
datanode记在内存中;
用户的文件块可以存储多个副本,以增强数据的安全性
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。