设为首页收藏本站

小牛社区-大数据学习交流社区|大数据免费学习资源

 找回密码
 立即注册!

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 55|回复: 0

大数据HBase适用于哪些业务场景?内附HBase+Hadoop福利

[复制链接]

119

主题

0

帖子

16

积分

吃土小白

Rank: 1

积分
16
发表于 2018-1-7 02:38:30 | 显示全部楼层 |阅读模式
HBase是依据谷歌的BigTable设计的。典型应用场景就是不断插入新的信息,而并不怎么修改。比如现在Facebook的messenger就是用HBase实现的。
这里要提到HBase是按行存储的,所以特点就是插入(ingest)快。但是做分析的时候经常是要按列扫描(scan)的。比如算一个公司员工的平均工资。
Cloudera在推出新的列存储引擎Kudu的时候讨论过HDFS,HBase,和Kudu的应用场景。

但HBase也存在不适用的场景。
首先,确信有足够多数据,如果有上亿或上千亿行数据,HBase是很好的备选。如果只有上千或上百万行,则用传统的RDBMS可能是更好的选择。因为所有数据如果只需要在一两个节点进行存储,会导致集群其他节点闲置。
其次,确信可以不依赖于RDBMS的额外特性。例如,列数据类型、第二索引、事务、高级查询语言等。
最后,确保有足够的硬件。因为HDFS在小于5个数据节点时,基本上无法体现它的优势。虽然HBase能在单独的笔记本上运行良好,但这应仅当成是开发阶段的配置 。
讨论了以上内容,小编为准备入门并深入学习HBase的同学整理好了学习资料,同时建议大家配合Hadoop的内容来学习,这样可以帮助大家更加全面的认识大数据的应用工具。需要的同学私信小编即可。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册!

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册!

本版积分规则

快速回复 返回顶部 返回列表