HBase的Shell命令和JavaAPI 表操作创建表create 'student','info' #表名 列族 插入表put 'student','1001','info:sex 2018-12-31 大数据 HBase HBase数据模型和读写原理 HBase是一个开源可伸缩的分布式数据库,他根据Google Bigtable数据模型构建在hadoop的hdfs存储系统之上。 HBase是一个稀疏、多维度、排序的映射表。表的索引是行键、列族、列限定符和时间戳,一个列族中可以包含 2018-12-30 大数据 HBase HBase原理和安装 Hbase简介HBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为Hadoop的子项目来开发维护,用于支持结构化的数据存储。 官方网站:http://hbase.apache.org 2006年Google 2018-12-30 大数据 HBase MapReduce高级编程2 TOP N对于一组输入List(key,value),我们要创建一个Top N 列表,这是一种过滤模式,查看输入数据特定子集,观察用户的行为。 解决方案key是唯一键,需要对输入进行额外的聚集处理,先把输入分区成小块,然后把每个小块发送到一 2018-12-28 大数据 MapReduce MapReduce高级编程 计数器数据集在进行MapReduce运算过程中,许多时候,用户希望了解待分析的数据的运行的运行情况。Hadoop内置的计数器功能收集作业的主要统计信息,可以帮助用户理解程序的运行情况,辅助用户诊断故障。 SLF4J: Actual bind 2018-12-28 大数据 MapReduce MapReduce源码刨析 Mapmap函数是对一些独立元素组成的概念列表(如单词计数中每行数据形成的列表)的每一个元素进行指定的操作(如把每行数据拆分成不同单词,并把每个单词计数为1),用户可以自定义一个把数据拆分成不同单词并把单词计数为1的映射map函数),事实上 2018-12-25 大数据 MapReduce MapReduce的工作机制 框架Hadoop2.x引入了一种新的执行机制MapRedcue 2。这种新的机制建议在Yarn的系统上,目前用于执行的框架可以通过mapreduce.framework.name属性进行设置,值“local“表示本地作业运行器,“class 2018-12-24 大数据 MapReduce MapReduce入门和优化方案 Mapreduce概述Mapreduce式谷歌开源的一项重要技术,是一个编程模型,用来进行大数据量的计算,对于大数据量的计算通常采用的处理方式式并行计算,对于许多开发者来说,自己完全实现一个并行计算程序难度太大.而MapReduce就是一种 2018-12-22 大数据 MapReduce Hadoop的RPC工作原理 Hadoop的远程过程调用(Remote Procedure Call,RPC)是Hadoop中核心通信机制,RPC主要通过所有Hadoop的组件元数据交换,如MapReduce、Hadoop分布式文件系统(HDFS)和Hadoop的数据库 2018-12-20 大数据 Hadoop