大数据技术

ubtun 免密登录

HBase简介:

1.1 HBase定义,

HBase是一种分布式、可扩展、支持海量数据存储的NoSQL数据库

1.2 Hbase数据模型

逻辑上,HBase的数据模型同关系型数据库很类似,数据存储在一张表中,有行有列。从 底层物理存储结构(K-V) ,更像一个mult-dimensional map 多维度 .使用bigtable

1.2.1 HBase逻辑结构

网址:Apache HBase – Apache HBase™ Home

image-20211129151632259

行键与列族:按字典顺序进行排列,每一个当中都会有

region是一张表的切片,

store 真正的存储元素

row key 行键

1.2.1 HBase物理存储结构

HBase快速入门:

HBase 进阶:

HBase优化:

HBase实战:

Zookeeper的特点:

(1) 一个Leader ,多个跟随者

(2) 半个以上节点存

image-20211215214204914

大数据技术:

阿里云+ 腾讯云

权限分配:

启动所有结点:

hbase shell

hbase网页查看:

image-20220510014703512

jdk jdk-8u291
版本
hbase hbase-2.4.8-bin.tar.gz
hadoop Hadoop 3.2.2
zookeeper apache-zookeeper-3.7.0-bin.tar.gz
机器 120.26.160.122 jin 主 阿里云
121.43.229.146 liwei 阿里云
81.71.122.141 zcs 腾讯云
远程连接工具 xshell、xftp
项目结构 jdk1.8+ maven

Hadoop:

启动后网站访问:

Browsing HDFS

hadoop 网站记录访问

Namenode information

启动指令

start-all.sh

stop-all.sh

start-yarn.sh

stop-yarn.sh

端口:

Hadoop 2.x常用端口及查看方法 - FryFish - 博客园 (cnblogs.com)

image-20211220225523476

HBase:

基本指令:

start-hbase.sh 开启hbase

hbase shell 开启控制面板

启动访问网站:

Master: jin

(30条消息) HDFS 原理详解【读写数据流程、NameNode与DataNode工作机制、checkpoint】_zp的博客-CSDN博客_简述hdfs读数据的原理

Hadoop(一)Hadoop&HDFS简单介绍 - 知乎 (zhihu.com)

(30条消息) HBase分布式架构处理大数据量(高并发和实时处理)_猪大肠的世界-CSDN博客_hbase支持多大的并发查询

干货分享 | HBase底层存储结构,HBase快速读取,Hadoop的高可用和zk作用 - 知乎 (zhihu.com)

image-20211220155423954

hdfs封装:

(30条消息) JAVA 上传本地文件到HDFS_程序员-CSDN博客_java上传文件到hdfs

[(30条消息) 前端上传文件到HDFS_rsj760337874的博客-CSDN博客](https://blog.csdn.net/rsj760337874/article/details/107937197

(30条消息) 前端上传文件到HDFS_rsj760337874的博客-CSDN博客

(30条消息) HDFS的Java Api操作【获取Hdfs文件系统、遍历、创建文件和文件夹、上传、下载、权限访问控制、合并上传或下载】_shuyv的博客-CSDN博客_hdfs文件下载

权限区别:

(30条消息) linux系统644、755、777权限详解_betterAndroider的博客-CSDN博客_644权限

image-20211224011439680

image-20211224011447711

image-20211224011528863