hadoop共16篇
大数据框架之Hadoop:MapReduce(五)Yarn资源调度器 - MaxSSL

大数据框架之Hadoop:MapReduce(五)Yarn资源调度器

ApacheYARN(YetAnotherResourceNegotiator)是hadoop2.0引入的集群资源管理系统。用户可以将各种服务框架部署在YARN上,由YARN进行统一地管理和资源分配。简言之,Yarn是一个资源调度…
MaxSSL的头像 - MaxSSLMaxSSL2年前
90
大数据技术之Hadoop(Yarn) - MaxSSL

大数据技术之Hadoop(Yarn)

第1章Yarn资源调度器我们先来思考下面几个问题:1)如何管理集群资源?2)如何给任务合理分配资源?Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平...
MaxSSL的头像 - MaxSSLMaxSSL2年前
190
Hadoop集群搭建 - MaxSSL

Hadoop集群搭建

Hadoop集群搭建Hadoop集群简介HDFS集群YARN集群Hadoop部署模式Hadoop集群源码编译安装0.Hadoop源码编译1.集群角色规划2.服务器基础环境准备安装JDK1.8(安装OracleJDK8)3.创建Ha…
MaxSSL的头像 - MaxSSLMaxSSL2年前
40
3台机器配置hadoop集群_Hadoop+Hbase 分布式集群架构 - MaxSSL

3台机器配置hadoop集群_Hadoop+Hbase 分布式集群架构

安装搭建Hadoop1、配置说明本次集群搭建共三台机器,具体说明下:主机名IP说明nn01192.168.1.51DataNode、NodeManager、ResourceManager、NameNodedn01192.168.1…
MaxSSL的头像 - MaxSSLMaxSSL2年前
110
实训任务4:Hadoop综合操作 - MaxSSL

实训任务4:Hadoop综合操作

文章目录1.启动Hadoop服务2.创建文本文件3.上传文本文件4.显示文件内容5.完成排序任务6.计算最大利润和平均利润1.启动Hadoop服务在master虚拟机上执行命令:start-all.sh2.创建文本文件在maste...
MaxSSL的头像 - MaxSSLMaxSSL3年前
20
【大数据处理技术】「#1」本地数据集上传到数据仓库Hive - MaxSSL

【大数据处理技术】「#1」本地数据集上传到数据仓库Hive

文章目录实验数据集下载下载实验数据集建立一个用于运行本案例的目录dbtaobao数据集的预处理删除文件第一行记录,即字段名称获取数据集中双11的前100000条数据导入数据仓库实验数据集下载下载实...
MaxSSL的头像 - MaxSSLMaxSSL3年前
140
分布式的设计思想 - MaxSSL

分布式的设计思想

一、分布式设计基础传统架构问题①单机资源不足存储:3台机器,每台机器都有2T的硬盘空间,但是现在有1个3T的文件要存储计算:3台机器,每台机器都有8核CPU和8GB内存,但是现在有1个程序需要12...
MaxSSL的头像 - MaxSSLMaxSSL3年前
30
大数据HDFS凭啥能存下百亿数据? - MaxSSL

大数据HDFS凭啥能存下百亿数据?

前言大家平时经常用的百度网盘存放电影、照片、文档等,那有想过百度网盘是如何存下那么多文件的呢?难到是用一台计算机器存的吗?那得多大磁盘啊?显然不是的,那本文就带大家揭秘。分布式存储...
MaxSSL的头像 - MaxSSLMaxSSL3年前
120
Hadoop核心之MapReduce框架总结Ⅰ - MaxSSL

Hadoop核心之MapReduce框架总结Ⅰ

说明:在每一章节的重点概括,是笔者理解,感觉比较重要的内容,仅供笔者复习时使用。MapReduce框架总结目录1.MapReduce概述1.1MapReduce定义1.2MapReduce优缺点1.3MapReduce核心思想1.…
MaxSSL的头像 - MaxSSLMaxSSL3年前
30
Hadoop之企业级解决方案 - MaxSSL

Hadoop之企业级解决方案

目录1.小文件问题及企业级解决方案1.1小文件问题1.2小文件解决方案1.2.1SequenceFile1.2.2MapFile1.3读取HDFS上的SequenceFile实现WordCount案例2.MapReduce数据倾斜…
MaxSSL的头像 - MaxSSLMaxSSL3年前
30
Hadoop(四) - MaxSSL

Hadoop(四)

目录Hadoop部署一、配置core-site.xml。代理主机二、HDFS配置文件三、YARN配置四、MapReduce配置文件五、配置workers配置历史服务器一、配置mapred-site.xml配置日志的聚集Hadoop…
MaxSSL的头像 - MaxSSLMaxSSL3年前
320
网络安全——文件上传内容检查绕过 - MaxSSL

网络安全——文件上传内容检查绕过

文件上传内容检查绕过第一步,打开网络拓扑,启动实验虚拟机。第二步,打开桌面上的Chrome浏览器,在地址栏中输入http://127.0.0.1,进入upload-labs页面中,然后点击左侧的导航栏Pass-13进入关...
MaxSSL的头像 - MaxSSLMaxSSL3年前
180