一、Zookeeper介绍官网介绍文档:http://zookeeper.apache.org/doc/trunk/zookeeperOver.html1.1 Zookeerper简介 ZooKeeper本质上是一个分布式的小文件存储系统。原本是Apache Hadoop的一个组件,后来被拆分为一个Hadoop的独立子项目,现已经成为 Apache 的顶级项目。 &
进行任何rpm操作时提示:#rpm -qa|grep openssl|grep openssl-1.0.1e|wc -lerror: db3 error(12) from dbenv->open: Cannot allocate memory
error: db3 error(12) from dbenv->close: Cannot allocate&
前面我们玩的都是单点namenode,如果namenode出问题了后者说元数据丢失了一部分,那就呵呵哒了,这也是以前存在的一个很大的安全隐患,但是现在已经不是啥问题了。再来吹一波。HDFS就是Hadoop加DFS,所以我们这里就用Hadoop HA来统称了。一、Hadoop HA的发展史1.1 hadoop 1.0的单点问题在hadoop 1.0时代,只有一个Namenode,这也是被人胆小的地方,用各种措施来保证元数据的安全。如果NameNode数据丢失或者不能工作,那么整个集群就不能恢复了。
hadoop使用的是HDFS分布式文件系统,既然是存储就可能要面临存储节点磁盘使用达到预警值的情况,当出现这种情况的时候,要么你就清理一下,那么就要新增数据存储节点了,这两种方式我们都采取过.一、增加datanode节点1.1 静态添加静态新增的方式,就相当于一开始部署hdfs集群规划一样,停止NameNode服务,新增数据节点。下面是操作步骤:停止服务(namenode节点操作)$ /home/hadoop/hadoop/sbin/stop-all.sh 修改配置文件slaves文件(name
一、集群测试前面已经记录了集群的搭建以及一些命令的操作。1.1 在主节点上面查看集群的状态$ hdfs dfsadmin -report #打印集群的信息Configured Capacity: 8449759969280 (7.69 TB)
Present Capacity: 8017074094080 (7.29 TB)
DFS Remaining: 8012713713664
物理机群过多的话,硬盘故障是不可避免的问题,如何及时的监控物理硬盘的问题,然后出问题了应汇报出来方便硬盘及时的更换等,当着有很多种方式,定时任务脚本啊,监控工具啊等。普通硬盘故障的检测方式:我这里就先记录一种通过过滤/var/log/messages日志的方式来检测硬盘故障的方式。本来打算贴下两年前写的脚本加定时任务的方式,后来想了下每个人写脚本的习惯和方式可能不一样,就简单记录下当时是怎么想的了。egrep -i 'sd[a-z]*.*err|error*.*sd[a-z]|sd[a-
上一章:http://www.51niux.com/?id=175 #已经对hadoop进行了介绍和hadoop的集群部署做了介绍,这里在深入的继续记录。官网文档:https://hadoop.apache.org/docs/ #这里有各个版本的一些文档一、操作命令1.1 Hadoop命令概述:官网文档:https://hadoop.apache.org/docs/r2.7.4/hadoop-project-dist/hadoop-common/CommandsMan
写博客被朋友喷,写个东西也不介绍下,谁知道你写的是个什么东西,干什么的。好的下面对hadoop好好介绍介绍。
Hadoop是Apache开源组织的一个分布式计算开源框架(http://hadoop.apache.org/),Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架,实现在大量计算机组成
堡垒机大家都已经不在陌生,堡垒机不仅仅是跳板机,还会有操作日志审计等一系列的功能,简而言之就是你对服务器的操作就是交给堡垒机,堡垒机会验证你的权限,有对应主机的权限才能做相应的操作。堡垒机分商业的也分开源的,当然开源大家印象比较深的就是jumpserver。这些概念性的东西百度一搜很多的,很详细。jumpserver官网:http://www.jumpserver.org/jumpserver源码下载:https://github.com/jumpserver/jumpserverjumpser
当然现在基本各种分布式的情况下,用到inotify+rsync进行目录的实时同步的形式场景已经不是很多了,但是还是有点的,比如机器规模少就两台机器间进行数据同步,可能就要简单的来搞一搞。这里就不说rsyncd服务器怎么搭建了,以前有一篇记录。 Inotify 是一个 Linux特性,它监控文件系统操作,比如读取、写入和创建。Inotify 反应灵敏,用法非常简单,并且比 cron 任务的