gpfs里面failure的用法group与复制的关系,怎么查看条带化

解决方法:关闭防火墙

–a查看節点状态一直为down,查看日志(GPFS日志路径:/var/adm/ras)内容为:

解决方法:重新编译GPFS文件

:wq保存退出,之后重新执行安装过程中的编译操作

接下来啟动激活全部节点,mmstartup –a

解决方法:以上两种出错情况,都是因为没有在hosts文件中配置主机名导致无法识别,所以只需要在etc目录下的hosts文件Φ添加对应的主机就行了格式如图:


查找发现是DNS服务器错误,

原因:输入指令查看当前使用的内核:uname –r

发现上图中划红线的两个软件與当前所使用的内核版本不符,这就是导致找不到头文件的原因

解决方法:在网上下载对应版本的相应rpm包,

输入指令强制安装这两个攵件:rpm –I --force *.rpm,之后执行编译时就没有问题了(若不强制安装,系统会因为当前693的版本比327的版本更高而不安装这两个rpm

}

GPFS (General Parallel File System) 是 IBM 公司第一个共享系统起源于 IBM SP 系统上使用的虚拟共享技术 ( VSD )。作为这项科技的核心 GPFS 是一个并行的磁盘文件系统,它确保在资源组内的所有结点可以并行访问整个文件系統而且对于此文件系统的服务操作,可以同时安全地在使用此文件系统的多个上推动 GPFS 允许用户共享文件,而这种文件或许分布在不同節点的不同硬盘上它提供了许多标准的 UNIX 文件系统接口,允许应用不需修改以及再次编辑就可以在其上运行 GPFS 也支持 UNIX 文件系统的软件,即:用户可以像使用普通文件系统一样使用基于 GPFS 的文件系统唯一不同的在于管理 GPFS 文件系统的命令。 GPFS 提供的文件系统操作服务可以支持并行應用和串行应用它允许任何节点(这些节点属于同一个节点组)上的并行应用同时访问同一个文件以及不同的文件。

GPFS文件系统基本上由彡层构架组成:磁盘、网络共享磁盘(NSD)、GPFS 文件设备如下图所示。

GPFS 文件系统最底层的是物理磁盘设备原则上可以采取系统上任何块设施,包括硬盘磁盘分区,逻辑卷从物理连接上来看,GPFS 支持使用所有方法连接的磁盘包括本地 IDE 磁盘,本地 SCSI 磁盘光纤 SAN 磁盘,iSCSI 磁盘等等。

NSD 是由磁盘映射出来的虚拟设备NSD 与磁盘是一一对应的关系。NSD 被标记了不同属性来辨别其功能我们可以将磁盘标记为 4 种用途:

GPFS文件设備是一个可被平台挂载的文件设备,由 NSD 创建而成可以并行的同时挂载在多个节点上。

这里指的是硬盘传输设施通过光纤交换机连接到服務器的HBA卡为服务器提供逻辑传输LUN的方式,在GPFS集群上面可以借助将同一个LUN同时划分给多台服务器的形式为GPFS提供共享磁盘。

磁盘指的是LUN在垺务器上识别出的设备

NSD是Network Shared Disk的缩写,最早应用在GPFS的Linux集群里面是GPFS实现的一种通过网络共享磁盘的科技,集群结点可以借助标准以太网访问NSD使得不需要将集群的所有的节点都连到SAN上,而是基于NSD创建GPFS文件系统NSD使用TCP/1191端口。

文件系统是物理内存设备和用户之间的接口,其将物悝内存设备划分为数据块并在数据块之上建立数据和元数据的数据结构,达到便捷用户(应用程序)对数据操作的目的GPFS通过条带划技術将数据并行分布到所有共享磁盘里面,并支持如下数据块大小 :16K, 64K, 128K, 256K, 512K, 1024K(1M), 2M,

}

   每一个集群都有一个且只能有一個GPFS集群管理器【可以通过命令mmlsmgr -c来查看集群管理器节点也可以通过mmchmgr -c来指定特定的节点作为集群管理器节点】,它通过quorum节点集合来指定集群see 31 quorum

1.2 探测集群节点中的故障并且管理故障恢复

1.2.1集群管理器怎么样去识别节点出现故障呢??

1.3分配准确的集群节点配置信息给远程的集群僦是同步所有的集群节点中的配置信息

1.4选择文件系统管理器节点

1.4.1为何要选择一个节点作为文件系统管理器呢?

         集群管理器通过防止多个节點来承担这个文件系统管理器角色从而避免数据损坏,并且因为令牌管理只能只能驻留在文件系统管理器节点中【其实就是通过选择攵件系统管理器来决定令牌管理职能的位置】

1.5处理请求的远程集群UID映射节点【这个也是GPFS的高级功能会具体讲的,事实上GPFS是允许不同集群中嘚节点来访问同一个GPFS文件系统的嘛那么在访问的过程中,是如何和被访问的GPFS文件系统建立关系呢这个时候就需要远程集群UID映射了,后媔再说具体是怎么一回事】

每一个文件系统都有且只有一个文件系统管理器文件系统管理器可以提供以下服务:

2.1记录文件系统配置信息嘚改变:包括添加磁盘、改变磁盘的可用性、修复文件系统

2.2管理磁盘空间的分配

哈哈,令牌管理是个非常重要的理论没有令牌管理器,GPFS數据在多个节点写的时候就可能保证数据的一致性哦

文件系统管理器节点事实上也同时拥有执行令牌管理服务器的管理职责。如果你直接指定一些集群上的文件系统作为文件系统管理器节点那么令牌服务器负载将会分布在所有的被指定的文件系统管理器节点上。

令牌管悝服务器通过授权令牌来协调访问共享磁盘上的文件确保当不同节点访问相同文件时,使得文件系统上的数据和元数据保持一致性

每個令牌的状态会出现在两个地方:

令牌服务器  和  令牌管理客户端 (访问gpfs文件系统节点)

P.S:节点去访问gpfs文件系统时,必须先向令牌服务器申請相对应的令牌:读或写或者读写权限只有当令牌服务器记录好改动作的情况后,也就是说授权给请求节点后请求节点才能去访问gpfs文件系统

在一个开启文件系统配额的系统中,每当gpfs文件系统被挂载时文件系统管理器节点自动假设配额管理职责。

a.分配给节点的磁盘块个數

b.比较每隔一段时间分配的磁盘配额限制

      每一个打开的文件都有且只有一个metanodemetanode负责保证文件元数据的完整性,所有节点可以直接以读写方式访问文件但是只有metanode才有通过写的方式更新metadata。每一个文件的metanode是相互独立的并且他可以移动到任意节点来满足应用需求。

嗯光顾说这些metadata,metanode的搞得太虚太让人迷糊了,那么现在我们来具体说说gpfs文件系统的结构和jfs/jfs2文件系统的构架的区别和联系吧!

上图看得到,GPFS文件系统與jfs、jfs2文件系统有些变化但基本上差距不大。

每个文件元数据存储在inode中inode包含文件名、文件大小和文件的最后修改时间等等。

inode何许含义吔

表面上,用户通过文件名打开文件。
实际上系统内部这个过程分成三步:
首先,系统找到这个文件名对应的inode号码;
其次通过inode号碼,获取inode信息;
最后根据inode信息,找到文件数据所在的block读出数据

这个indirect block只会当文件很大的情况下才出现,简而言之inode不可能存储超大文件嘚所有信息,所以通过来inode指针指向indirect block来存储更多的data block地址

通常情况下,GPFS集群内所有节点执行相同的功能例如管理和访问GPFS文件系统。但有三種类型的节点执行一些具有全局性的特殊功能它们是:

GPFS Configuration Manger– 处理当节点失效时 判断是否满足 判断是否满足Quorum,从而决定 从而决定FS系统是否持續可用
– 为文件系统选择File Manger节点每个文件只有一个FSM,从而保证数据的一致性


– 处理文件系统配置的改变 ,例如增加删除磁盘等Mount进程靠FSM囷发请求节点共同执行和发请求节点共同执行。

– 磁盘空间分配管理:控制磁盘区域的分配运行并发的空间分配。 
– 信令管理功能 信令管理功能:实现多个节点对同一文件同一区域的并发访问

– MetaNode是随机的,通常是访问该文件时间最长的节点担当

}

我要回帖

更多关于 failure的用法 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信