运维联盟俱乐部

 找回密码
 立即注册
查看: 2172|回复: 0

exdata-管理-存储(cell)节点-关闭过程/检查rebalance

[复制链接]

该用户从未签到

发表于 2022-1-18 22:46:38 | 显示全部楼层 |阅读模式
本帖最后由 liuxj 于 2022-1-18 23:00 编辑



一:在 Exadata 存储服务器上执行维护时,可能需要关闭或重新启动cell 节点。

如果要在一个或多个数据库运行时关闭 Exadata Storage Server,则您必须验证使 Exadata Storage Server 脱机不会影响 Oracle ASM 磁盘组和数据库的可用性。 在不影响数据库可用性的情况下使 Exadata Storage Server 脱机的能力取决于受影响磁盘组上使用的 Oracle ASM 冗余级别。 可用性还取决于其他 Exadata 存储服务器中磁盘的当前状态,这些磁盘具有您要脱机的 Exadata 存储服务器的数据镜像副本。

1.使grid disk 保持脱机,即使存储节点启动后仍保持脱机(可选)

可选:将网格磁盘配置为在重新启动单元后保持脱机。
如果您计划多次重新启动,或者您想控制 Exadata 存储服务器何时再次变为活动状态,
则可以执行此步骤。 使网格磁盘不活动允许您在使网格磁盘再次可用之前验证计划的维护活动是否成功。

a)Set the grid disks to inactive
CellCLI> ALTER GRIDDISK ALL INACTIVE

b)等待30秒
等待至少 30 秒,或直到 Oracle ASM 完成使相应的 Oracle ASM 磁盘脱机。
如果您使用的是 18.1 之前的 Oracle Exadata System Software 版本,则此步骤非常重要。
如果将命令放入脚本中,请确保添加值超过 30 秒的 sleep 命令。

注意:如果将网格磁盘设置为非活动状态,则必须稍后完成步骤 6 才能激活网格磁盘。

2.停止cell节点上的服务
CellCLI> ALTER CELL SHUTDOWN SERVICES ALL

上述命令检查是否有任何磁盘处于脱机状态、处于预测性故障状态或需要复制到其镜像中。 如果 Oracle ASM 冗余完好无损,
则该命令使 Oracle ASM 中的网格磁盘脱机,然后停止单元服务。 如果显示以下错误,则停止单元服务可能不安全,因为磁盘组可能因冗余而被强制卸载。

  1. <
  2. Stopping the RS, CELLSRV, and MS services...
  3. The SHUTDOWN of ALL services was not successful.
  4. CELL-01548: Unable to shut down CELLSRV because disk group DATA, RECO may be
  5. forced to dismount due to reduced redundancy.
  6. Getting the state of CELLSRV services... running
  7. Getting the state of MS services... running
  8. Getting the state of RS services... running
  9. >
复制代码


如果发生 CELL-01548 错误,则恢复 Oracle ASM 磁盘组冗余并在所有磁盘的磁盘状态恢复正常时重试该命令。

3.关闭cell 节点 (关闭或重启)
  # shutdown -h now
或者
  # shutdown -r now

注意:不要执行连续的关机或重启命令,这与reboot -f 基本相同。

4.行维护后,重新启动 Exadata 存储服务器。 单元服务会自动启动。 作为 Exadata 存储服务器启动的一部分,
所有网格磁盘在 Oracle ASM 中都会自动更改为 ONLINE。

5.校验所有的grid 已经 联机
CellCLI> LIST GRIDDISK ATTRIBUTES name, asmmodestatus

Wait until asmmodestatus shows ONLINE or UNUSED for all grid disks.

6.(可选)使所有grid disk 联机(online)
仅当执行了步骤 1 时才需要此步骤。 如果未执行步骤 1,则当 Exadata 存储服务器重新启动时,网格磁盘会自动设置为联机。

CellCLI> ALTER GRIDDISK ALL ACTIVE


二:检查rebalance
删除或添加磁盘时,您可以检查 Oracle ASM 重新平衡操作的状态。
重新平衡操作可能已成功完成。 检查 Oracle ASM 警报日志以确认。
重新平衡操作当前可能正在运行。 检查 GV$ASM_OPERATION 视图以确定重新平衡操作是否仍在运行。
重新平衡操作可能已失败。 检查 V$ASM_OPERATION.ERROR 视图以确定重新平衡操作是否失败。
如果要替换的物理磁盘包含来自多个磁盘组的 Oracle ASM 磁盘,则可以在同一集群中的不同 Oracle ASM 实例上执行来自多个磁盘组的重新平衡操作。
一个 Oracle ASM 实例一次可以运行一个重新平衡操作。 如果所有 Oracle ASM 实例都忙,则重新平衡操作会排队

三:使用诊断 ISO 启用网络连接
如果存储服务器未重新启动,则可能需要诊断 ISO 才能访问该单元,以便可以手动修复它。
在其他引导方法(例如使用 USB)不起作用后,应使用诊断 ISO。
以下过程启用与诊断 ISO 的联网,因此可以传输文件以修复cell 节点

1.使用diagnostics.iso 重启系统
2.root 登录diagnostics shell
<
Choose from following by typing letter in '()':
(e)nter interactive diagnostics shell. Must use credentials
from Oracle support to login (reboot or power cycle to exit
the shell),
(r)estore system from NFS backup archive,
Type e to enter the diagnostics shell and log in as the root user.
>
3.使用下面命令避免ping
alias ping="ping -c"

4.创建目录/etc/network

5.创建目录 /etc/network/if-pre-up.d

6.为文件/etc/network/interfaces 增加下面内容
<
iface eth0 inet static
address IP_address_of_cell
netmask netmask_of_cell
gateway gateway_IP_address_of_cell

>

7.启动eth0
ifup eth0

8.使用 FTP 或 wget 命令检索文件以修复cell 节点


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

运维联盟俱乐部 ( 冀ICP备19036648号 )

GMT+8, 2024-5-11 20:48 , Processed in 0.049354 second(s), 21 queries , Gzip On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表