はじめに
このドキュメントでは、ACI障害コードF1527、F1528、F1529および修復手順について説明します。
背景説明
これらの3つの障害は、コントローラのストレージ容量の使用率がしきい値を超えると発生します。
F1527は、使用率が75 %を超えると発生する警告障害です。
F1528は、使用率が85 %と90 %の間で発生する重大な障害です。
F1529は、使用率が90 %を超えると発生する重大な障害です。
コード:F1529
原因:機器いっぱい
descr:ホスト名rtp-aci08-apic1が/techsupportにマウントされているノード1のストレージユニット/techsupportが100%フルになっている
dn:topology/pod-1/node-1/sys/ch/p-[/techsupport]-f-[/dev/mapper/vg_ifc0-techsupport]/fault-F1529
ルール:eqpt-storage-full-critical
重大度:重大
迅速な対処の開始
- 最大容量のディレクトリを特定する
- 容量に達したことを確認します。
- ディレクトリ内のファイルのクリーンアップ
障害に対処するための詳細手順
ディレクトリの識別
障害が発生したディレクトリは、障害の説明で特定されます。
次の2つの例では、F1527障害が/firmwareディレクトリに対して発生し、F1529障害が/techsupportに結び付けられていることがわかります。
ノード1で障害が発生していることも説明で確認できます。
コード:F1527
descr:/firmwareにマウントされたノード1のストレージユニット/firmwareの使用率が76 %である
dn:topology/pod-1/node-1/sys/ch/p-[/firmware]-f-[/dev/mapper/vg_ifc0-firmware]/fault-F1527
コード:F1529
descr:ホスト名rtp-aci08-apic1が/techsupportにマウントされているノード1のストレージユニット/techsupportが100 %使用されている
dn:topology/pod-1/node-1/sys/ch/p-[/techsupport]-f-[/dev/mapper/vg_ifc0-techsupport]/fault-F1529
容量の確認
どのディレクトリでエラーが発生しているかを確認したら、CLIを使用して、その程度のドライブ容量を使用していることを確認できます。
df -hコマンドを使用すると、各マウントで使用可能なディスク領域を確認できます。
次の表では、/firmwareが使用可能な領域の76 %を使用し、/data/techsupportが100 %を使用していることがわかります
rtp-aci08-apic1# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/vg_ifc0/boot 40G 13G 25G 35% /bin
/dev/mapper/vg_ifc0_ssd-data 176G 4.2G 162G 3% /var/log/dme
devtmpfs 32G 0 32G 0% /dev
tmpfs 4.0G 182M 3.9G 5% /dev/shm
/dev/mapper/vg_ifc0-firmware 40G 28G 9.3G 76% /firmware
/dev/mapper/vg_ifc0-scratch 40G 49M 38G 1% /home
tmpfs 32G 0 32G 0% /sys/fs/cgroup
/dev/mapper/vg_ifc0-techsupport 40G 38G 0 100% /data/techsupport
tmpfs 16G 592K 16G 1% /tmp
/dev/sdc1 55M 1.2M 49M 3% /tmp/bootflash
tmpfs 2.0G 721M 1.3G 36% /var/log/dme/log
/dev/mapper/vg_ifc0-logs 40G 5.0G 33G 14% /var/log/dme/oldlog
/dev/mapper/vg_ifc0-data2 156G 11G 137G 8% /data2
/dev/mapper/vg_ifc0-dmecores 50G 53M 47G 1% /var/log/dme/core
tmpfs 32G 9.0G 23G 29% /var/run/utmp
ファイルのクリーンアップ
障害状態が存在することを確認した後、ディレクトリ内のファイルをクリーンアップできます。
これを行うには、そのディレクトリに移動します。次に、サイズ別にファイルをリストし(ls -lahS)、不要になった大きなファイル(rm <fileName>)を削除します。
その後、df -hコマンドを使用して、スペースがクリーンアップされたことを再度確認できます。
rtp-aci08-apic1# cd /data/techsupport
rtp-aci08-apic1# ls -lahS
total 38G
-rw-r--r-- 1 admin admin 10G Aug 10 18:12 dbgexp_tsod-case-12345_rtp-aci08-apic1_sysid-1_2023-07-24T07-49UTC_logs_3of3.tgz
-rw-r--r-- 1 admin admin 9.4G Aug 10 18:13 dbgexp_tsod-case-12345_rtp-aci08-apic1_sysid-1_2023-07-24T07-79UTC_logs_3of3.tgz
-r--r----- 1 ifc admin 3.9G Jul 24 02:05 dbgexp_tsod-case-12345_rtp-aci08-apic1_sysid-1_2023-07-24T01-49UTC_logs_3of3.tgz
-r--r----- 1 ifc admin 3.7G Jul 24 01:55 dbgexp_tsod-case-12345_rtp-aci08-apic1_sysid-1_2023-07-24T01-49UTC_1of3.tgz
-r--r----- 1 ifc admin 2.5G May 15 19:33 dbgexp_tsod-upgrde427sto524d_rtp-aci08-apic1_sysid-1_2023-05-15T19-24UTC_logs_3of3.tgz
-r--r----- 1 ifc admin 2.1G May 4 19:17 dbgexp_tsod-failed_upgrade_repro_rtp-aci08-apic1_sysid-1_2023-05-04T19-08UTC_logs_3of3.tgz
-r--r----- 1 ifc admin 1.1G Aug 10 18:04 dbgexp_tsod-case-12345_rtp-aci08-apic1_sysid-1_2023-08-10T17-59UTC_logs_3of3.tgz
-rw-r--r-- 1 admin admin 1.1G Aug 10 18:11 1g.img
-r--r----- 1 ifc admin 952M May 4 19:17 dbgexp_tsod-failed_upgrade_repro_pod8-spine1_sysid-201_2023-05-04T19-08UTC_logs_3of3.tgz
-r--r----- 1 ifc admin 946M May 3 19:44 dbgexp_tsod-failed_upgrade_repro_pod8-spine1_sysid-201_2023-05-03T19-35UTC_logs_3of3.tgz
-r--r----- 1 ifc admin 894M May 15 19:27 dbgexp_tsod-upgrde427sto524d_rtp-aci08-apic1_sysid-1_2023-05-15T19-24UTC_1of3.tgz
-r--r----- 1 ifc admin 892M May 4 19:12 dbgexp_tsod-failed_upgrade_repro_rtp-aci08-apic1_sysid-1_2023-05-04T19-08UTC_1of3.tgz
-r--r----- 1 ifc admin 253M Mar 31 20:33 dbgexp_tsod-12345_12345_sysid-105_2023-03-31T20-25UTC_logs_3of3.tgz
-r--r----- 1 ifc admin 205M Jul 18 14:40 dbgexp_coreexp-default_pod8-spine3_sysid-203_2023-07-18T14-21UTC_1689690102_0x1b01_kernel_log.0.tar.gz
-r--r----- 1 ifc admin 141M Aug 10 18:02 dbgexp_tsod-case-12345_rtp-aci08-apic1_sysid-1_2023-08-10T17-59UTC_db_2of3.tgz
-r--r----- 1 ifc admin 134M Jul 24 02:00 dbgexp_tsod-case-12345_rtp-aci08-apic1_sysid-1_2023-07-24T01-49UTC_db_2of3.tgz
-r--r----- 1 ifc admin 130M May 15 19:29 dbgexp_tsod-upgrde427sto524d_rtp-aci08-apic1_sysid-1_2023-05-15T19-24UTC_db_2of3.tgz
rtp-aci08-apic1# rm dbgexp_tsod-case-12345_rtp-aci08-apic1_sysid-1_2023-07-24T07-49UTC_logs_3of3.tgz rtp-aci08-apic1# rm dbgexp_tsod-case-12345_rtp-aci08-apic1_sysid-1_2023-07-24T07-79UTC_logs_3of3.tgz rtp-aci08-apic1# df -h | grep techsupport /dev/mapper/vg_ifc0-techsupport 40G 18G 20G 49% /data/techsupport
/で発生したエラー
ディレクトリがいっぱいになっているディレクトリが/ディレクトリの場合、影響を受けるファイルはrootにならないとクリーンアップできない可能性があります。
コード:F1528
descr:ホスト名rtp-aci08-apic1がマウントされたノード1のストレージ・ユニット/が89%フル
dn:topology/pod-1/node-1/sys/ch/p-[/]-f-[/dev/vg_ifc0/boot]/fault-F1528
ここでdf -hコマンドを使用すると、/に何もマウントされていないことがわかります。
/binが100%フルであることを使用します。しかし、ファイルを見ると、40Gではなく606Mしか使用されていないことがわかります。
rtp-aci08-apic1# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/vg_ifc0/boot 40G 40G 0 100% /bin
/dev/mapper/vg_ifc0_ssd-data 176G 4.2G 162G 3% /var/log/dme
devtmpfs 32G 0 32G 0% /dev
tmpfs 4.0G 182M 3.9G 5% /dev/shm
/dev/mapper/vg_ifc0-firmware 40G 28G 9.3G 76% /firmware
/dev/mapper/vg_ifc0-scratch 40G 49M 38G 1% /home
tmpfs 32G 0 32G 0% /sys/fs/cgroup
/dev/mapper/vg_ifc0-techsupport 40G 18G 20G 49% /data/techsupport
tmpfs 16G 592K 16G 1% /tmp
/dev/sdc1 55M 1.2M 49M 3% /tmp/bootflash
tmpfs 2.0G 726M 1.3G 36% /var/log/dme/log
/dev/mapper/vg_ifc0-logs 40G 5.1G 33G 14% /var/log/dme/oldlog
/dev/mapper/vg_ifc0-data2 156G 11G 137G 8% /data2
/dev/mapper/vg_ifc0-dmecores 50G 53M 47G 1% /var/log/dme/core
tmpfs 32G 7.1G 25G 23% /var/run/utmp
rtp-aci08-apic1# cd /bin
rtp-aci08-apic1# ls -lahS | head
total 606M
-rwxr-xr-x 1 root root 103M Jul 26 20:44 nomad
-rwxr-xr-x 1 root root 60M Mar 1 2021 podman
-rwxr-xr-x 1 root root 51M Sep 9 2020 containerd
-rwxr-xr-x 1 root root 47M Aug 4 2021 consul
-rwxr-xr-x 1 root root 32M Apr 27 2021 atomix
-rwxr-xr-x 1 root root 30M Apr 27 2021 atomix-downgrade-grub
-rwxr-xr-x 1 root root 26M Sep 9 2020 ctr
-rwxr-xr-x 1 root root 25M Feb 13 2019 etcd
-rwxr-xr-x 1 root root 21M Feb 13 2019 etcdctl
/の領域を占める実際のファイルを表示するには、ルートログインでAPIC CLIにアクセスする必要があります。
これを行うには、Cisco TACに問い合せて支援を受ける必要があります。