概要
このドキュメントでは、Cisco WAN Automation Engine(WAE)のスーパーバイザの問題をトラブルシューティングして解決する方法について説明します。
前提条件
要件
このドキュメントに特有の要件はありません。
使用するコンポーネント
このドキュメントの内容は、特定のソフトウェアやハードウェアのバージョンに限定されるものではありません。
このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されました。このドキュメントで使用するすべてのデバイスは、初期(デフォルト)設定の状態から起動しています。本稼働中のネットワークでは、各コマンドによって起こる可能性がある影響を十分確認してください。
問題
WAE 7.3では、次の問題が発生します。
[wae@ds1waenod01 etc]$ sudo systemctl status supervisord
● supervisord.service - Process Monitoring and Control Daemon
Loaded: loaded (/usr/lib/systemd/system/supervisord.service; enabled; vendor preset: disabled)
Active: failed (Result: exit-code) since Tue 2021-12-07 16:52:30 PST; 1 months 14 days ago
Process: 23468 ExecStart=/usr/bin/supervisord -c /etc/supervisord.conf (code=exited, status=1/FAILURE)
Dec 07 16:52:30 ds1waenod01.tnt.lab supervisord[23468]: d.main()
Dec 07 16:52:30 ds1waenod01.tnt.lab supervisord[23468]:
File "/usr/lib/python2.7/site-packages/supervisor/supervisord.py", line 70, in main
Dec 07 16:52:30 ds1waenod01.tnt.lab supervisord[23468]: rlimit_messages = self.options.set_rlimits()
Dec 07 16:52:30 ds1waenod01.tnt.lab supervisord[23468]:
File "/usr/lib/python2.7/site-packages/supervisor/options.py",
line 1316, in set_rlimits
Dec 07 16:52:30 ds1waenod01.tnt.lab supervisord[23468]: self.usage(msg % locals())
Dec 07 16:52:30 ds1waenod01.tnt.lab supervisord[23468]: KeyError: 'min'
Dec 07 16:52:30 ds1waenod01.tnt.lab systemd[1]: supervisord.service: control process exited,
code=exited status=1
Dec 07 16:52:30 ds1waenod01.tnt.lab systemd[1]: Failed to start Process Monitoring and Control Daemon.
Dec 07 16:52:30 ds1waenod01.tnt.lab systemd[1]: Unit supervisord.service entered failed state.
Dec 07 16:52:30 ds1waenod01.tnt.lab systemd[1]: supervisord.service failed.
このため、スーパーバイザは非アクティブになります。したがって、アップ状態ではありません。
[wae@ds1waenod01 root]$ supervisorctl status
unix:///opt/supervisor/run/supervisor.sock refused connection
WAEプロセスを再起動する処理とサーバのリブートが失敗する。
トラブルシュート
さらにトリアージするには、次の詳細をキャプチャします。
- WAEバージョン
- OSバージョン:cat /etc/redhat-release
- スーパバイザバージョン
: rpm -qa supervisor
- ファイル /etc/security/limits.conf
根本原因
これは、スーパーバイザバージョン3.2以前で確認された既知の問題です。WAEバージョン7.3では、より低いバージョンのスーパーバイザを使用できます。詳細については、「スーパーバイザの問題」を参照してください。
解決方法
解決策は、WAEのバージョンをアップグレードし、それが不可能な場合は、スーパーバイザをアップグレードすることです。ただし、アップグレードがオプションではない場合は、次の回避策を使用します。
Comment these parameters in /etc/supervisord.conf and then restart supervisor/wae.
;minfds=1000000 ; (min. avail startup file descriptors;default 1024)
;minprocs=257805 ; (min. avail process descriptors;default 200)
systemctl restart supervisord.service
supervisorctl restart wae:*
予想される結果
WAEサービスが期待どおりに開始されます。
supervisorctl status
wae:kafka RUNNING pid 11726, uptime 0:01:06
wae:logrotate RUNNING pid 11648, uptime 0:01:07
wae:wae-monitor RUNNING pid 11667, uptime 0:01:07
wae:waectl RUNNING pid 11634, uptime 0:01:07
wae:zookeeper RUNNING pid 11633, uptime 0:01:07
関連情報