소개
이 문서에서는 Cisco WAE(WAN Automation Engine)에서 수퍼바이저의 문제를 해결하고 수정하는 방법에 대해 설명합니다.
사전 요구 사항
요구 사항
이 문서에 대한 특정 요건이 없습니다.
사용되는 구성 요소
이 문서는 특정 소프트웨어 및 하드웨어 버전으로 한정되지 않습니다.
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다. 이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다. 현재 네트워크가 작동 중인 경우 모든 명령의 잠재적인 영향을 미리 숙지하시기 바랍니다.
문제
WAE 7.3에서는 다음과 같은 문제가 발생합니다.
[wae@ds1waenod01 etc]$ sudo systemctl status supervisord
● supervisord.service - Process Monitoring and Control Daemon
Loaded: loaded (/usr/lib/systemd/system/supervisord.service; enabled; vendor preset: disabled)
Active: failed (Result: exit-code) since Tue 2021-12-07 16:52:30 PST; 1 months 14 days ago
Process: 23468 ExecStart=/usr/bin/supervisord -c /etc/supervisord.conf (code=exited, status=1/FAILURE)
Dec 07 16:52:30 ds1waenod01.tnt.lab supervisord[23468]: d.main()
Dec 07 16:52:30 ds1waenod01.tnt.lab supervisord[23468]:
File "/usr/lib/python2.7/site-packages/supervisor/supervisord.py", line 70, in main
Dec 07 16:52:30 ds1waenod01.tnt.lab supervisord[23468]: rlimit_messages = self.options.set_rlimits()
Dec 07 16:52:30 ds1waenod01.tnt.lab supervisord[23468]:
File "/usr/lib/python2.7/site-packages/supervisor/options.py",
line 1316, in set_rlimits
Dec 07 16:52:30 ds1waenod01.tnt.lab supervisord[23468]: self.usage(msg % locals())
Dec 07 16:52:30 ds1waenod01.tnt.lab supervisord[23468]: KeyError: 'min'
Dec 07 16:52:30 ds1waenod01.tnt.lab systemd[1]: supervisord.service: control process exited,
code=exited status=1
Dec 07 16:52:30 ds1waenod01.tnt.lab systemd[1]: Failed to start Process Monitoring and Control Daemon.
Dec 07 16:52:30 ds1waenod01.tnt.lab systemd[1]: Unit supervisord.service entered failed state.
Dec 07 16:52:30 ds1waenod01.tnt.lab systemd[1]: supervisord.service failed.
이로 인해 수퍼바이저는 비활성 상태로 표시됩니다. 따라서 가동 중이 아닙니다.
[wae@ds1waenod01 root]$ supervisorctl status
unix:///opt/supervisor/run/supervisor.sock refused connection
WAE 프로세스 재시작 및 서버 재부팅이 성공하지 못했습니다.
문제 해결
이 항목을 더 자세히 분류하려면 다음 세부 정보를 캡처합니다.
- WAE 버전
- OS 버전: cat /etc/redhat-release
- 수퍼바이저 버전
: rpm -qa supervisor
- 파일 /etc/security/limits.conf
근본 원인
이는 supervisor 버전 3.2 이하에서 확인된 알려진 문제입니다. WAE 버전 7.3은 더 낮은 수퍼바이저 버전을 가질 수 있습니다. 자세한 내용은 관리자 문제를 참조하십시오.
솔루션
해결 방법은 WAE 버전을 업그레이드하고 이것이 불가능한 경우 수퍼바이저를 업그레이드하는 것입니다. 그러나 업그레이드를 선택할 수 없는 경우에는 다음 해결 방법을 사용합니다.
Comment these parameters in /etc/supervisord.conf and then restart supervisor/wae.
;minfds=1000000 ; (min. avail startup file descriptors;default 1024)
;minprocs=257805 ; (min. avail process descriptors;default 200)
systemctl restart supervisord.service
supervisorctl restart wae:*
예상 결과
WAE 서비스가 예상대로 시작됩니다.
supervisorctl status
wae:kafka RUNNING pid 11726, uptime 0:01:06
wae:logrotate RUNNING pid 11648, uptime 0:01:07
wae:wae-monitor RUNNING pid 11667, uptime 0:01:07
wae:waectl RUNNING pid 11634, uptime 0:01:07
wae:zookeeper RUNNING pid 11633, uptime 0:01:07
관련 정보