المقدمة
يقدم هذا المستند ملخصا حول كيفية أستكشاف المشكلات وإصلاحها عند تشغيل "إدارة العناصر" في الوضع المستقل.
المتطلبات الأساسية
المتطلبات
توصي Cisco بأن تكون لديك معرفة بالمواضيع التالية:
- ستار أو إس
- البنية الأساسية Ultra-M
المكونات المستخدمة
تستند المعلومات الواردة في هذا المستند إلى إصدار Ultra 5.1.x.
تم إنشاء المعلومات الواردة في هذا المستند من الأجهزة الموجودة في بيئة معملية خاصة. بدأت جميع الأجهزة المُستخدمة في هذا المستند بتكوين ممسوح (افتراضي). إذا كانت شبكتك قيد التشغيل، فتأكد من فهمك للتأثير المحتمل لأي أمر.
معلومات أساسية
Ultra-M هو حل مركزي لحزم البيانات المحمولة تم تجميعه مسبقا والتحقق من صحته افتراضيا تم تصميمه لتبسيط عملية نشر شبكات VNF. OpenStack هو مدير البنية الأساسية الظاهرية (VIM) ل Ultra-M ويتكون من أنواع العقد التالية:
- حوسبة
- قرص تخزين الكائنات - الحوسبة (OSD - الحوسبة)
- ضابط
- النظام الأساسي OpenStack - المدير (OSPD)
تم توضيح البنية المعمارية عالية المستوى لتقنية Ultra-M والمكونات المعنية في هذه الصورة:
بنية UltraM
هذا المستند مخصص لأفراد Cisco المطلعين على النظام الأساسي Cisco Ultra-M، وهو يفصل الخطوات المطلوبة ليتم تنفيذها على مستوى OpenStack و StarOS VNF في وقت إستبدال خادم وحدة التحكم.
المختصرات
تستخدم هذه المختصرات في هذه المقالة:
VNF |
وظيفة الشبكة الظاهرية |
إم |
مدير العناصر |
الشخصية المهمة |
عنوان IP الظاهري |
CLI |
سطر الأوامر |
المشكلة: يمكن أن ينتهي بهم المطاف في هذه الحالة كما يبدو من مدير صحي Ultra-m
EM: 1 is not part of HA-CLUSTER,EM is running in standalone mode
يعتمد على الإصدار، قد يكون هناك 2 أو 3 em تعمل على النظام.
في الحالة التي يتم فيها نشر ثلاثة جنود، إثنان منهم سيكونان عمليين والثالث سيكون بمقدورهم الحصول على عنقود حرس الحيوانات. ومع ذلك، فهي غير مستخدمة.
في حالة عدم عمل إحدى وحدتي ذاكرة EM الوظيفية أو تعذر الوصول إليهما، تكون ذاكرة EM العاملة في وضع قائم بذاته.
في حال قمت بنشر 2EM، في حال عدم عمل أحدها أو إمكانية الوصول إليه، يمكن أن يكون EM المتبقي في الوضع المستقل.
يشرح هذا المستند ما يجب البحث عنه إذا حدث هذا الأمر وكيفية الاسترداد.
خطوات أستكشاف الأخطاء وإصلاحها والاسترداد
الخطوة 1. تحقق من حالة em.
قم بالاتصال بالشخصيات المهمة في em وتأكد بالفعل من أن العقدة في هذه الحالة:
root@em-0:~# ncs_cli -u admin -C
admin connected from 127.0.0.1 using console on em-0
admin@scm# show ems
EM VNFM ID SLA SCM PROXY
3 up down up
admin@scm#
إذا، من هنا، يمكنك أن ترى أنه يوجد إدخال واحد فقط في SCM - وهو المدخل لعقدة SCM.
إذا إستطعت الاتصال بالآخر، يمكنك أن ترى شيئا مثل:
root@em-1# ncs_cli -u admin -C admin connected from 127.0.0.1 using
admin connected from 127.0.0.1 using console on em-1
admin@scm# show ems
% No entries found.
بناء على ما هو الإصدار على EM، لا يمكن الوصول إلى NCS CLI، أو يمكن إعادة تمهيد العقدة.
الخطوة 2. تحقق من سجلات الدخول /var/log/em على العقدة التي لا تنضم إلى نظام المجموعة.
تحقق من السجلات الموجودة على العقدة في حالة المشكلة. لذلك، للعينة المذكورة، كنت تبحر em-1 /var/log/em/سجل حيوانات السجل:
...
2018-02-01 09:52:33,591 [myid:4] - INFO [main:QuorumPeerMain@127] - Starting quorum peer
2018-02-01 09:52:33,619 [myid:4] - INFO [main:NIOServerCnxnFactory@89] - binding to port 0.0.0.0/0.0.0.0:2181
2018-02-01 09:52:33,627 [myid:4] - INFO [main:QuorumPeer@1019] - tickTime set to 3000
2018-02-01 09:52:33,628 [myid:4] - INFO [main:QuorumPeer@1039] - minSessionTimeout set to -1
2018-02-01 09:52:33,628 [myid:4] - INFO [main:QuorumPeer@1050] - maxSessionTimeout set to -1
2018-02-01 09:52:33,628 [myid:4] - INFO [main:QuorumPeer@1065] - initLimit set to 5
2018-02-01 09:52:33,641 [myid:4] - INFO [main:FileSnap@83] - Reading snapshot /var/lib/zookeeper/data/version-2/snapshot.5000000b3
2018-02-01 09:52:33,665 [myid:4] - ERROR [main:QuorumPeer@557] - Unable to load database on disk
java.io.IOException: The current epoch, 5, is older than the last zxid, 25769803777
at org.apache.zookeeper.server.quorum.QuorumPeer.loadDataBase(QuorumPeer.java:539)
at org.apache.zookeeper.server.quorum.QuorumPeer.start(QuorumPeer.java:500)
at org.apache.zookeeper.server.quorum.QuorumPeerMain.runFromConfig(QuorumPeerMain.java:153)
at org.apache.zookeeper.server.quorum.QuorumPeerMain.initializeAndRun(QuorumPeerMain.java:111)
at org.apache.zookeeper.server.quorum.QuorumPeerMain.main(QuorumPeerMain.java:78)
2018-02-01 09:52:33,671 [myid:4] - ERROR [main:QuorumPeerMain@89] - Unexpected exception, exiting abnormally
java.lang.RuntimeException: Unable to run quorum server
at org.apache.zookeeper.server.quorum.QuorumPeer.loadDataBase(QuorumPeer.java:558)
at org.apache.zookeeper.server.quorum.QuorumPeer.start(QuorumPeer.java:500)
at org.apache.zookeeper.server.quorum.QuorumPeerMain.runFromConfig(QuorumPeerMain.java:153)
at org.apache.zookeeper.server.quorum.QuorumPeerMain.initializeAndRun(QuorumPeerMain.java:111)
at org.apache.zookeeper.server.quorum.QuorumPeerMain.main(QuorumPeerMain.java:78)
Caused by: java.io.IOException: The current epoch, 5, is older than the last zxid, 25769803777
at org.apache.zookeeper.server.quorum.QuorumPeer.loadDataBase(QuorumPeer.java:539)
الخطوة 3. تحقق من وجود لقطة قيد السؤال.
انتقل إلى /var/lib/zookeeper/data/version-2 وتأكد من وجود اللقطة التي يتم تحليلها باللون الأحمر في الخطوة 2.
300000042 log.500000001 snapshot.300000041 snapshot.40000003b
ubuntu@em-1:/var/lib/zookeeper/data/version-2$ ls -la
total 424
drwxrwxr-x 2 zk zk 4096 Jan 30 12:12 .
drwxr-xr-x 3 zk zk 4096 Feb 1 10:33 ..
-rw-rw-r-- 1 zk zk 1 Jan 30 12:12 acceptedEpoch
-rw-rw-r-- 1 zk zk 1 Jan 30 12:09 currentEpoch
-rw-rw-r-- 1 zk zk 1 Jan 30 12:12 currentEpoch.tmp
-rw-rw-r-- 1 zk zk 67108880 Jan 9 20:11 log.300000042
-rw-rw-r-- 1 zk zk 67108880 Jan 30 10:45 log.400000024
-rw-rw-r-- 1 zk zk 67108880 Jan 30 12:09 log.500000001
-rw-rw-r-- 1 zk zk 67108880 Jan 30 12:11 log.5000000b4
-rw-rw-r-- 1 zk zk 69734 Jan 6 05:14 snapshot.300000041
-rw-rw-r-- 1 zk zk 73332 Jan 29 09:21 snapshot.400000023
-rw-rw-r-- 1 zk zk 73877 Jan 30 11:43 snapshot.40000003b
-rw-rw-r-- 1 zk zk 84116 Jan 30 12:09 snapshot.5000000b3 ---> HERE, you see it
ubuntu@em-1:/var/lib/zookeeper/data/version-2$
الخطوة 4. خطوات الاسترداد.
1. قم بتمكين وضع تصحيح الأخطاء حتى يتوقف EM عن إعادة التشغيل.
ubuntu@em-1:~$ sudo /opt/cisco/em-scripts/enable_debug_mode.sh
قد يلزم إعادة تشغيل VM مرة أخرى (قد يكون ذلك تلقائيا، ولا تحتاج إلى القيام بأي شيء)
2. انقل بيانات حارس الحيوان.
في /var/lib/zookeeper/data يوجد المجلد المسمى الإصدار 2 الذي يحتوي على لقطة قاعدة البيانات. يشير الخطأ أعلاه إلى الفشل في التحميل بحيث تقوم بإزالته.
ubuntu@em-1:/var/lib/zookeeper/data$ sudo mv version-2 old
ubuntu@em-1:/var/lib/zookeeper/data$ ls -la
total 20
....
-rw-r--r-- 1 zk zk 2 Feb 1 10:33 myid
drwxrwxr-x 2 zk zk 4096 Jan 30 12:12 old --> so you see now old folder and you do not see version-2
-rw-rw-r-- 1 zk zk 4 Feb 1 10:33 zookeeper_server.pid
..
3. قم بإعادة تمهيد العقدة.
sudo reboot
4. قم بتعطيل وضع تصحيح الأخطاء مرة أخرى.
ubuntu@em-1:~$ sudo /opt/cisco/em-scripts/disable_debug_mode.sh
ويجب أن تعمل هذه الخطوات على إعادة تشغيل الخدمة على حل المشكلة.