المقدمة
يصف هذا المستند حلا بديلا لاسترداد رزمة غرافانا التي تبدأ من جديد بشكل مستمر.
المتطلبات الأساسية
المتطلبات
توصي Cisco بأن تكون لديك معرفة بالمواضيع التالية:
- بيئة التنفيذ المشتركة (CEE) للبنية الأساسية للخدمات الدقيقة للمشتركين من Cisco (SMI)
- النظام الأساسي للنشر الأصلي (CNDP) من الجيل الخامس للشبكات أو بنية أجهزة الكمبيوتر المحمولة طراز SMI (BM)
- محطات الإرساء و كوبرنيتس
المكونات المستخدمة
تستند المعلومات الواردة في هذا المستند إلى إصدارات البرامج والمكونات المادية التالية:
- SMI 2020.02.2.35
- Kubernetes v1.21.0
تم إنشاء المعلومات الواردة في هذا المستند من الأجهزة الموجودة في بيئة معملية خاصة. بدأت جميع الأجهزة المُستخدمة في هذا المستند بتكوين ممسوح (افتراضي). إذا كانت شبكتك قيد التشغيل، فتأكد من فهمك للتأثير المحتمل لأي أمر.
معلومات أساسية
ما هي SMI؟
Cisco SMI هي مجموعة طبقات من تقنيات ومعايير السحابة التي تمكن التطبيقات المستندة إلى الخدمات الصغيرة من وحدات العمل لعبارة الشبكة واسعة النطاق (BNG) وقابلية التنقل من Cisco والكبلات. لهذه التطبيقات وظائف مماثلة لإدارة المشترك ومتطلبات مشابهة لبيئة البيانات.
السمات:
- توفر حزمة شبكات الطبقة (التقنيات والمعايير) عمليات النشر من أعلى إلى أسفل وتستوعب البنية الأساسية الحالية للشبكة.
- تشترك جميع التطبيقات في تقنية شبكة إيثرنت المحسنة المجمعة (CEE) بالنسبة للوظائف التي لا تستخدم التطبيقات (تخزين البيانات والنشر والتهيئة والقياس عن بعد والتنبيه)، والتي توفر تفاعلا وخبرا متسقين لجميع نقاط اتصال العملاء ونقاط التكامل.
- يتم نشر التطبيقات ومعالج إيثرنت المحسنة المجمعة في حاويات الخدمة الدقيقة ويتم توصيلها بشبكة خدمة ذكية.
- تعمل واجهة برمجة التطبيقات (API) مكشوفة للنشر والتهيئة والإدارة على تمكين التشغيل التلقائي.
ما هي SMI CEE؟
- تعد تقنية شبكة إيثرنت المحسنة المجمعة (CEE) حلا برمجيا تم تطويره لمراقبة تطبيقات الأجهزة المحمولة والكبلات التي يتم نشرها على SMI. تلتقط تقنية شبكة إيثرنت المحسنة المجمعة (CEE) المعلومات (المقاييس الأساسية) من التطبيقات بطريقة مركزية للمهندسين لتصحيح الأخطاء واستكشاف الأخطاء وإصلاحها.
- يعتبر CEE مجموعة الأدوات الشائعة التي يتم تثبيتها لجميع التطبيقات. يأتي هذا الطراز مزودا بمركز مخصص لإدارة العمليات (OPS)، والذي يوفر واجهة سطر الأوامر (CLI) وواجهات برمجة التطبيقات (API) لإدارة أدوات الشاشة. تتوفر تقنية شبكة إيثرنت المحسنة المجمعة (CEE) واحدة فقط لكل مجموعة.
ما هي أدوات دعم تقنية شبكة إيثرنت المحسنة المجمعة؟
- POD هو عملية يتم تشغيلها على نظام المجموعة Kubernetes. يحتوي POD على وحدة تستجيب للتعديل تعرف باسم حاوية. يحتوي POD على حاوية واحدة أو عدة حاويات.
- يقوم Kubernetes بنشر PODs واحد أو أكثر على عقدة واحدة، والتي يمكن أن تكون جهاز فعلي أو افتراضي. يحتوي كل POD على هوية منفصلة مع عنوان IP داخلي ومساحة منفذ. ومع ذلك، يمكن أن تشارك الحاويات الموجودة في قاعدة بيانات التخزين وموارد الشبكة. يحتوي CEE على عدد من نقاط الوصول التي لها وظائف فريدة. من بين العديد من مجموعات تطوير شبكة إيثرنت المحسنة المجمعة (CEE)، هناك قضيتا غرافانا وبوستيدست.
ما هو Grafana pod؟
يمكن لقرد غرافانا التواصل مع بروميثيوس بود من خلال خدمة بروميثيوس، التي تسمى بروميثيوس.
ما هو Postgres pod؟
تدعم Postgres قواعد بيانات SQL ذات إمكانية التكرار لتخزين التنبيهات ولوحات المعلومات Grafana.
المشكلة
يتم إعادة تشغيل قرص غرافانا بشكل منتظم، بينما يتم تشغيل أجهزة طرد البريد بدون مشاكل.
للاسترداد، أستخدم هذا الأمر لحذف Grafana pod يدويا:
kubectl delete pod
-n
عند الحذف، يتم إعادة إنشاء Grafana pod وإعادة تشغيله.
إذا إستمرت المشكلة، فاستخدم أمر CLI هذا للحصول على نموذج التنبيه من CEE لتحديد المشكلة:
[pod-name-smf/podname] cee# show alerts active summary | include "POD_Res|k8s_grafana"
مثال:
[pod-name-smf/podname] cee# show alerts active summary | include "POD_Res|k8s_grafana"
Time Alert Name Description Port Access ID NEState Severity Alert Source
16:26 PCF_POD_Restarted " "Processing Error Alarm"} " ""Container k8s_grafana_grafana-59768df649-n6x6x_cee-dnrce301_a4ff5711-0e20-4dd4-ae7f-47296c334930_883 of pod grafana-59768df649-n6x6x in namespace cee-dnrce301 has been restarted."" InService Major NETX
16:23 PCF_k8s-pod-crashing-loop " "Processing Error Alarm"} " "Pod cee-dnrce301/grafana-59768df649-n6x6x (grafana) is restarting 1.03 times / 5 minutes." InService Critical NETX
16:20 PCF_POD_Restarted " "Processing Error Alarm"} " ""Container k8s_grafana_grafana-59768df649-n6x6x_cee-dnrce301_a4ff5711-0e20-4dd4-ae7f-47296c334930_882 of pod grafana-59768df649-n6x6x in namespace cee-dnrce301 has been restarted."" InService Major NETX
16:14 PCF_POD_Restarted " "Processing Error Alarm"} " ""Container k8s_grafana_grafana-59768df649-n6x6x_cee-dnrce301_a4ff5711-0e20-4dd4-ae7f-47296c334930_881 of pod grafana-59768df649-n6x6x in namespace cee-dnrce301 has been restarted."" InService Major NETX
16:08 PCF_POD_Restarted " "Processing Error Alarm"} " ""Container k8s_grafana_grafana-59768df649-n6x6x_cee-dnrce301_a4ff5711-0e20-4dd4-ae7f-47296c334930_880 of pod grafana-59768df649-n6x6x in namespace cee-dnrce301 has been restarted."" InService Major NETX
16:02 PCF_POD_Restarted " "Processing Error Alarm"} " ""Container k8s_grafana_grafana-59768df649-n6x6x_cee-dnrce301_a4ff5711-0e20-4dd4-ae7f-47296c334930_879 of pod grafana-59768df649-n6x6x in namespace cee-dnrce301 has been restarted."" InService Major NETX
15:56 PCF_POD_Restarted " "Processing Error Alarm"} " ""Container k8s_grafana_grafana-59768df649-n6x6x_cee-dnrce301_a4ff5711-0e20-4dd4-ae7f-47296c334930_878 of pod grafana-59768df649-n6x6x in namespace cee-dnrce301 has been restarted."" InService Major NETX
15:53 PCF_k8s-pod-crashing-loop " "Processing Error Alarm"} " "Pod cee-dnrce301/grafana-59768df649-n6x6x (grafana) is restarting 1.03 times / 5 minutes." InService Critical NETX
الحل
إيقاف تشغيل CEE
قم بتشغيل هذه الأوامر من شبكة إيثرنت المحسنة المجمعة (CEE) لإيقاف التشغيل:
[pod-name-smf/podname] cee# conf
Entering configuration mode terminal
[pod-name-smf/podname] cee(config)# system mode shutdown
[pod-name-smf/podname] cee(config)# commit
Commit complete.
[pod-name-smf/podname] cee(config)# end
انتظر وصول النظام إلى 100٪.
إزالة مجلدات DB ل PostGres Pods
تحقق لرؤية العقد التي تم فيها إنشاء PostGres Pods.
في هذا المثال، يتم إنتاج كل أجهزة PostGres على "master-1":
cloud-user@dnup0300-aio-1-master-1:~$ kubectl get pods -n cee-dnrce301 -o wide | grep postgres
postgres-0 1/1 Running 0 35d 10.108.50.28 dnup0300-aio-1-master-1 <none> <none>
postgres-1 1/1 Running 0 35d 10.108.50.47 dnup0300-aio-1-master-1 <none> <none>
postgres-2 1/1 Running 0 35d 10.108.50.102 dnup0300-aio-1-master-1 <none> <none>
سيتم إنشاء مجلدات لكل PostGres في هذا المسار في العقدة لتخزين قاعدة البيانات:
/data/<cee-namespace>/postgres<0,1,2>
قم بإزالة هذه المجلدات كما هو موضح:
cloud-user@dnup0300-aio-1-master-1:/data/cee-dnrce301$ sudo rm -rf data-postgres-0
cloud-user@dnup0300-aio-1-master-1:/data/cee-dnrce301$ sudo rm -rf data-postgres-1
cloud-user@dnup0300-aio-1-master-1:/data/cee-dnrce301$ sudo rm -rf data-postgres-2
ملاحظة: قد تكون هناك حالات تكون فيها المجلدات "/data/
/postgres<0,1,2>"
يتم إنشاؤها على عقد مختلفة، مثل ماستر-1، ماستر-2، ماستر-3، وهكذا.
إستعادة CEE
قم بتسجيل الدخول إلى مركز OPS لاستعادة CEE وتنفيذ أوامر CLI التالية:
[pod-name-smf/podname] cee# conf
Entering configuration mode terminal
[pod-name-smf/podname] cee(config)# system mode running
[pod-name-smf/podname] cee(config)# commit
Commit complete.
[pod-name-smf/podname] cee(config)# end
[pod-name-smf/podname] cee# exit
انتظر وصول النظام إلى 100٪.
عمليات التحقق من النشر
التحقق من Kubernetes من الأساسي
قم بتشغيل هذا الأمر للتحقق من حالة Grafana pod وبود آخر:
cloud-user@pod-name-smf-master-1:~$ kubectl get pods -A -o wide | grep grafana
cloud-user@pod-name-smf-master-1:~$ kubectl get pods -A -o wide
يجب أن تعرض جميع أجهزة PODS قيد التشغيل وقيد التشغيل دون أية إعادة تشغيل.
التحقق من مسح التنبيهات من CEE
قم بتشغيل هذا الأمر لتأكيد مسح التنبيهات من CEE:
[pod-name-smf/podname] cee# show alerts active summary | include "POD_Res|k8s_grafana"