دليل أستكشاف الأخطاء وإصلاحها لإعادة التشغيل المستمر ل Grafana Pods

خيارات التنزيل

ePub (83.8 KB)
العرض في تطبيقات مختلفة على iPhone أو iPad أو نظام تشغيل Android أو قارئ Sony أو نظام التشغيل Windows Phone
Mobi (Kindle) (72.7 KB)
عرض على جهاز Kindle أو تطبيق Kindle على أجهزة متعددة

تم التحديث:٢٥ يناير ٢٠٢٢

معرّف المستند:217655

لغة خالية من التحيز

تسعى مجموعة الوثائق لهذا المنتج جاهدة لاستخدام لغة خالية من التحيز. لأغراض مجموعة الوثائق هذه، يتم تعريف "خالية من التحيز" على أنها لغة لا تعني التمييز على أساس العمر، والإعاقة، والجنس، والهوية العرقية، والهوية الإثنية، والتوجه الجنسي، والحالة الاجتماعية والاقتصادية، والتمييز متعدد الجوانب. قد تكون الاستثناءات موجودة في الوثائق بسبب اللغة التي يتم تشفيرها بشكل ثابت في واجهات المستخدم الخاصة ببرنامج المنتج، أو اللغة المستخدمة بناءً على وثائق RFP، أو اللغة التي يستخدمها منتج الجهة الخارجية المُشار إليه. تعرّف على المزيد حول كيفية استخدام Cisco للغة الشاملة.

حول هذه الترجمة

ترجمت Cisco هذا المستند باستخدام مجموعة من التقنيات الآلية والبشرية لتقديم محتوى دعم للمستخدمين في جميع أنحاء العالم بلغتهم الخاصة. يُرجى ملاحظة أن أفضل ترجمة آلية لن تكون دقيقة كما هو الحال مع الترجمة الاحترافية التي يقدمها مترجم محترف. تخلي Cisco Systems مسئوليتها عن دقة هذه الترجمات وتُوصي بالرجوع دائمًا إلى المستند الإنجليزي الأصلي (الرابط متوفر).

المحتويات

المقدمة

المتطلبات الأساسية

المتطلبات

المكونات المستخدمة

معلومات أساسية

ما هي SMI؟

ما هي SMI CEE؟

ما هي أدوات دعم تقنية شبكة إيثرنت المحسنة المجمعة؟

ما هو Grafana pod؟

ما هو Postgres pod؟

المشكلة

الحل

إيقاف تشغيل CEE

إزالة مجلدات DB ل PostGres Pods

إستعادة CEE

عمليات التحقق من النشر

التحقق من Kubernetes من الأساسي

التحقق من مسح التنبيهات من CEE

المقدمة

يصف هذا المستند حلا بديلا لاسترداد رزمة غرافانا التي تبدأ من جديد بشكل مستمر.

المتطلبات الأساسية

المتطلبات

توصي Cisco بأن تكون لديك معرفة بالمواضيع التالية:

بيئة التنفيذ المشتركة (CEE) للبنية الأساسية للخدمات الدقيقة للمشتركين من Cisco (SMI)
النظام الأساسي للنشر الأصلي (CNDP) من الجيل الخامس للشبكات أو بنية أجهزة الكمبيوتر المحمولة طراز SMI (BM)
محطات الإرساء و كوبرنيتس

المكونات المستخدمة

تستند المعلومات الواردة في هذا المستند إلى إصدارات البرامج والمكونات المادية التالية:

SMI 2020.02.2.35
Kubernetes v1.21.0

تم إنشاء المعلومات الواردة في هذا المستند من الأجهزة الموجودة في بيئة معملية خاصة. بدأت جميع الأجهزة المُستخدمة في هذا المستند بتكوين ممسوح (افتراضي). إذا كانت شبكتك قيد التشغيل، فتأكد من فهمك للتأثير المحتمل لأي أمر.

معلومات أساسية

ما هي SMI؟

Cisco SMI هي مجموعة طبقات من تقنيات ومعايير السحابة التي تمكن التطبيقات المستندة إلى الخدمات الصغيرة من وحدات العمل لعبارة الشبكة واسعة النطاق (BNG) وقابلية التنقل من Cisco والكبلات. لهذه التطبيقات وظائف مماثلة لإدارة المشترك ومتطلبات مشابهة لبيئة البيانات.

السمات:

توفر حزمة شبكات الطبقة (التقنيات والمعايير) عمليات النشر من أعلى إلى أسفل وتستوعب البنية الأساسية الحالية للشبكة.
تشترك جميع التطبيقات في تقنية شبكة إيثرنت المحسنة المجمعة (CEE) بالنسبة للوظائف التي لا تستخدم التطبيقات (تخزين البيانات والنشر والتهيئة والقياس عن بعد والتنبيه)، والتي توفر تفاعلا وخبرا متسقين لجميع نقاط اتصال العملاء ونقاط التكامل.
يتم نشر التطبيقات ومعالج إيثرنت المحسنة المجمعة في حاويات الخدمة الدقيقة ويتم توصيلها بشبكة خدمة ذكية.
تعمل واجهة برمجة التطبيقات (API) مكشوفة للنشر والتهيئة والإدارة على تمكين التشغيل التلقائي.

ما هي SMI CEE؟

تعد تقنية شبكة إيثرنت المحسنة المجمعة (CEE) حلا برمجيا تم تطويره لمراقبة تطبيقات الأجهزة المحمولة والكبلات التي يتم نشرها على SMI. تلتقط تقنية شبكة إيثرنت المحسنة المجمعة (CEE) المعلومات (المقاييس الأساسية) من التطبيقات بطريقة مركزية للمهندسين لتصحيح الأخطاء واستكشاف الأخطاء وإصلاحها.
يعتبر CEE مجموعة الأدوات الشائعة التي يتم تثبيتها لجميع التطبيقات. يأتي هذا الطراز مزودا بمركز مخصص لإدارة العمليات (OPS)، والذي يوفر واجهة سطر الأوامر (CLI) وواجهات برمجة التطبيقات (API) لإدارة أدوات الشاشة. تتوفر تقنية شبكة إيثرنت المحسنة المجمعة (CEE) واحدة فقط لكل مجموعة.

ما هي أدوات دعم تقنية شبكة إيثرنت المحسنة المجمعة؟

POD هو عملية يتم تشغيلها على نظام المجموعة Kubernetes. يحتوي POD على وحدة تستجيب للتعديل تعرف باسم حاوية. يحتوي POD على حاوية واحدة أو عدة حاويات.
يقوم Kubernetes بنشر PODs واحد أو أكثر على عقدة واحدة، والتي يمكن أن تكون جهاز فعلي أو افتراضي. يحتوي كل POD على هوية منفصلة مع عنوان IP داخلي ومساحة منفذ. ومع ذلك، يمكن أن تشارك الحاويات الموجودة في قاعدة بيانات التخزين وموارد الشبكة. يحتوي CEE على عدد من نقاط الوصول التي لها وظائف فريدة. من بين العديد من مجموعات تطوير شبكة إيثرنت المحسنة المجمعة (CEE)، هناك قضيتا غرافانا وبوستيدست.

ما هو Grafana pod؟

يمكن لقرد غرافانا التواصل مع بروميثيوس بود من خلال خدمة بروميثيوس، التي تسمى بروميثيوس.

ما هو Postgres pod؟

تدعم Postgres قواعد بيانات SQL ذات إمكانية التكرار لتخزين التنبيهات ولوحات المعلومات Grafana.

المشكلة

يتم إعادة تشغيل قرص غرافانا بشكل منتظم، بينما يتم تشغيل أجهزة طرد البريد بدون مشاكل.

للاسترداد، أستخدم هذا الأمر لحذف Grafana pod يدويا:

kubectl delete pod 
     
     
       -n

عند الحذف، يتم إعادة إنشاء Grafana pod وإعادة تشغيله.

إذا إستمرت المشكلة، فاستخدم أمر CLI هذا للحصول على نموذج التنبيه من CEE لتحديد المشكلة:

[pod-name-smf/podname] cee# show alerts active summary | include "POD_Res|k8s_grafana"

مثال:

[pod-name-smf/podname] cee# show alerts active summary | include "POD_Res|k8s_grafana" Time Alert Name Description Port Access ID NEState Severity Alert Source 16:26 PCF_POD_Restarted " "Processing Error Alarm"} " ""Container k8s_grafana_grafana-59768df649-n6x6x_cee-dnrce301_a4ff5711-0e20-4dd4-ae7f-47296c334930_883 of pod grafana-59768df649-n6x6x in namespace cee-dnrce301 has been restarted."" InService Major NETX 16:23 PCF_k8s-pod-crashing-loop " "Processing Error Alarm"} " "Pod cee-dnrce301/grafana-59768df649-n6x6x (grafana) is restarting 1.03 times / 5 minutes." InService Critical NETX 16:20 PCF_POD_Restarted " "Processing Error Alarm"} " ""Container k8s_grafana_grafana-59768df649-n6x6x_cee-dnrce301_a4ff5711-0e20-4dd4-ae7f-47296c334930_882 of pod grafana-59768df649-n6x6x in namespace cee-dnrce301 has been restarted."" InService Major NETX 16:14 PCF_POD_Restarted " "Processing Error Alarm"} " ""Container k8s_grafana_grafana-59768df649-n6x6x_cee-dnrce301_a4ff5711-0e20-4dd4-ae7f-47296c334930_881 of pod grafana-59768df649-n6x6x in namespace cee-dnrce301 has been restarted."" InService Major NETX 16:08 PCF_POD_Restarted " "Processing Error Alarm"} " ""Container k8s_grafana_grafana-59768df649-n6x6x_cee-dnrce301_a4ff5711-0e20-4dd4-ae7f-47296c334930_880 of pod grafana-59768df649-n6x6x in namespace cee-dnrce301 has been restarted."" InService Major NETX 16:02 PCF_POD_Restarted " "Processing Error Alarm"} " ""Container k8s_grafana_grafana-59768df649-n6x6x_cee-dnrce301_a4ff5711-0e20-4dd4-ae7f-47296c334930_879 of pod grafana-59768df649-n6x6x in namespace cee-dnrce301 has been restarted."" InService Major NETX 15:56 PCF_POD_Restarted " "Processing Error Alarm"} " ""Container k8s_grafana_grafana-59768df649-n6x6x_cee-dnrce301_a4ff5711-0e20-4dd4-ae7f-47296c334930_878 of pod grafana-59768df649-n6x6x in namespace cee-dnrce301 has been restarted."" InService Major NETX 15:53 PCF_k8s-pod-crashing-loop " "Processing Error Alarm"} " "Pod cee-dnrce301/grafana-59768df649-n6x6x (grafana) is restarting 1.03 times / 5 minutes." InService Critical NETX

الحل

إيقاف تشغيل CEE

قم بتشغيل هذه الأوامر من شبكة إيثرنت المحسنة المجمعة (CEE) لإيقاف التشغيل:

[pod-name-smf/podname] cee# conf Entering configuration mode terminal [pod-name-smf/podname] cee(config)# system mode shutdown [pod-name-smf/podname] cee(config)# commit Commit complete. [pod-name-smf/podname] cee(config)# end

انتظر وصول النظام إلى 100٪.

إزالة مجلدات DB ل PostGres Pods

تحقق لرؤية العقد التي تم فيها إنشاء PostGres Pods.
في هذا المثال، يتم إنتاج كل أجهزة PostGres على "master-1":

cloud-user@dnup0300-aio-1-master-1:~$ kubectl get pods -n cee-dnrce301 -o wide | grep postgres
postgres-0 1/1 Running 0 35d 10.108.50.28 dnup0300-aio-1-master-1 <none> <none>
postgres-1 1/1 Running 0 35d 10.108.50.47 dnup0300-aio-1-master-1 <none> <none>
postgres-2 1/1 Running 0 35d 10.108.50.102 dnup0300-aio-1-master-1 <none> <none>

سيتم إنشاء مجلدات لكل PostGres في هذا المسار في العقدة لتخزين قاعدة البيانات:

/data/<cee-namespace>/postgres<0,1,2>

قم بإزالة هذه المجلدات كما هو موضح:

cloud-user@dnup0300-aio-1-master-1:/data/cee-dnrce301$ sudo rm -rf data-postgres-0
cloud-user@dnup0300-aio-1-master-1:/data/cee-dnrce301$ sudo rm -rf data-postgres-1
cloud-user@dnup0300-aio-1-master-1:/data/cee-dnrce301$ sudo rm -rf data-postgres-2

ملاحظة: قد تكون هناك حالات تكون فيها المجلدات "/data/ /postgres<0,1,2>" يتم إنشاؤها على عقد مختلفة، مثل ماستر-1، ماستر-2، ماستر-3، وهكذا.

إستعادة CEE

قم بتسجيل الدخول إلى مركز OPS لاستعادة CEE وتنفيذ أوامر CLI التالية:

[pod-name-smf/podname] cee# conf Entering configuration mode terminal [pod-name-smf/podname] cee(config)# system mode running [pod-name-smf/podname] cee(config)# commit Commit complete. [pod-name-smf/podname] cee(config)# end [pod-name-smf/podname] cee# exit

انتظر وصول النظام إلى 100٪.

عمليات التحقق من النشر

التحقق من Kubernetes من الأساسي

قم بتشغيل هذا الأمر للتحقق من حالة Grafana pod وبود آخر:

cloud-user@pod-name-smf-master-1:~$ kubectl get pods -A -o wide | grep grafana cloud-user@pod-name-smf-master-1:~$ kubectl get pods -A -o wide

يجب أن تعرض جميع أجهزة PODS قيد التشغيل وقيد التشغيل دون أية إعادة تشغيل.

التحقق من مسح التنبيهات من CEE

قم بتشغيل هذا الأمر لتأكيد مسح التنبيهات من CEE:

[pod-name-smf/podname] cee# show alerts active summary | include "POD_Res|k8s_grafana"

محفوظات المراجعة

المراجعة	تاريخ النشر	التعليقات
1.0	25-Jan-2022	الإصدار الأولي

تمت المساهمة بواسطة مهندسو Cisco

Arunkumaran R
Cisco TAC Engineer

دليل أستكشاف الأخطاء وإصلاحها لإعادة التشغيل المستمر ل Grafana Pods

خيارات التنزيل

لغة خالية من التحيز

حول هذه الترجمة

المحتويات

المقدمة

المتطلبات الأساسية

المتطلبات

المكونات المستخدمة

معلومات أساسية

ما هي SMI؟

ما هي SMI CEE؟

ما هي أدوات دعم تقنية شبكة إيثرنت المحسنة المجمعة؟

ما هو Grafana pod؟

ما هو Postgres pod؟

المشكلة

الحل

إيقاف تشغيل CEE

إزالة مجلدات DB ل PostGres Pods

إستعادة CEE

عمليات التحقق من النشر

التحقق من Kubernetes من الأساسي

التحقق من مسح التنبيهات من CEE

محفوظات المراجعة

تمت المساهمة بواسطة مهندسو Cisco

هل كان هذا المستند مفيدًا؟

اتصل بنا

ينطبق هذا المستند على هذه المنتجات