المقدمة
يصف هذا المستند الخطوات التي يجب إكمالها من أجل التقاط المعلومات عند حدوث عطل أو تعطل في نظام مجموعة نهج الكم (QPS). وفي حالة تلبية متطلبات الأجهزة والبرامج والأجهزة الافتراضية، فمن غير المرجح أن يتعطل نظام QPS.
المتطلبات الأساسية
المتطلبات
لا توجد متطلبات خاصة لهذا المستند.
المكونات المستخدمة
تستند المعلومات الواردة في هذا المستند إلى إصدارات البرامج والمكونات المادية التالية:
- الإصدار 5.5 من QPS والإصدارات الأحدث.
ملاحظة: لن تظهر بعض السجلات في إصدارات QPS الأقدم من الإصدار 5.5 ل QPS.
تم إنشاء المعلومات الواردة في هذا المستند من الأجهزة الموجودة في بيئة معملية خاصة. بدأت جميع الأجهزة المُستخدمة في هذا المستند بتكوين ممسوح (افتراضي). إذا كانت شبكتك مباشرة، فتأكد من فهمك للتأثير المحتمل لأي أمر.
معلومات الالتقاط
في حالة حدوث فشل في نظام QPS، قم بجمع هذه المعلومات:
التشخيص وسجلات تصحيح الأخطاء
- قم بتسجيل الدخول إلى الجهاز الظاهري لعميل "وظيفة السياسة وقواعد الشحن" (PCRF) (على سبيل المثال، PCRFCLIENT01) وتجميع معلومات التشخيص (على سبيل المثال، /opt/broadhop/installer/diag/diagnostics.sh).
- قم بتسجيل الدخول إلى الجهاز الظاهري لعميل PCRF وتجميع معلومات تصحيح الأخطاء. تتضمن معلومات تصحيح الأخطاء سجل جودة الخدمة (QNS) المدمج، وإعادة توجيه SVN، وتفاصيل تكوين جودة الخدمة (QNS). تأكد من أن السجلات المدمجة تغطي وقت فشل النظام ومن تعيين مستوى تصحيح الأخطاء في ملف logback.xml.
- قم بتجميع هذا الإخراج من QPS لديك (على سبيل المثال، قم بتشغيل /opt/broadhop/installer/diag/zip_debug_info.sh ويتم تخزين الإخراج في /var/tmp/debug_info<date>.zip).
معلومات ترخيص QPS
- قم بتسجيل الدخول إلى الجهاز الظاهري PCRF Client وتجميع معلومات ترخيص QPS. يرخص عادة ل QPS لميزة معينة وهناك حد أقصى لعدد الجلسات المتزامنة التي تدعمها. يشتمل QPS أيضا على تاريخ انتهاء صلاحية لهذه الميزة.
- انتقل إلى هذا الدليل: /etc/broadhop/license والتقاط إخراج ملف الترخيص (.lic). (على سبيل المثال،cat /etc/broadhop/license/QUANTUM201311210402429360.lic).
إحصائيات النظام
- التقاط إحصائيات النظام (على سبيل المثال: وحدة المعالجة المركزية (CPU) والذاكرة واستخدام القرص).
- قم بتسجيل الدخول إلى الجهاز الظاهري PCRF وتجميع الإخراج. مثال: /opt/broadhop/control/top_qps.sh
- قم بتسجيل الدخول إلى الجهاز الظاهري المتوافق (على سبيل المثال، pcrfclient0x، lb0x، qns0x) والتقاط إحصائيات النظام هذه:
cat /proc/meminfo > معلومات الذاكرة المخصصة
Free -s 60 > إحصائيات الذاكرة لكل دقيقة
نظام VMSTAT 1 > حالة وحدة المعالجة المركزية (CPU) لكل دقيقة واحدة
ps -aux | HEAD -10 > تفاصيل العمليات العشر العليا التي تستهلك معظم إستخدام وحدة المعالجة المركزية (CPU)
swapon -s > تبديل ملخص الاستخدام لكل جهاز
. دو -أ | فرز -n -r | head -n 10 > أفضل 10 ملفات / دلائل تستهلك مساحة أكبر
- قم بتسجيل الدخول إلى الجهاز الظاهري SessionMgr وتجميع نظامي Mongostat وMongotop للإصدارات، مما يساعد على أستكشاف الأخطاء وإصلاحها فيما إذا كانت المشكلة متعلقة بقاعدة البيانات أم لا.
تكوين مؤشر الترابط في منشئ السياسة
قم بتسجيل الدخول إلى Policy Builder وانتقل إلى Reference Data > System-1 > Plug gin Configuration > Threading Configuration.
قد يتراوح عدد مؤشرات الترابط من 40 إلى 50 بالنسبة ل TPS، ولكنه أقل من 1000. الحد الأقصى لعدد مؤشرات الترابط التي يمكنك تكوينها هو 50. إذا قمت بزيادة عدد مؤشرات الترابط، فإن هذا يؤثر على أداء النظام.
سجل الأخطاء الفادحة
عند حدوث فشل في النظام، يقوم QPS بإنشاء سجل خطأ فادح، والذي يحتوي على حالة العملية في الوقت الذي حدث فيه الخطأ الفادح. تتسبب أخطاء الخطأ الفادحة أو أخطاء الاستثناء الفادحة في إجهاض البرنامج.
يتضمن سجل الأخطاء الفادح هذه المعلومات:
- إستثناء التشغيل أو الإشارة التي أدت إلى حدوث الخطأ المميت
- الإصدار ومعلومات التكوين
- تفاصيل حول مؤشر الترابط الذي تسبب في حدوث خطأ فادح وتتبع مكدس مؤشر الترابط
- قائمة مؤشرات الترابط قيد التشغيل وحالتها
- معلومات موجزة حول كومة الذاكرة المؤقتة
- قائمة المكتبات الأصلية المحملة
- وسيطات سطر الأوامر
- متغيرات البيئة
- تفاصيل حول نظام التشغيل ووحدة المعالجة المركزية (CPU)
يتبع اسم ملف السجل الافتراضي هذا التنسيق: hs_err_pid<pid>.log ويتم إنشاؤه في دليل العمل حيث بدأت عمليات Java المطابقة. مثال: دليل عمل المستخدم عندما بدأ المستخدم عملية QNS.
إذا لم تكن تعرف دليل العمل، فابحث في النظام عن الملف باسم hs_err_pid*.log ثم افحص الملف لمدة زمنية تتطابق مع حدوث الخطأ.
أتمت هذا steps in order to عينت مكان للخطأ فادح:
- تسجيل الدخول إلى الجهاز الظاهري PCRFCLIENT01
- افتح jvm.conf (على سبيل المثال، vi /etc/broadhop/pcrf/jvm.conf).
- قم بإضافة الخيار: -xx:ErrorFile=<directory>/<file-name>٪p.log إلى القائمة وتأكد من وجود مسار الدليل المحدد ومن حصول QNS الخاص بالمستخدم على الإذن الكامل لهذا الدليل. مثال: -X:ErrorFile=/home/qns/fatal_error٪p.log
- ال "config.sh" أمر يستطيع سببت كثير مشكلة إن ال conf مبرد في pcrfClient01:/etc/broadhop لا in synch مع ال conf مبرد في /etc/broadhop على ال VMs يركض ال QNS خدمة. سيأخذ الأمر syncConfig.sh ملفات conf pcrfclient01:/etc/broadhop ويكتب عبر ملف conf في /etc/broadhop على VMs التي تشغل QNS.
تحذير: سيأخذ الأمر synconfig.sh ملفات pcrfclient01:/etc/broadhop conf وسيكتب فوق جميع ملفات conf في /etc/broadhop على الأجهزة الظاهرية التي تشغل خدمة QNS (على سبيل المثال، iomgr01، iomgr02، qns01، qns02، وما إلى ذلك)
- قم بإعادة تشغيل تطبيق QNS وأدخل الأمر restarlong.sh