Einleitung
In diesem Dokument wird das proaktive RMA-System beschrieben. Cisco nutzt Telemetriedaten von vernetzten Produkten und kann so ein nahezu nahtloses Kundenerlebnis bieten, wenn bei Produkten bestimmte Fehler auftreten. Ohne menschliches Eingreifen werden ein Service Request (SR) und eine Return Material Authorization (RMA) proaktiv genehmigt, wodurch die Zeit vom Ausfall bis zum Austausch erheblich verkürzt wird. In diesem Dokument werden Informationen zu diesem Programm, zu den vom Kunden durchzuführenden Aktionen, zu den von diesem Programm abgedeckten Geräten/Problemen und zu den verfügbaren Konfigurationen (Opt-out, Kontaktkonfiguration) behandelt.
Anforderungen
- Das Gerät muss entweder direkt mit der Intersight Cloud oder über eine verbundene virtuelle Appliance verbunden und beansprucht werden (seit Juli 2012 unterstützte Appliance). Weitere Informationen zum Anschließen und Beantragen eines Geräts finden Sie in der Intersight Getting Started Guide. Private virtuelle Appliances werden nicht unterstützt.
- Für verbundene virtuelle Appliances muss die proaktive RMA aktiviert sein. Weitere Informationen hierzu finden Sie hier.
- Das Gerät muss durch einen gültigen Supportvertrag abgedeckt sein (z. B. Smart Net Total Care - SNTC).
- Für Intersight SaaS ist keine Lizenz erforderlich (keine Lizenzstufe), Essentials für Connected Virtual Appliance (CVA) mindestens
Umfang
Alle Kunden und alle Geräte, die die oben genannten Anforderungen erfüllen, sind im Umfang enthalten. Dieses Programm wird auf der Basis eines Opt-out durchgeführt. Um jedoch auf verbundenen virtuellen Appliances ausgeführt zu werden, muss die Funktion für proaktive RMAs aktiviert sein. Neben den folgenden Fehlertypen werden in diesem Programm weitere Hardware-Fehlerszenarien/-fehler berücksichtigt.
Speicherfehler
UCS-Speicherfehler (DIMM-Fehler F0185). Diese stehen für nicht korrigierbare Fehler sowie für DIMMs im gleichen Kanal zu DIMMs, bei denen ein nicht korrigierbarer Fehler (UECC) aufgetreten ist. Bei DIMMs, die sich im gleichen Kanal befinden, tritt zwar ein F0185-Fehler auf, es handelt sich jedoch nicht um beschädigte DIMMs, und sie werden nicht ausgetauscht. Weitere Informationen zu diesem Verhalten finden Sie unter CSCvt29521. Hinweis: Für diesen Fehlertyp werden alle Verwaltungsmodi (Standalone, UMM - UCSM Managed Mode, IMM - Intersight Managed Mode) unterstützt.
Hinweise:
- Server, bei denen mehr als ein herabgesetzter DIMM-Fehler auftritt, sind nicht abgedeckt - Kunden sollten für diese Probleme manuell Tickets öffnen.
- Instanzen von CSCvo48003("M4 Blade - Patrol Scrubber logs DIMM address with 4k border") oder CSCvo48006 ("M4 Rack - Patrol Scrubber logs DIMM address with 4k border") werden ausgeschlossen
UCS-Laufwerksfehler
UCS-Festplattenfehler (die meisten Festplattenfehler F1732 und F0181) werden von dieser Funktion abgedeckt. Laufwerke mit dem Status "Vorhersehbarer Fehler" oder "Fehlgeschlagen" lösen diese Fehler aus und sollten abgedeckt werden.
Hinweise:
- IMM-verwaltete Server werden noch nicht unterstützt
- Festplatten mit Fehlern, jedoch in einem scheinbaren nicht ausgefallenen Zustand (d. h. : Fremdkonfiguration, Copyback, Wiederaufbau, etc.) werden ausgeschlossen.
- Festplatten, die einen Passthrough- oder Nicht-RAID-HBA-Speichercontroller verwenden, oder Festplatten im JBOD-Modus verfügen möglicherweise nicht über ausreichende Protokollbelege in den Dateien des technischen Supports, um festzustellen, ob eine Festplatte ausgefallen ist und nicht ausgetauscht werden kann. Ein Teil der Festplattenausfälle auf Nicht-RAID-HBAs verursachen einen entsprechenden Fehler und verfügen über ausreichende Protokollbelege, um eingeschlossen zu werden.
Fehler bei HyperFlex-Laufwerk
Dauerhaft fehlgeschlagene Zwischenspeicherung und persistente Festplatten in Hyperflex (manchmal auch als Blacklists/Failed Permanently/Reretien bezeichnet) werden durch diese Funktion abgedeckt.
Hinweis: Der Cluster sollte automatisch repariert werden und kurz nach dem Ausfall des Datenträgers fehlerfrei sein. In diesen Fällen sollte ein Datenträger dennoch ersetzt werden.
Hinweise:
- Cluster, bei denen mehr als ein Laufwerk ausfällt, werden nicht betrieben.
- Laufwerke, die mit FN70234 übereinstimmen, werden ausgeschlossen.
- Laufwerke, die den von CSCvo58565 betroffenen Modellen entsprechen, werden ausgeschlossen.
- HX-Cluster, die über die Intersight Connected Virtual Appliance verbunden sind, werden noch nicht betrieben.
Lüfterausfälle bei C-Serie
Lüfterfehler auf einem eigenständigen Server der C-Serie oder einem UMM-Server (UCSM Managed Mode) werden unterstützt. Störungscodes: F0484, F0397, F0794 liegen im Umfang.
Hinweise:
- IMM-verwaltete Server werden noch nicht unterstützt
- Mehrere gleichzeitig auftretende Lüfterausfälle sind wahrscheinlich keine Hardwareausfälle der Lüfter und werden derzeit nicht unterstützt.
- Bei vorübergehenden Lüfterausfällen sollte kein proaktives RMA-Ticket erstellt werden.
Lüfterausfälle bei Fabric Interconnect
Lüfterausfälle in einem Fabric Interconnect, der sich im UMM (UCSM Managed Mode) befindet, werden unterstützt. Störungscodes: F0484, F0397 sind im Umfang.
Hinweise:
- IMM-verwaltete Server werden noch nicht unterstützt
- Mehrere gleichzeitig auftretende Lüfterausfälle sind wahrscheinlich keine Hardwareausfälle der Lüfter und werden derzeit nicht unterstützt.
Details zum Angebot
Wenn ein abgedecktes Fehlerereignis auftritt, werden ein Serviceticket (SR) und eine RMA generiert. Interessante Punkte:
- E-Mails werden von sherholm@cisco.com gesendet. Kunden können diese Adresse ausdrücklich zulassen.
- Ticket wird entweder mit der konfigurierten E-Mail (siehe Abschnitt zur erweiterten Konfiguration unten) oder dem zuletzt berechtigten Benutzer erstellt, der sich bei Intersight angemeldet hat.
- Die anderen Benutzer des Intersight-Kontos, die im Rahmen des Vertrags berechtigt sind, werden in die E-Mail kopiert. Wenn Benutzer explizit konfiguriert werden (über Tagging, siehe unten), erhalten nur konfigurierte Benutzer die E-Mail.
- Jeder berechtigte Benutzer kann die RMA selbst übernehmen und die erforderlichen Angaben machen.
- Das RMA-Tool von Cisco sendet Erinnerungs-E-Mails, um den Entwurf der RMA an den Benutzer auszufüllen, mit dem das Ticket erstellt wurde.
Nach der Erstellung der Serviceanfrage erhalten Kunden eine E-Mail, ähnlich wie im folgenden Beispiel:
From: sherholm@cisco.com
To: bob@example.com
Subject: [Action Required] SR: 600000000 - Proactive Replacement of Memory Module [Connected via Intersight]
Hello Bob,
I am writing to let you know that Cisco has received a fault message from your Cisco UCS server connected by Cisco Intersight.
The fault indicates that a memory DIMM module has failed and needs replacing. I have automatically created a TAC Case for
you (SR 600000000) and have created the RMA to ship you the replacement DIMM. I just need you to click the RMA link and
verify your shipping address so the replacement part can be shipped out to you: https://ibpm.cisco.com/rma/home/?RMANumber=800000000
Note: If you have difficulty loading the link above, please contact LSC at one of the following manners:
https://www.cisco.com/c/en/us/buy/logistics-support-center.html
Here is some more information about the failed DIMM and the server it's installed in:
Domain Name: ucs-domain
Domain IP Address: 192.0.2.1
Server Serial Number: SERIAL
Fault Description: DIMM DIMM_H1 on server 1/1 operability: inoperable
Link to server in Intersight: https://intersight.com/an/compute/physical-summaries/moid/server/
Link to Fault in Intersight: https://intersight.com/an/cond/alarms/?Moid=moid
Please let me know if you have further questions,
Sincerely,
Sherlock
Technical Consulting Engineer.Customer Delivery
Cisco Customer Experience
Vorteile
- Erheblich reduzierter Aufwand für den Erhalt eines Ersatzteils.
- Automatische Erstellung von SR - schnellere Reaktion auf Ereignisse.
- Vorabgenehmigung der RMA.
- Möglichkeit zum Ausfüllen der RMA-Daten direkt nach Kontaktaufnahme
- Automatische Erfassung zielgerichteter Diagnosedaten.
- Softwarefehler-Screening - Softwarefehler, die als Hardwarefehler maskiert werden, führen nicht zu unnötigen RMAs.
Weitere Details
Workflow-Details
Erweiterte Konfiguration (optional)
Zurzeit werden zwei erweiterte Konfigurationsoptionen unterstützt. Konfigurationsoptionen werden in Intersight mithilfe von Tags festgelegt.
Die unten beschriebenen Tags können auf einer der folgenden Ebenen konfiguriert werden:
- Konto (über GUI)
- Organisation (über API)
- Zielgerät/Registriertes Gerät (über API)
Kunden, die die Connected Virtual Appliance verwenden, können die Kennzeichnung entweder auf der Appliance selbst oder in der Intersight Cloud vornehmen.
Weitere Informationen zu Einstellungs-Tags finden Sie im Dokument Setting Tags in Intersight.
Explizite Konfiguration eines Kontakts
Kunden können die E-Mail-Adresse(n), die sie mit dem Serviceticket und der RMA verknüpfen möchten, explizit konfigurieren. Der Tag-Name/-Schlüssel lautet "AutoRMAEmail", und der Wert ist eine CSV-Liste mit E-Mails, die Sie benachrichtigen und zur Bearbeitung berechtigen möchten. Die proaktive RMA verwendet die Methode des ersten Abgleichs und analysiert E-Mails auf einer von links nach rechts verlaufenden Weise. Wenn Sie beispielsweise "user@example.com,user2@example.com" verwenden, wird zunächst versucht, user@example.com zu öffnen, es werden jedoch alle E-Mails kopiert.
Warnung: Zum Öffnen eines Tickets muss mindestens eine E-Mail in der CSV-Liste mit einem gültigen CCO-Konto verknüpft sein, das mit dem Vertrag verknüpft ist, unter den die Seriennummer des Geräts fällt.
Bitte beachten Sie, dass Intersight für Tags mit 255 Zeichen eine Zeichenbeschränkung hat. Aus diesem Grund unterstützt die proaktive RMA alle Tags, die mit AutoRMAEmail beginnen (z. B. AutoRMAEmail1, AutoRMAEmail2) und alle Werte miteinander verketten.
Wenn Sie die API zum Konfigurieren von Tags verwenden, muss das Tag ähnlich aussehen wie:
{"Key":"AutoRMAEmail","Value":"email1@example.com,email2@example.com"}
Siehe oben für den Link zu einem Dokument, in dem Details zum Tagging erläutert werden.
Von proaktiven RMAs abmelden
Abmelden,
Wenn Sie die API verwenden, muss das Tag wie unten gezeigt sein.
{"Key":"AutoRMA","Value":"False"}
Um sich wieder für proaktive RMAs zu entscheiden (falls diese Option deaktiviert ist), können Benutzer den Tag wie folgt ändern:
{"Key":"AutoRMA","Value":"True"}
Oder sie können den Tag ganz entfernen. Hinweis: Benutzer müssen sich NICHT über Tags anmelden, wenn sie sich nicht angemeldet haben. Sie werden automatisch aktiviert, wenn sie sich nicht angemeldet haben.
Häufig gestellte Fragen
F: Welche Informationen erfasst Cisco für diese Fehler?
A: Fehlerdetails (Zeit/Gerät/usw.), Inventarinformationen (Modell/Seriell/Firmware), zutreffende Diagnosedaten (z. B.: CIMC/UCSM/HX Tech Supports).
F: Wie lange dauert die Reaktion?
A: Tickets werden in der Regel innerhalb einer Stunde nach Auftreten des Fehlers geöffnet und die RMA erstellt. Dazu gehört auch die gesamte Zeit, die zum Generieren und Verarbeiten der entsprechenden Diagnosedaten benötigt wird.
Frage: Wer kann eine RMA einsenden?
A: Jeder berechtigte Benutzer des Vertrags, durch den das Gerät abgedeckt ist, kann die RMA einreichen. Dabei muss es sich nicht um dieselbe Person handeln, die bei der TAC-Serviceanfrage als Kontakt fungiert. Die RMA ist anfänglich einem spezifischen CCO-Konto zugeordnet. Benutzer, die die RMA ausfüllen möchten, können auf die Schaltfläche "Actions" (Aktionen) in der rechten oberen Ecke der RMA klicken und "Transfer Assignment" (Zuweisung übertragen) auswählen. Belassen Sie auf dem nächsten Bildschirm Ihre CCO-Angaben im Eingabefeld, und klicken Sie auf "Submit" (Senden).
Frage: Beim Laden der RMA tritt ein Fehler auf. Wie kann ich diese RMA einsenden?
A: Gelegentlich veraltete Cookies/Browser-Cache können Probleme beim Laden der RMA verursachen, bitte versuchen Sie zuerst, die RMA in einem privaten Browserfenster oder einem anderen Browser zu laden. Wenn das Problem weiterhin besteht, senden Sie uns bitte eine E-Mail mit der Bitte um Hilfe.