Introdução
Este documento descreve o sistema de RMA Pró-ativo. Aproveitando a telemetria de produtos conectados, a Cisco é capaz de oferecer uma experiência quase sem esforço ao cliente quando os produtos apresentam determinadas falhas. Sem interação humana, uma Solicitação de Serviço (SR) e uma Autorização de Devolução de Material (RMA) serão autorizadas de forma proativa, para reduzir significativamente o tempo entre a falha e a substituição. Este documento abrange informações sobre este programa, quais ações os clientes devem tomar, dispositivos / problemas que são cobertos por este programa e configurações disponíveis (opt-out, configuração de contato).
Requisitos
- O dispositivo afetado deve ser conectado e reivindicado para a Intersight Cloud diretamente ou por meio de um dispositivo virtual conectado (dispositivo compatível desde julho de 2021). Consulte o guia Intersight Getting Started para obter um dispositivo conectado e reivindicado. Não há suporte para aplicativos virtuais privados. Leia a seção específica da Nutanix para obter as advertências e os requisitos para esses dispositivos.
- Para dispositivos virtuais conectados, a RMA proativa deve ser habilitada, consulte aqui para obter mais informações sobre como habilitar isso.
- O dispositivo afetado deve ser coberto por um contrato de suporte válido (Exemplo: Smart Net Total Care - SNTC), que permite a substituição de hardware.
- Nenhuma licença é necessária para o SaaS da Intersight (camada sem licença), o mínimo do Essentials é necessário no Connected Virtual Appliance (CVA).
Escopo
Todos os clientes e todos os dispositivos que atendem aos requisitos declarados estão no escopo. Este programa opera em uma base de não participação, embora para operar em dispositivos virtuais conectados o recurso RMA pró-ativo deve ser habilitado. Além dos tipos de falha mencionados neste documento, outros cenários/falhas de hardware estão em consideração para cobertura neste programa.
Erros de memória
Falhas de memória do UCS (falha DIMM inoperável F0185, código de falha IMM MemoryUnitUncorrectableError). Eles representam erros incorrigíveis, assim como DIMMs no mesmo canal, para DIMMs que apresentaram um erro incorrigível (UECC). Embora os DIMMs que estão no mesmo canal passem por uma falha F0185 anterior à 4.2(2a), eles não falharam de verdade e não serão substituídos. Consulte o bug da Cisco ID CSCvt29521 para obter mais informações sobre esse comportamento. Note: Todos os modos de gerenciamento (Autônomo, UMM - Modo Gerenciado UCSM, IMM - Modo Gerenciado Intersight) são suportados para este tipo de falha.
Caveats:
- Os servidores que apresentam mais de uma falha de DIMM degradado/inoperável não são cobertos - os clientes terão que abrir casos manualmente para esses problemas.
- Serão excluídas as instâncias do bug da Cisco ID CSCvo48003 ("Blade M4 - Patrol Scrubber logs DIMM address with 4k boundary") ou do bug da Cisco ID CSCvo48006 ("Rack M4 - Patrol Scrubber logs DIMM address with 4k boundary"). Os clientes podem abrir um caso TAC para eles e avaliar o impacto do bug em seu ambiente.
Falhas de unidade do UCS
Falhas de disco do UCS (códigos de falha do UCS F1732, F0181, F0996 e códigos de falha do IMM StoragePhysicalDiskFailed, StoragePhysicalDiskOffline, StoragePhysicalDiskPredictiveFailure, StoragePhysicalDiskSelfTestFail e StoragePhysicalDiskUnConfiguredBad) são cobertas por esse recurso. As unidades em um estado de falha preditiva ou falha aumentam essas falhas e são cobertas.
Caveats:
- Discos com falhas, mas em um estado aparente sem falha (exemplo: configuração externa, copyback, reconstrução, etc.) serão excluídos.
- Os discos que usam um controlador de armazenamento HBA com ou sem RAID, ou os discos no modo JBOD, raramente têm evidência de log suficiente nos arquivos de suporte técnico para determinar se um disco falhou e não será substituído se não for possível encontrar evidência. Um subconjunto de falhas de disco em HBA não-RAID cria uma falha apropriada e tem evidência de log suficiente para ser incluída. Consulte as seções Falha de unidade Hyperflex e Falhas de unidade Nutanix para saber as situações em que as unidades de passagem HBA serão suportadas.
Falhas de Unidade Hyperflex
Cache permanentemente com falha e discos persistentes no Hyperflex (às vezes chamados de: Lista negra / Falhou permanentemente / Desativado) são cobertos por este recurso.
Note: O cluster será autorrecuperado e estará em bom estado logo após a falha do disco. Nesses casos, um disco ainda deve ser substituído.
Caveats:
- Clusters com mais de uma falha de unidade não serão operados.
- As unidades que corresponderem a FN70234 serão excluídas.
- As unidades que corresponderem aos modelos afetados pelo bug da Cisco ID CSCvo58565 serão excluídas.
Falhas de ventilador C-Series
Falhas de ventilador em um servidor C-Series que esteja em modo autônomo, UMM (UCSM Managed Mode) ou IMM (Intersight Managed Mode) são suportadas. Códigos de falha: F0484, F0397, F0794 são abrangidos.
Caveats:
- Várias falhas de ventilador ao mesmo tempo provavelmente não são falhas de hardware de ventilador e não são suportadas no momento
- Falhas transitórias de ventilador não gerarão um caso de RMA pró-ativo
Falhas de ventilador de interconexão de estrutura
Falhas de ventilador em uma interconexão em malha que está no modo UMM (UCSM Managed Mode) são suportadas. Códigos de falha: F0484, F0397 são abrangidos.
Caveats:
- FIs gerenciados por IMM ainda não são suportados
- Várias falhas de ventilador ao mesmo tempo provavelmente não são falhas de hardware de ventilador e não são suportadas no momento
Falhas de unidade Nutanix
Há suporte para unidades com falha em clusters Nutanix em hardware da Cisco.
Caveats:
- O cluster Nutanix deve estar conectado à nuvem Nutanix
- O e-mail do Nutanix BreakFixContact deve ser configurado ou o hardware deve estar conectado à Intersight.
- O usuário do BreakFixContact ou da Intersight deve ter direito a abrir casos para o contrato que cobre o servidor em questão.
O que esperar
Quando ocorre um evento de falha coberto, são gerados um SR e um RMA. Pontos de interesse:
- Os e-mails serão de sherholm@cisco.com.
- O caso será criado com o e-mail configurado (consulte a seção de configuração avançada abaixo) ou com o último usuário autorizado que fez login na Intersight.
- Os outros usuários na conta da Intersight com direito ao contrato são copiados no e-mail. Se os usuários estiverem configurados explicitamente (por meio de marcas, consulte a seção Configuração avançada (opcional)), somente os usuários configurados receberão o e-mail.
- Qualquer usuário qualificado pode assumir a propriedade da RMA e preencher os detalhes necessários. Na ferramenta RMA, há uma opção de transferência de propriedade.
- A ferramenta Cisco RMA (Product Returns and Replacement - PRR) enviará lembretes para preencher o rascunho da RMA para o usuário com quem o caso foi aberto.
Após a criação da solicitação de serviço, os clientes receberão um e-mail descrevendo o problema e fornecendo etapas acionáveis. Este é um exemplo:
From: sherholm@cisco.com
To: bob@example.com
Subject: [Action Required] SR: 600000000 - Proactive Replacement of Memory Module [Connected via Intersight]
Hello Bob,
I am writing to let you know that Cisco has received a fault message from your Cisco UCS server connected by Cisco Intersight.
The fault indicates that a memory DIMM module has failed and needs replacing. I have automatically created a TAC Case for
you (SR 600000000) and have created the RMA to ship you the replacement DIMM. I just need you to click the RMA link and
verify your shipping address so the replacement part can be shipped out to you: https://ibpm.cisco.com/rma/home/?RMANumber=800000000
Note: If you have difficulty loading the link above, please contact LSC at one of the following manners:
https://www.cisco.com/c/en/us/buy/logistics-support-center.html
Here is some more information about the failed DIMM and the server it's installed in:
Domain Name: ucs-domain
Domain IP Address: 192.0.2.1
Server Serial Number: SERIAL
Server Name: HOSTNAME
Server Service Profile: org-root/SERVICEPROFILENAME
Server User Label: USER_LABEL
Fault Description: DIMM DIMM_H1 on server 1/1 operability: inoperable
Link to server in Intersight: https://intersight.com/an/compute/physical-summaries/moid/server/
Link to Fault in Intersight: https://intersight.com/an/cond/alarms/?Moid=moid
Hardware replacement guide available here:
<link to replacement guide for the specific server type>
For more information on this feature of Intersight see:
<link to this document>
Please let me know if you have further questions,
Sincerely,
Sherlock
Technical Consulting Engineer, Virtual
Cisco Customer Experience
Email: sherholm@cisco.com
Benefícios
- Redução significativa do esforço para receber uma peça de substituição.
- Criação automática de SR - tempo de reação mais rápido ao evento.
- Pré-autorização de RMA.
- Capacidade de preencher detalhes de RMA logo após o contato.
- Coleta automática de dados de diagnóstico direcionados.
- Exclusão de defeito de software - falhas de software que aparecem como falhas de hardware não gerarão RMAs desnecessárias.
Detalhes adicionais
Detalhes do Fluxo de Trabalho
Configuração avançada (opcional)
Duas opções de configuração avançadas são suportadas no momento. As opções de configuração são definidas por meio de tags no Intersight.
As marcas discutidas nesta seção podem ser configuradas em qualquer um dos objetos listados na Intersight:
- Conta (via GUI)
- Organização (via API)
- Dispositivo de destino/registrado (via API)
Para clientes com o Connected Virtual Appliance, as marcas podem ser configuradas no próprio dispositivo ou na Intersight Cloud.
Para obter mais informações sobre as marcas de configuração, consulte o documento Setting Tags in Intersight.
Configurar explicitamente um contato
Os clientes podem configurar explicitamente o(s) endereço(s) de e-mail que desejam associar ao SR e ao RMA. O nome/chave da tag é "AutoRMAEmail" e o valor é uma lista CSV de e-mails que você deseja notificar e qualificar o caso. A RMA proativa usará uma primeira base de correspondência e analisará e-mails da esquerda para a direita. Por exemplo, se você usar "user@example.com,user2@example.com" user@example.com será tentado primeiro, mas todos os e-mails serão copiados.
Note: aviso: Para que um caso seja aberto, pelo menos um e-mail na lista CSV deve correlacionar-se a uma conta CCO válida que esteja associada ao contrato no qual o número de série do dispositivo está coberto.
Em outras palavras, se nenhum dos endereços de AutoRMAEmail estiver no contrato que cobre o dispositivo, os endereços de AutoRMAEmail serão ignorados.
A RMA proativa se baseará no comportamento padrão de enviar e-mails a todos que tiverem uma conta da Intersight e estiverem no contrato que cobre o dispositivo.
Observe que a Intersight tem um limite de caracteres para marcas de 255 caracteres. Por causa disso, a RMA proativa suporta qualquer tag que comece com AutoRMAmail (por exemplo: AutoRMAEmail1, AutoRMAEmail2) e concatenará todos os valores juntos.
Se estiver usando a API para configurar marcas, a marca deverá ser semelhante a:
{"Key":"AutoRMAEmail","Value":"email1@example.com,email2@example.com"}
Consulte o documento Setting Tags in Intersight discutindo detalhes sobre marcas.
Retirada de RMAs proativas
Para recusar,
Se estiver usando a API, a marca deverá ser como mostrada.
{"Key":"AutoRMA","Value":"False"}
Para optar por voltar para RMAs proativas (se não houver participação), os usuários podem remover a marca totalmente ou alterá-la para:
{"Key":"AutoRMA","Value":"True"}
Observação: os usuários NÃO precisam aceitar por meio de marcas se não tiverem optado por não participar; eles são habilitados automaticamente, a menos que tenham optado por não participar.
FAQ
P: Que informações a Cisco coletará sobre essas falhas?
R: Detalhes da falha (tempo/dispositivo/etc.), informações de inventário (modelo/serial/firmware), dados de diagnóstico aplicáveis (por exemplo: Suporte técnico para CIMC/UCSM/HX).
P: Qual é o tempo de reação?
R: Normalmente, os casos são abertos e a RMA é criada dentro de uma hora após a ocorrência da falha. Isso inclui todo o tempo necessário para gerar e processar os dados de diagnóstico apropriados.
P: Quem pode enviar a RMA?
R: Qualquer usuário qualificado no contrato pelo qual o dispositivo é coberto pode enviar a RMA, não precisa ser o mesmo indivíduo que é o contato na solicitação de serviço do TAC. A RMA é inicialmente associada a uma conta CCO específica. Os usuários que desejarem preencher a RMA podem clicar no botão "Ações" no canto superior direito da RMA e selecionar "Transferir tarefa". Na tela subsequente, deixe seu CCO preenchido na caixa de entrada e clique em "Enviar".
P: Ocorreu um erro ao carregar a RMA. Como posso enviar esta RMA?
R: Ocasionalmente, cookies obsoletos/cache do navegador podem causar problemas ao carregar a RMA. Tente primeiro carregar a RMA em uma janela de navegação privada ou em um navegador diferente. Se o problema persistir, envie um e-mail solicitando ajuda.