Introduction
Este documento descreve a solução para o problema que ocorre quando os módulos de alimentação DC ASR9K V1 desaparecem do admin show platform. As fontes de alimentação de corrente contínua (CC) da versão 1 (V1) da Linhagem podem não aparecer no inventário após a perda de ambas as fontes de alimentação.
Problema
Quando você testa as fontes de alimentação CC e remove a alimentação das fontes de alimentação CC, você verifica show platform e não vê as fontes de alimentação listadas.
Estas são as etapas executadas no momento do teste:
1. A alimentação CC está conectada e ligada à(s) bandeja(s) de alimentação superior(es) e à(s) bandeja(s) de alimentação inferior(es).
2. Simule uma falha de energia total e desligue todas as entradas de CC para as bandejas de alimentação/módulo.
3. Restaure a entrada de CC somente para a bandeja/módulos superiores.
4. Aguarde até que o dispositivo seja inicializado (ainda desligue a bandeja/os módulos inferiores).
5. Restaure a entrada de CC para a bandeja ou os módulos inferiores.
Após a restauração das entradas de alimentação DC na bandeja inferior, você verá os módulos de alimentação em admin show inventory power-supply e admin show platform. No entanto, não é esse o caso.
Explicação:
As fontes de alimentação de linhagem gerarão erros de Inter-Integrated Circuit (I2C) se nenhuma entrada de alimentação CC estiver conectada. Isso significa que você pode detectar a presença deles (isso é feito através de uma conexão separada, não I2C), na inicialização você não detecta a presença deles. Um módulo de alimentação presente não é visto em admin show platform para a bandeja inferior não pode se comunicar com eles para descobrir seu estado.
O código do gerenciador de energia irá marcá-los como falha devido às altas contagens de erros que as fontes geram. O método de recuperação é um OIR do suprimento.
Há uma boa explicação na seção de descrição de CSCun4616: manipulação de falhas do módulo de alimentação I2C (principalmente V1).
Ele é replicado aqui:
Um módulo V1 sem alimentação precisa de duas voltagens para detectar seu próprio endereço. Essas voltagens são de 5V e 8V. O 5V é compartilhado entre ambas as bandejas do 9010, mas o 8V não. Isso significa que, se um módulo estiver conectado a um slot não alimentado de uma bandeja que ainda não tenha um módulo alimentado, esse módulo não detectará o endereço correto.
Para lidar com esse problema, o código do driver dos módulos de alimentação precisa ser alterado para que não tente continuamente o acesso I2C para módulos com falha. Isso pode ocorrer devido a alertas I2C repetidos (travados) para módulos que não podem ser acessados por I2C. Essas repetidas tentativas de I2C causam atraso na inicialização do driver dos módulos de alimentação, o que pode impedir que as LCs sejam autorizadas a inicializar pelo gerenciador de prateleiras se não receberem a alocação de energia do chassi a tempo do driver dos módulos de alimentação.
É exatamente isso que acontece neste caso. Nenhuma fonte de alimentação na prateleira inferior tem nenhuma entrada de CC, portanto não há fonte de 8 V para a bandeja e, portanto, todos os módulos na bandeja inferior começam a gerar erros de I2C. O gerenciador de energia marca todos esses módulos como com falha e não tenta recuperá-los até que sejam substituídos (isto é, OIR).
Solução
O sistema pode ser recuperado quando você reinicia dois processos nesta ordem:
process restart pwrmon
process restart shelfmgr