Este documento destaca os vários métodos e recursos de proteção contra sobrecarga da Mobility Management Entity (MME) disponíveis no Cisco Aggregation Services Router (ASR) 5000 Series. No ASR 5000 Series, a Cisco oferece ao cliente vários meios de alcançar o controle e este artigo explica os recursos e os comandos CLI relacionados.
O Attach Rate Throttling protege elementos de rede vizinhos, como Home Subscriber Server (HSS), Policy and Charging Rules Function (PCRF) e Online Charging Server (OCS), e recursos internos de MME, como imsimgr e sessmgr. O Attach Rate Throttling processa as novas chamadas que chegam ao imsimgr, como em Attaches e Inter-MME/Serving GPRS Support Node (SGSN) Tracking Area Update (TAUs).
Esta imagem mostra o fluxo de mensagens para chamadas e filas de limitação.
Para proteger o MME (imsimgr e sessmgr em diante), a taxa de limitação, o tempo de espera na fila e o tempo de tamanho da fila devem ser definidos. A taxa de limitação depende do modelo de chamada MME, pois a capacidade do MME depende do modelo de chamada.
Para o MME, o cálculo da taxa de limitação é relativamente simples, considere os eventos de chamada padrão por segundo (CEPS) na rede mais a tolerância. Além disso, talvez você precise considerar a capacidade do banco de dados do HSS também se a proteção do HSS for necessária.
Exemplo
Em horas de trabalho, o MME trata de até 170 a 200 chamadas por segundo (Attaches+ Inter TAU). Em caso de falha de um local, até 350 a 370 chamadas por segundo podem chegar a um MME. Sob essa taxa de chamada, a utilização de MME sobe perto de 80% e 400 chamadas por segundo é um nível ideal para limitar a taxa de limitação a fim de evitar carga de sinalização excessiva dentro da caixa MME.
O tempo de espera na fila por padrão é de 5 segundos. É ideal para o CLIENTE. O tamanho da fila por padrão é 2500. É ideal para o CLIENTE.
O comando de configuração é o seguinte.
asr5k(config)#network-overload-protection mme-new-connections-per-second
new_connections action attach { drop | reject-with-emm-cause
{ congestion | network-failure | no-suitable-cell-in-tracking-area}
tau { drop | reject-with-emm-cause { congestion | network-failure
| no-suitable-cells-in-tracking-area | no-sec-ctxt-in-nw} fwd-reloc
{ drop | reject} }{wait-time <wait-time>} {queue-size <queue-size>}
new_connections
Define o número de novas conexões MME a serem aceitas por segundo. Deve ser um inteiro de 50 a 5000. O padrão é 500.
ação
Define a ação a ser executada quando a fila de andamento ficar cheia. Sempre que novas conexões são recebidas no MME, elas são enfileiradas na fila de pacing e o imsimgr processa mensagens da fila na taxa configurada. Quando a fila transborda (devido à alta taxa de entrada), com base na "ação" configurada, os pacotes são descartados ou rejeitados.
queue-size
Define o tamanho máximo da fila de pacing usada para armazenar em buffer os pacotes. Deve ser um inteiro de 250 a 25000. O padrão é 2500.
Configuração de exemplo
network-overload-protection mme-new-connections-per-second 400 action attach
reject-with-emm-cause no-suitable-cell-in-tracking-area tau
reject-with-emm-cause no-suitable-cell-in-tracking-area fwd-reloc drop
Agora, a taxa de chamada por segundo é definida como 400 e a ação é inteligente rejeitada com o motivo nº 15 de fazer com que o equipamento do usuário (UE) se reconecte a diferentes RATs (Radio Access Technologies, Tecnologias de Acesso por Rádio). O tempo de espera é definido como o padrão (5 segundos) e o tamanho da fila é 2500.
O Paging Throttling protege os recursos internos do MME (mmemgr) como recursos de eNodeB/rádio (se necessário). Esse limite de taxa deve ser aplicável a todos os eNodeB associados a MME para um determinado chassi ASR 5000. As solicitações de Paginação de S1 para um eNodeB devem ser limitadas por taxa a esse valor limite. As solicitações de Paginação S1 para um eNodeB que exceda esse limite serão descartadas.
Para MME, o cálculo da taxa de limitação é relativamente simples, considere a taxa de paginação de saída padrão na rede mais a tolerância. (Isso se baseia apenas na decisão da equipe de projeto.)
Exemplo
Em horas de trabalho, cada MME lida com até 35.000 mensagens de paginação por segundo. Em caso de falha de um site, até 70.000 páginas por segundo podem ir de um MME. Sob essa taxa de paginação, a utilização do MME (mmemgr) aumenta perto de 80% e 70000 a 80000 páginas por segundo seria um nível ideal para limitar a taxa de limitação a fim de evitar sinalização S1 excessiva sobre o mmemgr.
No entanto, a taxa é limitada por eNodeB médio. A taxa média por eNodeB (no caso do 6500 eNodeB) é de 10 páginas por segundo. No entanto, as Áreas de Rastreamento (TAs) não são iguais no número de assinantes e vários TA/membro eNodeB são carregados com paginação diferente. No caso de duas vezes a diferença no tamanho da TA em relação ao número médio de assinantes por TA, a taxa por eNodeB seria de 20. No caso de uma diferença de 20 vezes o tamanho do TA em relação ao número médio de assinantes por TA, a taxa por eNodeB seria de 200. Isso significa que o recurso se torna mais eficiente nos casos em que o TA (em número de assinantes) é uniformemente carregado.
Outra ação que deve ser tomada em paralelo é ativar a Paginação Inteligente. Consulte a seção "TAI mgmt db and LTE Paging" no Guia de administração do ASR 5000 MME.
O comando de configuração é o seguinte:
asr5000(config)# network-overload-protection mme-tx-msg-rate-control enb s1-paging
network-overload-protection mme-tx-msg-rate-control enb s1-paging 200
O controle de DDN (Downlink Data Notification, notificação de dados de downlink) é um recurso para controlar a taxa de solicitações de DDN para MME do lado Serving GateWay (SGW). Ele protege os recursos do MME, como mmemgr e sessmgr contra surtos de DDN (ou seja, solicitação de paging de entrada).
Há duas partes neste recurso, uma para MMEs compatíveis com Rel-10 e outra para MMEs não compatíveis com Rel-10:
Quando esse recurso é ativado no SGW, ele envia uma marca d'água ARP no Req DDN para o MME. Em resposta, o MME envia a unidade de atraso de limitação, o valor de atraso de limitação e o fator de limitação. A combinação de Delay Value e Delay Unit calcula o Throttling Time. Ao receber esses valores, o SGW descarta a solicitação de DDN para ARP específico até que o temporizador de limitação expire.
Para MMEs não compatíveis com Rel-10 que usam a configuração local, o SGW agiliza o Req de DDN com uma marca d'água ARP específica.
As versões 16 e 17 do Cisco ASR5x00 MME não suportam o Throttling de DDN automático, portanto ele funciona como não compatível com Rel 10 em termos de limitação de DDN.
Especificações técnicas (TS) 23.401, referência para MME:
Limitação de solicitações DDN
Sob circunstâncias incomuns (como quando a carga de MME excede um limite configurado pelo operador), o MME pode restringir a carga de sinalização que seus SGWs geram nela, se configurado para fazê-lo.
O MME pode rejeitar solicitações de DDN para tráfego de baixa prioridade para UEs em modo ocioso ou para descarregar ainda mais o MME. O MME pode solicitar aos SGWs que reduzam seletivamente o número de solicitações de DDN que envia para tráfego de baixa prioridade de downlink recebido para UEs em modo ocioso de acordo com um fator de limitação e para um atraso de limitação especificado na mensagem DDN Ack.
O SGW determina se um portador é para tráfego de baixa prioridade ou não com base no nível de prioridade ARP do portador e na política do operador (ou seja, a configuração do operador no SGW dos níveis de prioridade ARP deve ser considerada como tráfego prioritário ou não prioritário). O MME determina se uma solicitação de DDN é para tráfego de baixa prioridade ou não com base no nível de prioridade ARP que foi recebido do SGW e da política do operador.
Se a Redução de Sinalização de Estado Inativo (ISR - Idle-State Signaling Reduction) não estiver ativa para a UE, durante o retardo de limitação, o SGW descarta os pacotes de downlink recebidos em todos os seus portadores de baixa prioridade para UEs conhecidos como não estando conectados ao plano do usuário (ou seja, os dados de contexto SGW indicam que não há um identificador de túnel de plano do usuário de downlink (TEID)) atendido por esse MME proporcionalmente ao fator de limitação, e envia um DDDNS Mensagem DN para o MME somente para portadores não-limitados.
Se o ISR estiver ativo para a UE durante o retardo de limitação, o SGW não enviará DDN ao MME e somente enviará o DDN ao SGSN. Se o MME e o SGSN solicitam redução de carga, o SGW descarta os pacotes de downlink recebidos em todos os seus portadores de baixa prioridade para UEs conhecidos como não estando conectados ao plano do usuário (ou seja, os dados de contexto SGW indicam que não há TEID no plano do usuário de downlink) em proporção aos fatores de limitação.
O SGW retoma as operações normais ao término do retardo de limitação. O último valor recebido do fator de limitação e do retardo de limitação substitui qualquer valor anterior recebido desse MME. A recepção de um retardo de limitação reinicia o temporizador SGW associado a esse MME.
Para SGW versus MME, o cálculo da taxa de limitação é relativamente simples. Tome a taxa máxima permitida de entrada de paging, que é de 1100 mensagens por segundo por caixa de MME.
Os comandos de configuração são os seguintes:
#configure
#context saegw-gtp
#sgw-service sgw-svc
#ddn throttle arp-watermark <arp_value> rate-limit <limit> time-factor <seconds>
throttle-factor <percent> increment-factor <percent> poll-interval <second>
throttle-time-sec <seconds> throttle-time-min <minutes> throttle-time-hour <hour>
stab-time-sec <seconds> stab-time-min <minutes> stab-time-hour <hour>
throttle arp-watermark arp_value
Se a marca d'água ARP estiver configurada e se um MME/SGSN enviar o fator de limitação e o atraso em uma mensagem DDN ACK, todos os DDNs que têm um valor ARP maior que o valor configurado serão acelerados pelo fator de aceleração para o atraso especificado.
arp_value é um inteiro de 1 a 15.
limite de taxa
Configura o limite de taxa (use este e os tokens subsequentes para limitar a taxa somente se o MME for um MME não-lançamento 10).
limit é um inteiro de 1 a 9999999999.
time-fator seconds
Configura a duração durante a qual o SGW toma decisões de limitação.
seconds é um inteiro de 1 a 300.
percentual do fator de aceleração
Configura o fator de limitação de DDN. Insira a porcentagem do DDN a ser descartado na detecção de um surto de DDN.
porcentagem é um inteiro de 1 a 100.
percentual do fator de incremento
Configura o fator de incremento de limitação de DDN. Insira a porcentagem pela qual o controle de limitação de DDN deve ser aumentado.
porcentagem é um inteiro de 1 a 100.
poll-interval seconds
Configura o intervalo de sondagem no controle de DDN.
seconds é um inteiro de 2 a 9999999999.
throttle-time-sec seconds
Configura o tempo de limitação de DDN em segundos. Insira o período em segundos sobre o qual o DDN é limitado no SGW.
seconds é um inteiro de 0 a 59.
tempo-limite minutos
Configura o tempo de limitação de DDN em minutos. Insira o período de tempo em minutos sobre o qual o DDN é limitado no SGW.
minutes é um inteiro de 0 a 59.
hora de hora de aceleração
Configura o tempo de limitação de DDN em horas. Insira o período em horas sobre o qual o DDN é limitado no SGW.
hour é um inteiro de 0 a 310.
stab-time-sec seconds
Configura o tempo de estabilização de limitação de DDN em segundos. Insira um período em segundos durante o qual, se o sistema estiver estabilizado, a limitação será desativada.
seconds é um inteiro de 0 a 59.
tempo de parada - minutos
Configura o tempo de estabilização de limitação de DDN em minutos. Insira um período em minutos durante o qual, se o sistema estiver estabilizado, a limitação será desativada.
minutes é um inteiro de 0 a 59.
hora da fachada
Configura o tempo de estabilização de limitação de DDN em horas. Insira um período de tempo em horas sobre o qual, se o sistema estiver estabilizado, a limitação será desativada.
hour é um inteiro de 0 a 310.
Configuração de exemplo
ddn throttle arp-watermark 1 rate-limit RATE time-factor 120 throttle-factor 50
increment-factor 10 poll-interval 30 throttle-time-sec 0 throttle-time-min 1
throttle-time-hour 0 stab-time-sec 0 stab-time-min 2 stab-time-hour 0
Este recurso protege os recursos do MME (sessmgr, mmemgr) e os recursos 4G contra surtos de falhas de caminho do Enhanced GPRS Tunneling Protocol (EGTP) em caso de falhas de transmissão no Backbone IP e no BackHaul IP, bem como o recurso side Network Element failures/restarts.The permite, por sessmgr, limitação de eventos de falha de caminho EGTP detectados e define mais granularidade para o gerenciamento de assinantes do Paging do S1 ling. Dependendo da divisão entre assinantes ociosos e conectados, os limites serão estabelecidos. Ela é muito específica da rede e exige ajuste em relação ao status eUTRAN e UE.
Exemplo
Os assinantes estão divididos em 80:20 IDLE para CONECTADOS. Na pior das hipóteses, o EGTP PF para assinantes IDLE causa um surto de paging que pode causar a sobrecarga de mmemgr, o gargalo mais estreito na cadeia. Esse surto de Fator de Paginação EGTP (PF) (para assinantes do IDLE), em primeiro lugar, causa um surto de paginação e esse surto atinge o gargalo do mmemgr, portanto, primeiro você precisa proteger o mmemgr. Assim, o EGTP PF para IDLE pode ser considerado como um surto inesperado de paging de entrada, que pode ter no máximo 1100 páginas/segundo.
Essa configuração se aplica a um serviço EGTP que tem um tipo de interface "interface-me".
O comando de configuração é o seguinte:
asr5000(config)# network-overload-protection mme-tx-msg-rate-control egtp-pathfail ecm-idle
< rate in sessions per second > ecm-connected < rate in sessions per second >
network-overload-protection mme-tx-msg-rate-control egtp-pathfail ecm-idle
1000 ecm-connected 2000
Usando a funcionalidade Enhanced Congestion Control, o MME pode sinalizar para o eNodeBs ao qual está conectado para redirecionar o tráfego para outros MMEs no pool de MME. Isso é realizado com o Procedimento de Sobrecarga da Interface S1 (TS 36.300 e TS 36.413).
Quando o controle de sobrecarga é configurado e um limite de congestionamento é alcançado, o MME pode ser configurado para enviar uma mensagem de início de sobrecarga da interface S1AP para uma porcentagem do eNodeBs ao qual o MME está conectado. Para refletir a quantidade de carga que o MME deseja reduzir, essa porcentagem é configurável. No Elemento de Informações de Resposta (IE) de Sobrecarga enviado ao eNodeBs, o MME pode solicitar ao eNodeB que rejeite ou permita tipos específicos de sessões, que incluem:
O recurso de controle de congestionamento permite definir políticas e limites e especificar como o sistema reage quando confrontado com uma condição de carga pesada. O controle de congestionamento monitora o sistema em busca de condições que possam degradar o desempenho quando o sistema está com carga pesada. Normalmente, essas condições são temporárias (por exemplo, alta utilização de CPU ou memória) e são rapidamente resolvidas. No entanto, um número grande ou contínuo dessas condições em um intervalo de tempo específico pode ter um impacto na capacidade do sistema de atender sessões de assinantes. O controle de congestionamento ajuda a identificar essas condições e invoca políticas para lidar com a situação.
Quando você configura limites e tolerâncias para níveis críticos, principais e secundários de congestionamento, os níveis de limite e as tolerâncias nunca devem se sobrepor. Considere estas configurações de exemplo, nas quais os níveis de limite não se sobrepõem:
Esse limite é calculado a partir da CPU demux do sistema. O limite é calculado com base na média de cinco minutos de uso da CPU.
O maior valor de uso da CPU de dois núcleos da CPU demux é considerado. Por exemplo, se o núcleo da CPU 0 tiver um uso de CPU de 5 minutos de 40% e o núcleo da CPU 1 tiver um uso de CPU de 80% em cinco minutos, o núcleo da CPU 1 será considerado para o cálculo do limiar.
Esse limite é calculado usando a média de uso da CPU de cinco minutos de todas as CPUs (exceto CPU em standby e CPU SMC).
O maior valor de uso da CPU de dois núcleos da CPU de todas as CPUs é considerado.
Esse limite é calculado com a média de uso de memória de cinco minutos de todas as CPUs (exceto CPU em standby e CPU SMC).
Configurar um perfil de ação de congestionamento
Os perfis de ação de congestionamento definem um conjunto de ações que podem ser executadas depois que o limite correspondente é ultrapassado.
Associar um perfil de ação de congestionamento a políticas de controle de congestionamento
Cada política de controle de congestionamento (crítica, principal, secundária) deve ser associada a um perfil de controle de congestionamento.
Configurar controle de sobrecarga
Quando uma condição de sobrecarga é detectada em um MME, o sistema pode ser configurado para relatar a condição a uma porcentagem especificada de eNodeBs e executar a ação configurada em sessões de entrada.
Essas ações de sobrecarga também estão disponíveis (além de sessões novas de rejeição):
Exemplo de explicação de configuração
Isso permite a funcionalidade de controle de congestionamento:
congestion-control
This monitors the overall CPU Utilization including the sessmgr and demux mgrs
congestion-control threshold system-cpu-utilization critical 90
congestion-control threshold system-cpu-utilization major 85
congestion-control threshold system-cpu-utilization minor 80
Memory utilization thresholds:
congestion-control threshold system-memory-utilization critical 85
congestion-control threshold system-memory-utilization major 75
congestion-control threshold system-memory-utilization minor 70
CPU utilization on DEMUX card:
congestion-control threshold service-control-cpu-utilization critical 85
congestion-control threshold service-control-cpu-utilization major 75
congestion-control threshold service-control-cpu-utilization minor 70
Defining tolerance margins:
congestion-control threshold tolerance critical 5
congestion-control threshold tolerance major 5
congestion-control threshold tolerance minor 5
Definir perfis de ação de congestionamento (crítico, principal e secundário)
lte-policy
congestion-action-profile criticalCogestionProfile
reject s1-setups time-to-wait 60
drop handovers
drop combined-attaches
drop service-request
drop addn-brr-requests
drop addn-pdn-connects
exclude-voice-events
exclude-emergency-events
report-overload permit-emergency-sessions-and-mobile-terminated-service enodeb-percentage 50
congestion-action-profile majorCogestionProfile
report-overload permit-emergency-sessions-and-mobile-terminated-service enodeb-percentage 50
congestion-action-profile minorCogestionProfile
report-overload permit-emergency-sessions-and-mobile-terminated-service enodeb-percentage 30
end
Aplicar políticas de congestionamento
configure
congestion-control policy critical mme-service action-profile criticalCogestionProfile
congestion-control policy major mme-service action-profile majorCogestionProfile
congestion-control policy minor mme-service action-profile minorCogestionProfile
end
.
Revisão | Data de publicação | Comentários |
---|---|---|
1.0 |
12-Jun-2015 |
Versão inicial |