Einleitung
In diesem Dokument wird die Verwendung von TITAN, seine Konfiguration und Fehlerbehebung in CURWB-Bereitstellungen beschrieben.
TITAN-Grundlagen
TITAN ist eine wichtige Funktion, die hohe Verfügbarkeit und Hardwareredundanz in CURWB-Bereitstellungen bietet. Es kann über verschiedene Funktionen des festen Teils des Fluiditätsnetzwerks konfiguriert werden. Die häufigsten Anwendungen sind die Aktivierung von TITAN auf den Global Gateways des Kernnetzwerks, den Local Mesh End Gateways und den Funkgeräten des Onboard Vehicle (Fahrzeuganbindung). Er funktioniert in Layer-2- und Layer-3-Netzwerken.
Wenn TITAN aktiviert ist, ermöglicht es ein schnelles Failover von einem primären Gerät auf ein sekundäres Gerät in weniger als 500 Millisekunden. Das sekundäre Gerät setzt die CURWB-MPLS-Kommunikation sofort fort.
Das hier gezeigte Beispiel zeigt den TITAN-Failover unter allen drei Bedingungen.
- Global Gateways des Kernnetzwerks,
- Lokale Mesh-End-Gateways und
- Fahrzeugseitige Funkgeräte
Wie wirkt TITAN?
Um das Konzept von Titan vollständig zu verstehen, ist es wichtig, sich mit Autotap vertraut zu machen. Es handelt sich um einen Mechanismus zum Verhindern von Netzwerkschleifen, der es CUWRB-Geräten ermöglicht, Verbindungen zu erkennen und nur eine dedizierte Eingangs-/Ausgangs-Route zum und vom Mesh-End oder Netzwerkkern zuzulassen.
Funkmodule mit derselben Passphrase, die mit demselben Netzwerk-Switch in derselben Broadcast-Domäne verbunden sind, fungieren als eine Einheit mit mehreren Antennen.
Das CURWB Mesh Protocol erkennt kabelgebundene Verbindungen zwischen Funkmodulen, wobei Routen automatisch erstellt werden. Das Ergebnis ist ein einzelner Access Point mit mehreren Wireless-Schnittstellen.
Die AutoTap-Funktion verhindert in solchen Konfigurationen Netzwerkschleifen. Nur die als Primary (niedrigste numerische Mesh-ID) ausgewählte Funkeinheit in einer physisch verbundenen Gruppe veröffentlicht MAC-Adressinformationen. Datenverkehr wird nur von der als primäre Funkeinheit der verbundenen Gruppe ausgewählten Funkeinheit empfangen.
Feste Infrastruktur
Der Benutzer stellt zwei Mesh-Endeinheiten mit derselben Konfiguration ein und verbindet sie mit demselben Switch. Diese Geräte tauschen Informationen aus, um das primäre Gerät auszuwählen, und das andere Gerät befindet sich im Standby-Modus. Bei einem Ausfall übernimmt die Standby-Einheit in 500 ms und verbindet alle Mesh Points wieder mit dem System. Bei Festnetzen kann TITAN nur auf Mesh-End-Einheiten aktiviert werden, und die Punkte stellen automatisch eine Verbindung mit dem End her, das übernommen hat.
Fahrzeuge für Mobilität
Der Prozess ist der gleiche wie in einem Festnetz. Die Geräte müssen sich auf demselben Switch mit derselben Konfiguration befinden. Der Algorithmus legt die eine Einheit als primäre Einheit und die andere als sekundäre Einheit fest. Bei Ausfall der Primäreinheit übernimmt die Sekundäreinheit in 500 ms und stellt eine Verbindung zur geschlossenen streckenseitigen Einheit her. Der einzige Unterschied zur Mobilität besteht darin, dass TITAN auf Mesh Point-Einheiten aktiviert werden kann. In diesem Fall ersetzt die Fluiditätsfunktion den Betriebsmodus des Funkgeräts.
Trackside-Funkdienst
Wenn das Funkgerät nicht mit dem Backbone-Netzwerk kommunizieren kann, zwingt das System das Fahrzeug bzw. die Fahrzeuge zur Verbindung mit der nächstgelegenen Rennstrecke, um eine sofortige Reaktion auf den Ausfall zu ermöglichen. Dieser Prozess ist mit Festnetzen identisch, bietet jedoch die Möglichkeit, mehr als eine aktive Standby-Strecke zu nutzen. Im streckenseitigen System ist die Sicherung kein Funk im Standby-Modus, sondern ein voll betriebsfähiger und aktiver Modus, der den Ausfall abdecken kann.
Gateway mit Verbindung zum Unternehmensnetzwerk
Genau wie Mesh Ends in einem Festnetz arbeiten die Gateways (FM1000 und FM10000) zusammen, um einen Primary zu wählen, und das Backup übernimmt bei einem Ausfall.
Primäre Wahl
Alle CURWB-Einheiten, die mit derselben Wired-Broadcast-Domäne verbunden und mit derselben Passphrase konfiguriert sind, führen alle paar Sekunden eine verteilte primäre Auswahl durch. Die primäre Einheit bildet einen Edge-Point des CURWB-MPLS-Netzwerks, d. h. ein Gerät, über das der Benutzerdatenverkehr in das Mesh eintreten oder es verlassen kann. Sekundäreinheiten fungieren als MPLS-Relaispunkte. Für jeden Nachbarn berechnet der Algorithmus einen Rangfolgewert, der auf der Rolle der Einheit (Mesh-End oder Mesh-Point) und ihrer Mesh-ID basiert. Mesh-Ends wird eine höhere Priorität als Mesh-Points zugewiesen, und bei der gleichen Priorität wird die Einheit mit der niedrigsten Mesh-ID bevorzugt. Der Auswahlmechanismus basiert auf einem dedizierten Signalisierungsprotokoll, das ständig im Netzwerk ausgeführt wird und gewährleistet, dass alle Einheiten denselben primären Parameter wählen.
Mesh-End-Failover
Im normalen Betrieb kommunizieren das primäre und das sekundäre Mesh kontinuierlich miteinander über ihren Status und tauschen Informationen zur Netzwerkerreichbarkeit aus. Insbesondere sendet das primäre System regelmäßig Aktualisierungen bezüglich der internen Weiterleitungstabelle und der Multicast-Routen an das sekundäre System.
Konfiguration
In der grundlegenden TITAN-Konfiguration sind für eine Bereitstellung zwei Gateways (Mesh End) erforderlich, ein primäres und ein weiteres sekundäres.
Sowohl die primäre als auch die sekundäre Hardware müssen diese TITAN-Konfigurationen aufweisen.
Konfigurieren von MPLS FastFail-Status aktiviert
Konfigurieren des MPLS-Fastfail-Timeouts 150
config mpls Unicast-Flood aktiviert
config mpls arp-unicast disabled
Konfiguration von spanning-tree link-guard 40
Konfiguration arp gratuitous aktiviert
Gratis-ARP-Verzögerung konfigurieren 150
Wenn in Layer-3-Konfigurationen HA für jedes Mesh-Ende erforderlich ist, sind zwei Mesh-Enden erforderlich, an denen die vorherige TITAN-Konfiguration ausgeführt werden muss.
Bei der Konfiguration von TITAN auf dem Autoradio muss das Fahrzeug zunächst über 2 Funkgeräte verfügen. Bei Ausfall der Primärverbindung übernimmt die Sekundärverbindung die Kommunikation. In diesem Szenario müssen die Fahrzeugfunkgeräte und das Mesh-Ende des Fluidity-Netzwerks die TITAN-Konfiguration aufweisen.
Testszenario
Unsere aktuelle Netzwerktopologie umfasst sieben Funkmodule. In dieser Konfiguration sind die Wireless-Schnittstellen der Mesh End-Funkmodule deaktiviert. Ihre Rolle beschränkt sich auf die Funktion als Gateways und nicht auf die Funktion als Teil des Trackside-Funksystems. Dem primären Mesh-Endgerät wird die IP-Adresse 10.122.136.50 und dem sekundären Gerät die IP-Adresse 10.122.136.47 zugewiesen.
Wir verfügen über 3 streckenseitige Funkeinheiten (10.122.136.9, 10.122.136.16 und 10.122.136.15). Das streckenseitige Funkmodul mit der IP-Adresse 10.122.136.9 ist fest in die Infrastruktur des Kernnetzwerks eingebunden. Dieses schwenkbare Funkgerät erweitert außerdem eine Backhaul-Verbindung zu einem Paar Trailerradios mit IP 10.122.136.15 und 10.122.136.16. Diese Backhaul-Verbindungen für feste Infrastrukturen werden im 5240-MHz-Frequenzband betrieben. Insgesamt versorgen die drei Funkeinheiten das mobile Fahrzeug mit einer Frequenz von 5180 MHz mit der IP-Adresse (10.122.136.13) drahtlos.
Das mobile Fahrzeug ist mit zwei Funkgeräten mit der IP-Adresse 10.122.136.13 als primärem und 10.122.136.14 als sekundärem Gerät ausgestattet. Beide Funkmodule sind über einen einzigen Switch miteinander verbunden. Das Sekundärradio ist hier nicht dargestellt.
Mesh-End-Failover
Schritt 1: Sowohl das primäre als auch das sekundäre Mesh-Ende sind mit dem Netzwerk verbunden und aktiv. Wir können sehen, dass das Radio mit der unteren Mesh-ID als Mesh-Ende fungiert.
Schritt 2: Wenn der primäre Übergang erfolgt, übernimmt das sekundäre Mesh End und fungiert als Mesh End für das gesamte Netzwerk. Beachten Sie, dass das ausgefallene primäre Mesh-Ende jetzt in der Liste der Infrastruktur-Funkmodule fehlt.
Schritt 3: Das ausgefallene primäre Funkmodul ist jetzt wieder betriebsbereit. Es wird jedoch auf die Freischaltungsverzögerung gewartet, bis die Netzwerktopologie bekannt ist.
Schritt 4: Sobald der Preemption Timer erreicht ist, übernimmt die Mesh-ID 5.246.226.200 die Rolle des Primär- und Funkgeräts mit der Mesh-ID 5.246.227.8.
Failover-Prüfung am Fahrzeug-Funkmodul
In diesem Labornetzwerk haben wir ein Fließfähigkeitsnetzwerk, bei dem ein Fahrzeug mit der Strecke verbunden ist. Das Fahrzeug verfügt über zwei Funkgeräte mit der IP 10.122.136.13 - Mesh-ID 5.66.194.36 (P) und 10.122.136.14 - Mesh-ID 5.246.2.120 (S).
Schritt 1: Sowohl das primäre als auch das sekundäre Funkgerät sind online. Wir können sehen, dass das Funkmodul mit einer unteren Mesh-ID als primäres Funkmodul und das andere als sekundäres Funkmodul fungiert. Basierend auf der Wireless-Qualität können sowohl die primäre als auch die sekundäre Funkeinheit mit der streckenseitigen Funkeinheit kommunizieren. Die gesamte nachgelagerte Kommunikation mit dem Bordnetz erfolgt jedoch immer über das primäre Funkmodul. Bei Ausfall innerhalb von 500ms wird mit TITAN sekundäres Fahrzeug-Funkgerät zum primären Funkgerät.
In diesem Screenshot ist der MPLS-Tunnel vom Mesh-Ende bis zu den Funkgeräten des Fahrzeugs zu sehen.
Schritt 2: Wenn wir die primäre Funkeinheit herunterfahren10.122.136.13, erfolgt ein Failover zur sekundären Funkeinheit, und jetzt wird 10.122.136.14 zur primären Funkeinheit.
Schritt 3: Ausgefallenes primäres Bordfunkgerät des Fahrzeugs wird wieder eingeschaltet und betriebsbereit. Obwohl diese Funkeinheit eine Verbindung mit dem Netzwerk herstellt, wartet sie auf die Freischaltungsverzögerung und nimmt nicht aktiv am Fluiditätsnetzwerk teil.
Wie in diesem Screenshot zu sehen, 5.66.194.36 wieder online, aber immer noch, es ist als sekundäre während der Freischaltung Verzögerung und 5.246.2.120 ist immer noch die Verwaltung der Kommunikation. Der MPLS-Tunnel zeigt außerdem, dass 5.246.2.120 mit dem streckenseitigen Funkmodul kommuniziert.
Fehlerbehebung TITAN
- Während der TITAN-Konfiguration müssen alle Konfigurationen für alle erforderlichen Funkmodule identisch sein.
- Je nach Umfang der Bereitstellung muss die Freischaltungsverzögerung möglicherweise erhöht werden. Auf diese Weise soll sichergestellt werden, dass ausgefallene Einheiten nicht zu früh ihre Rolle übernehmen, bevor sie sich mit der Topologie vertraut machen.
- Die Konfiguration des schnellen Fail-Timeouts zu klein kann zu einem instabilen Netzwerk führen. In den meisten Bereitstellungen könnte ein Wert von 150 ms verwendet werden.