概要
このドキュメントの目的は、Cisco Unified Computing System(UCS)Cシリーズ製品の統合、トラブルシューティング、およびベストプラクティスを説明することです。
UCS Cシリーズ統合基本接続の概要
- Unified Computing System Manager(UCSM)の統合は、UCSMのバージョン1.4で導入されました。小規模な導入では、管理用の別のインフラストラクチャを使用できます。
- バージョン2.0(2)以降、統合サーバのスケーラブルなメインストリームのサポートが開始されます。
- 統合と接続は、UCSMバージョン2.1および2.2の新しいハードウェアとソフトウェアのリリースによって進化しました。
- 現在、UCSM統合Cシリーズラックサーバでサポートされる3つの主要な接続モードがあります。
- デュアルワイヤ管理
- 単一接続(シングルワイヤ管理)
- ファブリックインターコネクトへの直接接続
- Cシリーズサーバの複数のPCIeスロットは、サポートされるさまざまな接続オプションを提供します
前提条件
UCS BおよびCシリーズサーバの理解
http://www.cisco.com/c/en/us/products/servers-unified-computing/index.html
FEXによるデュアルワイヤ管理
- バージョン2.0(2)で導入され、以前のトポロジを置き換えた
http://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/c-series_integration/ucsm2-0-2/b_UCSM_202_C-Integration/b_UCSM_202_C-Integration_chapter_01.html#reference_D893866B8BDF451DB568FA67912E3317
FEXによる単一接続(シングルワイヤ管理)
http://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/c-series_integration/ucsm2-1/b_UCSM2-1_C-Integration/b_UCSM2-1_C-Integration_chapter_010.html
FEXのないファブリックインターコネクトへの直接接続
http://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/c-series_integration/ucsm2-2/b_C-Series-Integration_UCSM2-2/b_C-Series-Integration_UCSM2-2_chapter_0110.html
Cisco UCS C220 M4およびCisco UCS C240 M4サーバの場合は、SingleConnectまたは直接接続モードでCisco UCS Managerと統合するために、Modular Lan On Motherboard(MLOM)またはVirtual Interface Card(VIC)のいずれかを使用できます。接続用のアダプタは、次の説明に従って選択します。
- MLOMのみ:サーバにMLOMのみが存在する場合、接続アダプタはデフォルトでMLOMです。
- MLOMおよびVICアダプタ:MLOMはデフォルトの接続アダプタです。
- MLOMなし:
- MLOMおよびVICなし:SingleConnectまたは直接接続はサポートされません。
冗長PCIeアダプタのサポート
- 各カードがクラスタ内のファブリックの両側に接続されるように、冗長アダプタをケーブル接続する必要があります
適切なUCSMソフトウェアレベルであれば、1つのUCSドメイン内で複数の接続タイプがサポートされます。
要件
ディスカバリの基本
- デフォルトでは、サポートされている接続モデルのいずれかを使用してUCSファブリックに接続すると、工場出荷時の新しいUCS Cシリーズサーバが自動的に検出されます。
- 最小要件を満たす必要がありますが、一般的にCisco Integrated Management Controller(CIMC)バージョン1.4(4)以降を搭載したCシリーズサーバを検出できます。
- サーバを検出したい方法(デュアルワイヤまたはシングルワイヤなど)に接続します。
- 統合をサポートするために必要なFWの最小レベルがサーバにあることを確認します。
- デフォルトでは、管理接続とサーバ検出は自動的に行われるため、グローバルポリシーでこれを制御できます。
- サーバおよびFEX検出はRACE状態です。最初に接続され、電源がオンになっているデバイスが検出されます。
- FEX番号はシャーシと同じIDスキーマです。2つのシャーシがある場合は、2つのFEXを追加します。数値はそれぞれ3と4になります
検出ポリシー
- グローバル検出ポリシーは[Equipment]タブにあります
- 3ポリシーは、Cシリーズ統合ディスカバリに適用されます。
1:FEX検出ポリシー:リンク数、ポートチャネル対ピン接続
2:ラック検出ポリシー:即時検出とインベントリを実行するか、ユーザアクションを待ちます。
3:ラック管理接続ポリシー:デュアルまたはシングルワイヤの自動検出、またはユーザ入力が必要
トラブルシューティング手法
ユーザが確認したサーバ検出ポリシー
- サーバはUCSMに表示されますが、検出(インベントリと可用性)は行われません。
- ユーザがサーバの再確認応答を行うまで、[Overall Status]は[Inoperable]と表示されます。
- インベントリが完了していなくても、サーバ番号が割り当てられます。
ユーザが確認した管理接続ポリシー
- ユーザーが入力するまで、管理接続は確立されません。
- [サーバ(Server)] -> [インベントリ(Inventory)] -> [CIMC]
- [接続の種類]を選択すると、使用可能な接続の種類だけが表示されます。
- 管理接続タイプを選択すると、再検出(Decom/Recom)なしには変更できません
ハイブリッド接続ディスプレイ
- UCS Cシリーズサーバでは、[Equipment] -> [Server] -> [Hybrid Display]タブを使用して、管理およびデータの接続パスを表示できます。
- これは、接続の問題のトラブルシューティングや管理接続タイプの確認に役立ちます。
- 赤いリンクは、リンクにアクティブなVIFがないことを示します。これは、アクティブでないデュアルワイヤサーバでは正常です。
- 統合サーバを検出されたポートとは異なるポートに再び接続する場合は、サーバを正常に動作させるためにデコム/リコムする必要があります。
検出問題のトラブルシューティング
- サーバが適切に検出する主な原因
- CIMC設定はデフォルトではありません。(新しい状態ではないサーバの最も一般的な問題)
- 検出ポリシーまたは管理接続ポリシーが[User-Acknowledged]に設定されている
- CIMCまたはVICファームウェアが適切なレベルでない(ディスカバリ1.4(4)ではCIMC以上)。
不適切な配線
- LOMはFEXに接続され、VICはファブリックに直接接続されます。
初期ファームウェアポリシー
- サーバは、適切なレベルのファームウェアを実行している限り検出できます
- バージョン1.4および2.0(1)は、CIMC FWバージョン1.2(2l)でのみ実行および検出されます
- バージョン2.0(2)以降では、1.4(4)以降のCIMC FWで検出が可能です。
- UCSM統合では、適切なバージョンのUCSソフトウェアバンドルにパッケージ化されたFWだけがサポートされます。
- ディスカバリ後、すべてのサーバをサポート対象バンドルにフラッシュ(アップグレード/ダウングレード)する必要があります。
- 各バージョンのリリースノートでは、混合バージョンのサポートについて説明します。
UCSMファームウェアバンドルの調査
vCon配置ポリシー
- UCS Cシリーズサーバの利点は、複数のPCIeアダプタです。
- デフォルトでは、UCSは仮想ネットワークインターフェイスカード(vNIC)または仮想ホストバスアダプタ(vHBA)アダプタを物理アダプタに自動的に配置します。
- ネットワーク配置ポリシーは、特定のvNICまたはvHBAが割り当てられる物理アダプタを決定します。
- 複数のカードとカードタイプを使用する場合は、vNIC/vHBAを管理して目的のネットワーク接続を実現することが重要です。
- VConsは物理アダプタの抽象化であり、実装されている物理カードの数に関係なく、サービスプロファイルに対して一貫したPCIeマッピングを提供します。
- vNICおよびvHBAの順序を設定すると、vCONに自動的に配置されます。
- サービスプロファイルを作成する場合は、vNICを明示的に配置して、決定論的な接続を提供できます。
- これは、vNIC/vHBAの配置によって実現されます
Cシリーズ統合サーバのvNIC/vHBA配置を手動で指定する主な2つの理由があります。
- UCSMで使用されていないアダプタ(C460 LOMや外部接続アダプタなど)への自動マッピングの防止
- トラフィックエンジニアリング(1つのアダプタでFCoE、もう1つのアダプタでイーサネットなど)。
UCSMローカルディスクポリシー
PCIeスロットとは別に、Cシリーズサーバを選択する際の他の主要なフォームファクタの決定は、ドライブ構成の数と柔軟性です。
- ブレードサーバは最大4台のドライブをサポートします。Cシリーズラックマウントサーバは現在、最大24台のドライブをサポートします。
- UCSMは、サービスプロファイルの一部であるローカルディスクポリシーを使用して、ローカルドライブ設定を管理します。
- ローカルディスクポリシーの現在の実装は範囲が限定されており、お客様の要件の一部をまだ満たしていません。ユーザは、UCSM以外のツールを使用してドライブ設定をカスタマイズし続けることができます。
- Cシリーズサーバのローカルドライブを設定する際の鍵は、ローカルディスクポリシーを理解することです。
- コントローラとドライブのファームウェア管理は、サービスプロファイルを通じて行うこともできます。
- ローカルディスクポリシーは、利用可能なリソースを使用してRAIDコントローラ上で論理(仮想)ドライブを構成する方法を説明します。
- コントローラの機能に応じて、ローカルディスク設定のオプションが含まれます。
- 保護設定は、コントローラの実際の設定と一致しないローカルディスクポリシーを持つサービスプロファイルが適用されることを防止します。
- これにより、サービスプロファイルのモビリティ中に既存のボリュームのデータが保護されます。
ベスト プラクティス
ディスカバリのベストプラクティス
- 160台のサーバ環境がある場合でも、ラックサーバ検出ポリシーの自動確認応答を使用します。
- サーバが単一接続に対応している場合は、必要な接続に配線し、自動確認応答(AAL)管理ポリシーを使用します。
- LOMとSFPを配線する場合は、Shared-LOMがシステムデフォルトモードになります。
- 共有LOMの検出後にLOMを削除すると、管理接続が失われます。
- シングル接続モードで複数のVICを使用する場合、プライマリカードスロットが管理に使用されます。そのカードに重大な障害が発生した場合、2番目のカードではデータが継続されますが、UCSMによる管理は失われます。
- Decom/Recomは、共有LOMとサイドバンドの間で異なる管理パスを確立したり、VIC障害が発生した場合に必要です。
- 両方のユーザ確認応答ポリシーを有効にするには、2つの再確認応答が必要です
- サーバを検出する前に、まずFEXを検出し、番号を変更してからサーバを検出します。これは、サーバをオフラインにする必要があり、これによりサーバ検出が中断される可能性があるためです。
vCon配置ポリシーの設定:ベストプラクティス
- 配置ポリシーは、異なる数のアダプタを持つサーバ間でプロファイルを移動する際に、一貫したPCIe番号付けを提供するように設計されています。
- vNIC/vHBAの配置を厳密に制御する必要がある設定がない限り、自動配置で十分です。次に例を示します。
- オンボードアダプタを搭載したサーバは、使用しないUCSMで管理できます(C460など)。
- UCSM検出可能アダプタを使用した外部ネットワーク(Broadcom、Intelなど)への接続
- FCoEトラフィックとイーサネットトラフィックの厳密な分離
マルチボリュームドライブ管理のベストプラクティス
- コントローラ上の論理ドライブを再設定してドライブ上のすべてのデータを破棄する場合を除き、サーバ間でサービスプロファイルを移動するときは、常に保護設定を使用してください。
- 1つのボリューム以外の構成、またはすべてのドライブを個別のRAID 0ボリュームにする必要がある場合は、構成のローカルディスクポリシーを使用します。
- 必要なボリュームが1つだけで、既存のボリュームを拡張したり、将来の追加ボリュームを作成したりするには、構成のローカルディスクポリシーを使用します。
- 論理ドライブと論理ドライブ上のデータを持つ既存のスタンドアロンCシリーズサーバがある場合、ローカルディスクポリシーが[Any]の構成のサービスを関連付けた場合でも、データを失わずに統合できます。
関連情報
C シリーズ サーバの UCSM 統合の設定例
http://www.cisco.com/c/en/us/support/docs/servers-unified-computing/ucs-infrastructure-ucs-manager-software/116741-troubleshoot-ucsm-00.html
http://www.cisco.com/c/en/us/support/servers-unified-computing/ucs-c-series-rack-mount-ucs-managed-server-software/products-installation-and-configuration-guides-list.html
http://www.cisco.com/c/en/us/products/collateral/interfaces-modules/ucs-virtual-interface-card-1240/data_sheet_c78-699459.html
https://www.ciscolive.com/online/connect/sessionDetail.ww?SESSION_ID=77758&backBtn=true
既知の問題:
CSCup69532 UCSMの「remove」サーバ機能が機能しない