ExpressRouteの監視と運用のポイント

2024.04.17

Azure連載

はじめに

こんにちは。株式会社プログライブ コンサルティングの酒見(さけみ)です。

今回は、ExpressRouteの監視について解説します。

ExpressRouteの監視とは

ExpressRouteの監視に関する情報は、ExpressRoute の監視、メトリック、およびアラートに大部分がまとめられています。

そのため、ここで新たに説明を加える必要はほとんどありません。

しかし、公式のドキュメントがやや長いため、個人的に優先すべきだと考えるポイントや、ドキュメントには記載されていないが重要だと思われるポイントをまとめてみました。

監視の戦略

どのようなアラートを設定できるかは、先に参照したドキュメントに記載されています。

しかし、どのアラートを実際に設定すべきかについては、具体的な監視戦略を立てる必要があります。

この戦略を練るためには、まずExpressRouteに何を求めているのかを明確にすることが重要です。

オンプレミスやデータセンターなどの社内ネットワークとAzureネットワークをつなぐこの機能が正常に動作しているかどうかを確認する方法を見つけ出すことが、ここでの主な課題です。

これに関連して、監視の最適なアプローチを理解するためには、入門 監視 ―モダンなモニタリングのためのデザインパターンで紹介されている概念も参考になります。

この資料では、監視戦略の核心としてエンドツーエンドでの監視の重要性を強調しています。

ただCPUやメモリのメトリックを監視するだけでは不十分で、システム全体の状態を正確に理解するには、より包括的な視点が必要であると述べています。

エンドツーエンドの監視を実現するNetwork WatcherのConnection Monitor

Network WatcherによるConnection Monitor機能は、仮想マシン(VM)に軽量なエージェントをインストールすることで、定義されたエンドポイント間の通信を監視し、エンドツーエンドの監視を実現します。

監視対象となるポートもユーザーが定義できるため、Windows Serverなら3389/tcp、Linuxなら22/tcpを監視することで、追加のポート開放を避けられます。

以前はこの役割をNetwork Performance Monitor(NPM)が担っていましたが、現在ではConnection Monitorがそれを引き継いでいます。

Connection Monitorを使用すると、オンプレミスとAzure間の通信監視が可能ですが、私はとくにレイテンシーの監視が重要だと考えています。

接続状態は比較的簡単に把握できるため、Connection Monitorがなくても問題の確認は可能です。

しかし、レイテンシーは継続的な監視が必要であり、たとえば毎朝9時に通信が遅くなるといった傾向を捉えるのはConnection Monitorの得意分野です。

レイテンシーが問題になる場合

Connection Monitorでの継続的な監視の結果、レイテンシーが問題となるシナリオでは、ExpressRoute GatewayのCPU使用率が高まっていることがあります。

このような状況では、ExpressRoute Gatewayのスケールアップが解決策となります。ExpressRoute Gatewayには仮想マシン(VM)のようなイメージが伴わないため、CPUのメトリックが利用可能であることを知らない方も多いかもしれませんが、重要な指標です。

各SKUにおけるパフォーマンスの目標値は、ExpressRoute の仮想ネットワーク ゲートウェイについて - ゲートウェイ SKU の推定パフォーマンスに記載されています。

ただし、これらはあくまで推定値であり、実際には記載されたパフォーマンスを上回るトラフィックを処理できるケースもあれば、逆のケースも存在します。

ExpressRoute Gatewayのスケールアップでもパフォーマンスに不足がある場合

ExpressRoute Gatewayをスケールアップしてもなおパフォーマンスに不足が感じられる場合、FastPathの活用が次なる選択肢となり得ます。

ExpressRoute FastPath についてに記載されているように、FastPathは一定の制限事項を持ちながらも、オンプレミスとAzure VM間の通信パフォーマンスの向上を実現します。

ただし、この機能を有効にする前には、制限事項を十分に理解し、環境に適しているかを慎重に評価することが重要です。

ExpressRoute回線の上限に達している場合

ExpressRoute回線の帯域幅には、その契約に基づいた上限があります。

その上限値に近づくと、ユーザーはパフォーマンスの低下を体感することになります。

この点は比較的明白で、特に複雑な事項ではありません。

しかし、パフォーマンスの低下を避けるためには、Azure側のExpressRoute回線の帯域幅制限だけでなく、ExpressRoute接続プロバイダー側の帯域幅制限にも注意を払う必要があります。

帯域幅の状況を定期的に監視し、使用量が上限に近づいている場合は、回線のスケールアップや追加の回線契約を検討することが重要です。

ExpressRouteのメンテナンス

ExpressRouteの運用においては、エンドツーエンドの監視と同様に、メンテナンスも不可欠な項目です。

ExpressRoute の計画メンテナンス ガイダンスには、メンテナンスに関する多くの情報が記載されています。

さらに、Service Healthのアラートを設定することにより、ExpressRouteのメンテナンス通知を受け取ることが可能です。

適切に冗長化された構成を利用していれば、ペアのリンクのうちの1つだけにトラフィックが寄せられても、通信はほぼ問題なく継続されるはずです。

この点については、ExpressRouteで障害が発生する可能性のあるポイントとその対応策にも詳細を記載しています。

万が一、通信に問題が生じた場合は、構成が正しいか、またはアプリケーションレイヤーでのリトライ処理なども含めて、総合的に確認する必要があります。

まとめ

今回の記事では、ExpressRouteの監視とメンテナンスに焦点を当て、効果的な運用を支援するための重要なポイントを解説しました。

ExpressRouteの監視には、エンドツーエンドの監視が不可欠であり、Network WatcherのConnection Monitor機能を活用することで、深いレベルでの通信の洞察を得ることができます。

また、レイテンシーや帯域幅の制限など、潜在的なパフォーマンスの問題に対しては、適切な監視と迅速な対応が求められます。

ExpressRouteのメンテナンスでは、計画メンテナンスの通知を受け取るためにService Healthのアラートを設定すること、さらに冗長化された構成を通じてサービスの継続性を保証することが重要です。

問題が発生した場合には、システム構成やアプリケーションレイヤーでのリトライ処理など、総合的なチェックが必要となります。

最終的に、ExpressRouteを使用する際には、技術的な監視の実施だけでなく、適切なメンテナンス計画の理解と準備が成功の鍵となります。

これらの実践を通じて、Azureとオンプレミス環境間の通信をスムーズにし、ビジネスの要件に合致したパフォーマンスを確保することが可能です。

本記事が、みなさまのよきExpressRouteライフをサポートできれば幸いです。

この記事を書いた人 プログライブ コンサルティング 酒見

同じカテゴリーの記事