CTC 教育サービス
[IT研修]注目キーワード Python UiPath(RPA) 最新技術動向 Microsoft Azure Docker Kubernetes
前回に続いて、2020年に公開された論文「Classification of load balancing in the Internet(PDF)」を紹介します。この中では、ネットワーク経路を調べる伝統的なツールである「traceroute」をロードバランサーを含む経路に対応するための拡張手法が提案されており、さらにこれを用いた実際の調査結果が示されています。今回は、調査結果の内容を紹介します。
冒頭の論文では、19,866種類のIPv4アドレス、および、16,674種類のIPv6アドレスに対して、特定の31地点からのネットワーク経路を調査した結果が記されています。経路の始点となる31地点は、Vantage points(VPs)と名付けられており、クラウドプロバイダーや大学など6種類のプラットフォーム上に展開されたサーバーになります。全体で5大陸、16ヶ国にまたがります。経路の終点となるIPアドレス群は、「toplist」と呼ばれるアクセス頻度の高いWebサイトのリストなどから選択されており、IPv4については、4,388箇所のAS、IPv6については、8,103箇所のASにまたがります。インターネットは、複数の組織が管理するネットワークをグローバルに相互接続することで成り立っており、AS(Autonomous System)は、1つの組織が管理するネットワークの範囲を示します。図1は、実際に経路情報を取得した期間と回数をプラットフォームごとにまとめたものになります。
図1 ネットワーク経路の調査データ(論文より抜粋)
この経路調査の目的は、インターネットの経路上にロードバランサーがどのように分布しているかを調べることですが、Vantage pointsを提供するプラットフォーム自身もそれぞれがロードバランサーを利用しています。プラットフォーム内のロードバランサーは必ず通過することになるので、これらは調査の対象から除外してあります。
まずはじめに、それぞれの経路上に(少なくとも1つの)ロードバランサーが存在する割合を示すと、IPv4で約74%、IPv6で約56%になります。(拡張版の)tracerouteでは、ロードバランサーが存在する位置(AS)も分かりますが、AS別に見た場合、55%のASがIPv4のロードバランサーを配置しており、41%のASがIPv6のロードバランサーを配置しているということです。さらにまた、1つの経路上に存在するロードバランサーの数については、図2の結果が示されています。
図2 経路上のロードバランサーの数(論文より抜粋)
このグラフでは、縦軸の値として「ロードバランサーの数が横軸の値以下の経路の割合」が示されています。例えば、IPv4では、80%弱の経路では通過するロードバランサーの数は5台以下である、と言った情報が読み取れます。
これらの結果を見ると、インターネット上には、かなりの割合でロードバランサーが配置されていることがわかります。また、IPv6よりもIPv4の方がロードバランサーを通過する割合が高いのは、IPv4の方がより長く利用されており、ロードバランサーをはじめとする帯域管理の技術がより普及していることが理由だと考えられます。
この論文では、ロードバランサーを含む経路の「形状」に関するデータも記載されています。図3は、典型的な経路の形状を示したものですが、さまざまな経路の形状を数値化するために、次の5つの指標を定義しています。
・length:最長のホップ数
(図3のB-O間ではlength=5、P-V間ではlength=3)
・asymmetry:最長のホップ数と最短のホップ数の差
(図3のB-O間ではasymmetry=0、P-V間ではasymmetry=1)
・max-width:異なる経路の数
(図3のB-O間ではmax-width=4、P-V間ではmax-width=3)
・min-width:重複部分を持たない経路の数
(図3のB-O間ではmin-width=2、P-V間ではmin-width=3)
・depth:経路上で遭遇する分岐点の最大数
(図3のB-O間ではdepth=2、P-V間ではdepth=1)
図3 ロードバランサーを含む経路の例(論文より抜粋)
図3のB-O間、および、P-V間の様に、1つの経路が分岐して再び1つに合流するまでの範囲を「Diamond」と呼んでおり、論文の中では、調査した経路上のさまざまなDiamondについて、上記の5つの指標を算出した結果がまとめられています。例えば、80%のDiamondはlengthが5以下であり、IPv6はIPv4よりもlengthが短い傾向がある、あるいはまた、大部分のDiamondはasymmetry=0の対称形であるといった点が指摘されています。その他の指標については、図4のデータが記載されています。図2のグラフと同様に、縦軸の値は「対象の指標が横軸の値以下の経路の割合」を示します。
図4 経路の「形状」を示すデータ(論文より抜粋)
今回は、2020年に公開された論文「Classification of load balancing in the Internet」に基づいて、インターネット上に存在するロードバランサーについて大規模に調査した結果を紹介しました。なお、この論文の補足情報として、実際に観測された個々の経路のデータがWebサイト「Multipath Classification Algorithm (MCA) Code and Dataset」で公開されています。インターネット上に実在する経路について、図3のような形状を個別に確認することができます。
次回は、Google Cloud Platformの機械学習サービス「AutoML Tables」に関連する話題をお届けします。
Disclaimer:この記事は個人的なものです。ここで述べられていることは私の個人的な意見に基づくものであり、私の雇用者には関係はありません。
[IT研修]注目キーワード Python UiPath(RPA) 最新技術動向 Microsoft Azure Docker Kubernetes