近年,分散コンポーネントで構成されたネットワークサービスが注目されている. このネットワークサービスでは,分散配置された複数種類のコンポーネントを共用して 高度なサービスを低コストで提供することができる. このようなネットワークサービスでは,一つのコンポーネントに障害が発生した場合でも 同一機能のコンポーネントを代替として用いることによりサービスの再開が可能であるという利点がある.
しかし,実際の障害箇所はコンポーネントだけでなく,他の箇所でも障害が発生する. またこのようなネットワークサービスにおける実際の障害としては, 稼動コンポーネントにおけるソフトウェア的な障害,ハードウェア故障によるノード全体の障害, ルータや物理リンクなどの物理ネットワークにおける障害が考えられる. また一般的に,このように障害の発生するレイヤが複数あるような障害を 統合的に検知することは困難である.
本研究では,複数のオーバレイネットワーク間の協調を用いて必要な情報を最低限の送信メッセージ数 で収集することにより,アプリケーションレイヤとネットワークレイヤの両方の障害箇所を特定する手法を提案する.