クラウドを使えば、何千年もデータを保存できる。それは誤解です。~クラウドの耐久性とは~(前編)

コラム
ビジネス

 AWSで提供されるクラウドサービスの耐久性は、99.999999999%(イレブンナイン)に設計されているとアナウンスされています。これを、「何千年もデータを保存できる」と思っていませんか。そんな方は是非、この記事をお読みください。それは、誤解です。

1.「耐久性」とは

 「耐久性」とは、何でしょうか。日本語では「耐久」は、「長く持ちこたえること」を指し、不動産業界では、「耐久性」を「ある材料が外部からの物理的・化学的な影響に対して、どれだけ長く抵抗できるかを示す性能のこと」としており、英語では、「durability」です。「久」という感じが使われており、長くという意味が入っています。
 通常は、時間の経過に対し、劣化する物理特性のあるものに対し、こんな環境なら劣化しても10年は使えます、50年は使えます、100年は使えます、という場合に、耐久性が高いとか低いというように使われます。

2.AWSにおける「耐久性」の説明

 AWSにおける「耐久性」の意味が、このような通常の使用方法かどうかをAmazon S3のよくある質問「耐久性とデータ保護」の説明を以下に引用し、確認してみます。
 “Amazon S3 標準、S3 標準 – IA、S3 1 ゾーン – IA、S3 Glacier はすべて年間オブジェクトに対して 99.999999999% の耐久性となるように設計されています。この耐久性レベルは0.000000001% のオブジェクト平均年間予測喪失率に該当します。たとえば、Amazon S3 に 10,000,000 のオブジェクトが格納されている場合、単一のオブジェクト損失が発生する予測平均発生率は、10,000 年に 1 度ということになります”
 これからわかるのは、AWSは記録の単位をオブジェクトとしています。AWSの定義する耐久性は、「オブジェクト平均年間予測喪失率」の逆数、すなわち、「オブジェクト平均年間予測生き残り率」であるということです。
 代表的なパブリッククラウドであるAzureでは、同じ「オブジェクト平均年間予測生き残り率」を「持続性」という用語で表しています。一般的な通念からすると、物理的な劣化要因を含まない、「オブジェクト平均年間予測喪失率」です。「オブジェクト平均年間予測生き残り率」に「耐久性」という言葉を当てたのは一般通念とは異なっており誤解を与えた可能性があります。「持続性」については、一般通念がない分誤解は避けられるかもしれません。

3.「何千年もデータを保存できる。」のか

 さらに、上記の例え話、“Amazon S3 に 10,000,000 のオブジェクトが格納されている場合、単一のオブジェクト損失が発生する予測平均発生率は、10,000 年に 1 度ということになります”は、誤解をさらに深めてしまっています。
 現在の運用だと、年間どのくらいデータを喪失するとかしないとかという指標であり、決して、「10,000 年(一万年)」の間、運用が変わらず続くというようなことは言ってないのです。考えてみて下さい、一万年前と言えば日本は縄文時代です。このような例え話は、非現実的で意味がありません。ですので、AWSの解説が誤解を生んでいると言わざるを得ません。

 ここで、現実的な試算をしてみます。1000万個のオブジェクト、1個当たり容量1MB、総容量10TBをクラウドに預けている利用者(企業)があったとします。
 そうすると「この耐久性レベルは0.000000001% のオブジェクト平均年間予測喪失率に該当しますので、年間予測平均喪失件数は、0.01件、言い換えれば100社に1社は毎年オブジェクトを喪失する。」というレベルであることがわかります。

まとめ

 AWSを使えば、「何千年もデータを保存できる。」という誤解が生まれている背景について説明しました。次回は、AWS,Azureの「オブジェクト平均年間予測喪失率」が極めて低くなっている基本方式である「3重記録のミラーリング」について解説します。

関連記事

  • クラウドの障害からデータを護れ~ユーザー部門の学び~

    コラム

  • クラウドは万全ではない―バックアップの必要性について

    コラム

  • バックアップとアーカイブの違い―アーカイブならではの課題と対策

    コラム