「データアーカイブセンター」の役割

コラム
ビジネス

「アーカイブ」という単語を聞いたことはあるでしょうか?デジタルデータのアーカイブと、これからの「アーカイブセンター」が果たすべき役割について、考えてみたいと思います。

1.アーカイブとデジタルアーカイブ

アーカイブ 【archive】 とは、保存記録、公文書、公文書館、記録保管所、書庫などの意味を持つ英単語です。保存された記録物・文書類やそれらの保管設備・施設などを指すこともあります。
従って、アーカイブセンターと仮に呼称すると、博物館・美術館・公文書館や図書館、フィルムセンターなどに相当し、公的なものから私企業が運営するものまで多数存在しています。

現在、これらの"アーカイブセンター"アーカイブセンター"では保管物のデジタル化が進められています。デジタル化により長期保存が可能になるかは議論だけでなく技術の進歩も必要です。アナログのままのほうが保有する情報量は多く、アナログメディアのほうが長期保存性が高い場合もあります。さらにデジタル保存は電気代や人件費などのコストがかかることも懸念されます。
一方、検索や閲覧面ではデジタル化保存には大きなメリットがあるため、アーカイブセンターの業務効率や利便性を高める手法としてデジタル化が進められています。この分野は日本独自の用語で「デジタルアーカイブ」と呼ばれています。

2.アーカイブとコールドデータ保管

一般的には"データアーカイブ"には以下の2種類の使われ方が散見されると感じます。

  • A)アクセス頻度が低いが消せないデータの安価な保管(コールドデータの保管)
  • B)アクセス頻度が低いが(可能ならば)真正性を担保できる安価な長期保管

データアーカイブとはコールドデータの保管のことと理解している人も多いようですが、コールドデータの中にはアーカイブが必要なものとそうでないものが混在しています。

A)はストレージベンダーやクラウド事業者がよく使う定義で、情報資産管理のプロセスとしてのアクセス頻度に応じたコストの最適化=「より安価なストレージサービス」の提案を目的としています。
パブリッククラウドでもAmazon GlacierやAzure Archive Storageなどのサービスが知られていますね。
一方 B)は、バックアップ(コピーデータ保管)に対するアーカイブ(原本データ保管)として使われます。

大容量データを安価に保管する目的はA)と同じですが、10年~永年保管後でも利用できることと保管した状態と同一なものをいつでも取り出しできること(真正性)の担保がA)とは異なります。

今後データアーカイブの重要性・必要性が増すにつれて、データアーカイブと呼ばれるもののうち、このB)の重要性が高まってくるでしょう。

3.データアーカイブセンターの必要性

デジタルアーカイブは、紙、フィルム、写真などの記録メディアから情報をデジタル形態で取り出して利用する手法のこととも言えます。一方、昨今のデータ情報は最初からデジタル形態で生成され、サーバ、PC、ネットワークなどを記録メディア代わりとして利用され保管されています。IDC Japanによれば、全世界で発生するデータの量は、2025年には2016年比でおよそ10倍の163ゼッタバイト(163兆ギガバイト)にまで増えると予測されています。データは21世紀の石油とも言われ、GAFAなどを中心に取り合いの様相を呈しています。単純に量を集めることに意味があるデータもありますが、時系列に処理されることに意味がある場合は長期保全策が重要になります。

データ保管の理由として法令遵守をあげる企業などは今や少数派であり、以下の2つの理由に集約されつつあります。

  • ①証拠データとして将来の組織・社員や事業を護る
  • ②資産データとしての将来の利活用の可能性に期待

これらのデータ保管の動向から、大容量データの保管・保全、検索・閲覧サービスを提供するデータ保管に対するアーカイブセンターが必要な時代になったと言えます。広く利用され始めているパブリッククラウドは安価なストレージではあるのですが、証拠データや資産データを保全できる機能は提供していません。

4.これからの「データアーカイブセンター」の役割

データアーカイブは「アクセス頻度が下がったデータを消せないので安価に保管したい」とか「監督官庁のガイドラインや法令で保管期間が定められているから」だから必要だというような単純な問題ではありません。 訴訟や風評から企業や社員を護る、事業や企業の競争力を拡大する、すなわち日本の資産を護り価値を高めるということなのです。

従って、日本企業のデータは日本国内でかつ日本の業者によって保全されるのが適切であろうと思われますが、その仕組みは整っているでしょうか。
データは保全しておかなければ、劣化し、破壊・改ざんされ、消失してしまいます。データ資産を安全安心に保全し、いつでもどこからでも簡単便利に取り出すことが可能なデータアーカイブセンターの仕組みが、早急に必要とされているのです。

関連記事

  • クラウドは万全ではない―バックアップの必要性について

    コラム

  • 長期化する情報資産の保存期間。いま求められるデータの「保全」(前篇)

    コラム

  • 長期化する情報資産の保存期間。いま求められるデータの「保全」(後篇)

    コラム