【後編】データの“永年保管”と、そのために必要な対策・仕組み

コラム
アーカイブ

前編ではデータ保管の現状と保管期間が長期化するケースが増えている背景を確認しました。では、期限を定めることができない長期の間データファイルを確実に残すためには、どのような対策や仕組みが必要なのでしょうか?

(注)この記事では、保管を開始する時点では期限を定められず、“削除すべき時”がきたら削除するという管理方法を“永年保管”と呼びます。

[前編からの続き]

3.データを“永年保管”するために必要な保管方法とは

いつまで保管するかわからない原本データを(いつまでも)保管するためには、次の3点が考慮された保管方法を選択するのがよいでしょう。

  • 情報価値を変化させない
  • 情報セキュリティを保てる
  • 検索・取出しが容易である

4.データを“永年保管”するために必要な対策や仕組みとは

それぞれ具体的にどういった対策や仕組みが必要か、ご説明します。

◆情報価値を変化させない
情報価値を変化させないということは、“保管した時と全く同一の内容で、何年後でも取出しできる方法である”と、明確に説明できることが大事です。そのためには、以下のような対策や仕組みが必要でしょう。

(1)改ざん防止策
改ざん防止策として一般的に認められている方法は、WORM方式を採用した記録メディアを使用する方法です。WORM(Write Once Read Many)は、書込みは一回限りだが読み取りは何度で見できる記録装置や電子媒体のことです。ソフトウェアで実現する方法もありますが、光メディアや磁気テープを使用する方法がよく知られています。
(2)記録メディアの寿命管理
ハードディスク、磁気テープ、光メディアなどの記録メディアには、それぞれのメーカーが目安として発表している寿命があります。記録メディアを購入後、その記録メディアの寿命が来る前に新しい記録メディアにデータ移行をする方法が、永年保管のための方法として一般的な手法です。
(3)データの真正性と完全性の担保
「記録メディアからは保管時と同じデータファイルをとり出せても、何十年後のアプリでは正しく読めないのではないか?」という質問をよくいただきます。つまり、真正性だけでなく、完全性をどう担保するのか?という質問です。データ保全(事業者)の役割は、保管時と同一のデータファイルを取り出せることを担保すること、すなわち“真正性の担保”です。一方で、このデータファイルを保管者の役立つ形で読めるかという“完全性の担保”に関しては、一般的に保管者側(お客さま)の責任と考えられています。この“完全性”を担保する方法としては、一例として、動画像の保管時にビューワーも同時に保管するというような方法もあるようです。
◆情報セキュリティを保てる
保管データは事業や会社にとって重要な情報資産であり、「原本」です。保管データに対する情報セキュリティを保つためには、以下のような対策や仕組みが必要でしょう。

(1)不正アクセス、盗難、紛失への対策
ウィルス、ハッカーなどへの対策としては、ファイヤーウォール、セキュリティソフト、その他さまざまな対策があります。ただし、可能であるならば、安全であることの説明として最もよいのは、ネットワークやシステムから切り離した「オフライン」で保管することです。
(2)作業要員の行動監視
外部からの不審者の侵入や不正アクセスに対する対策が十分に実施されている場合、最後に監視すべきなのは作業要員やオペレータ要員など“内輪の人間”と言うことになります。入退館管理、権限管理、監視カメラ記録などで行動監視できていることを説明でき、さらに犯罪を追跡できる仕組みつくりが必要です。
(3)バックアップ、遠隔地保管(別地アーカイブ)
原本データを記録メディアを使用して長期的に保管する場合、正副2本の記録メディアで管理するのが基本です。さらに震災などに備え、別地にも同じものを保管することも推奨されています。別地保管を行う場合は、読み出しのための適切な装置を、いつでも利用できる状態で一緒に保管する必要があります。
◆検索・取出しが容易である
長期保管するデータファイルは、訴訟、監査などでいざという時に使えなければ、保管してある意味がありません。大量の保管データの中から欲しいデータファイルだけを容易に探し出して取り出せなくてはいけません。検索・取出しを容易に行うため、以下のような仕組みや考え方を取り入れる必要があるでしょう。

(1)検索用インデックス
保管データとしては、毎年のように追加され増加する性質のものも想定されます。保管データをフォルダー名やファイル名で検索できる仕組みが必要です。保管データを使用したい時に管理責任者はすでに退職しているかもしれません。検索の仕組みや検索用インデックスも長期保全され、簡単にアクセスできるような仕組みが必要です。
(2)未整理のまま保管していても容易に探せる仕組み
法令などに沿ったデータ保管が中心だったころは、比較的データ容量が少なく、後日検索しやすいように不要なデータファイルは除外して保管する余裕がありました。しかし、映像、写真、IoTなどコンピュータシステムとは無関係な機器から大量にデータが生成されている現在では、保管データの事前整理は難しいと考えられています。生(なま)データをそのまま、未整理のまま保管する事例が増えています。したがって、検索・取出しの方法がますます重要になっています。
(3)画像認識や機械学習などより高度な検索の仕組み
監視カメラや手術などの記録映像では、見たいシーンを直接探し出す検索方法が研究されています。登場人物の顔や衣装で探す方法、執刀医の発する手術の段取り用語をとらえる方法、何らかの検索用タグを事前に付加する方法などもあるようです。また、保管データによっては機械学習などで、より検索精度を上げる研究もされているようです。

まとめ

期限を定められない長期の間、データファイルを確実に残すためには、改ざん防止、記録メディアの寿命管理、保管データの真正性と完全性の担保、セキュリティ対策は不可欠です。

一方で、残していても目的のデータファイルを探し出せなければ意味がありません。いつ・どれが必要になるかわからないデータファイルを、いざというときに膨大な保管データの中から確実に取り出すための工夫や仕組みが備わっていることも、たいせつなポイントになるのです。

関連記事