長期化する情報資産の保存期間。いま求められるデータの「保全」(前篇)

コラム
ビジネス

EU一般データ保護規則(GDPR)が2018年5月25日に施行されました。 これは、EU居住者の個人情報を収集および処理する組織に対して広く適用されます。 違反に対する巨額の制裁金が懸念事項として指摘されていますが、個人情報に限らず、またグローバル企業か否かや、企業規模の大小にかかわらずに、“情報資産の保護・保全は他人事ではない”ことを強く意識しなければなりません。

ところで情報資産を残すことは、ただ記録媒体に「保存」することを指すのではありません。 たとえばかつては家庭でのテレビ番組録画はVHSが一般的でしたが、いまそのVHSの再生機をもつ家庭はどれくらいでしょうか?再生機がなければVHSに録画した番組を見ることはできません。 DVDなどの光ディスクも割れてしまえば再生できませんし、HDDレコーダーに大量に録画されたデータにもしタイトルや録画日などのインデックスがなければ目的の録画データにたどり着けるでしょうか? データを未来に残すためには、ただ保存するだけでなく、残したデータをとりまく環境も含めた「保全」が必要なのです。

この記事は前篇と後篇にわけて「デジタルデータの保全」についてお話します。 前篇では、データ保存が必要な理由や保存期間など、データの長期保存が求められる背景を確認していきましょう。

1.データ保存が必要な理由はコンプライアンスだけではない

従来、情報資産の長期保存には紙媒体が使用されることが多かったため、書類保管に関わるルール・規制が整備されてきました。 IT技術の進展により文書や書類のデジタル化が進み、紙媒体だけでなく、デジタルデータによっても保存されるようになりました。

データの長期保存はもともと文書や書類のデジタル化が大きな要因であり、それゆえに主な保存理由はコンプライアンスでした。 そのため、データ保存は多くの場合、蓄積されつつも利用するつもりもない金食い虫であり、HDD、磁気テープなどデータを保存している記録メディアの寿命管理がなされていないため、いざというときに読み出せる裏付けも希薄と考えられていたのが実情だったのではないでしょうか。

しかし今、データの長期保存理由として、コンプライアンスだけでなく訴訟対応、説明責任、リスク管理などの重要性が高まっています。 その要因のひとつに、2015年10月に発生した「杭打ち問題」が挙げられます。この問題により、いつ重大な不正や訴訟問題に巻き込まれるか分からないという危機意識が各企業で高まりました。 結果、様々な企業・業界でリスク管理や自己防衛の観点からデータの長期保存が事業課題と考えられるようになりました。
また時期を合わせるかのようにビッグデータ、AIなどと呼ばれる大容量データ処理の要求が事業競争力を高める手法として発達し、金食い虫であった保存データも仮説検証の裏付けなどに極めて有益な「宝の山」であるとの認識が広がってきたことももう一つの要因と考えられています。

2.データ保存の期間は長期化傾向にある

昨今、爆発的に増えているデジタルデータの保存について、企業などではどのように考えられているのでしょうか。
主な長期保存データには以下のようなデータがあります(図1)。

データ種目的データ容量保管期間など
建設工事/竣工コンプライアンス1~2GB程度/工事10-15年保管(法令)
建設工事/現場証拠性保全100GB~2TB/工事30年~永年保管
製造品証証拠性保全毎月数TB自動車部品15年以上
開発品質不良対策TB~PB内部規定
学術研究証拠性保全10GB程度/研究10年間保管(文科省)
手術記録証拠性保全TB~PB刑事訴訟法20年
創薬/治験コンプライアンス100GB程度30年(厚労省)
創薬/R&D品質不良対策TB~PB社内規定
石油探査資産保存数TB社内規定
ファイルサーバ効率化2~3割がコールド「消せない」
社員PC効率化特に管理者・経営者「消せない」
電子化文書働き方改革「消せない」

図1 主な長期保存データ

データごとに具体的な事例で現状を理解しましょう。

・工事データ
建設業法、建築士法で工事データ(竣工データ)は10年間または15年間の保管期間が定められています。しかしながら、現場では10年ごとの改修工事など継続的に利用するデータもあります。クレームや訴訟対策としては30年から50年間の保存が必要と考えているようです。トンネルや橋梁なども同様で、基本は建築物がある間、実質は「永年保管」として管理することになりそうです。
・設計・製造データ
製造業界では製品寿命の長さがデータ長期保存期間に大きく関係しているようです。
自動車部品の品証データは15年保存と考えられており、またCADデータは欧州では20年保存と考えられており日本のメーカーも数年前からこれに合わせ始めています。
一方、自動運転技術の開発記録も長期保存されています。PB(ペタバイト)にも及ぶ膨大なデータ量ですが、実用までには法規制対応を含め膨大なデータ蓄積が必要ですし、品質不良時の検証用としても必要と考えられています。保存期間は各社の社内ルールに依存するため、7年から10年間、あるいは15年から20年間など企業による違いがあります。
また、航空宇宙産業界(欧州)ではCADデータは約50年程度保存が必要とされています。
・個人に関するデータ
大手の大学病院ではすべての手術を4Kなどで記録しています。目的は医師法に準拠することではなく、学生の教材として、また医師をクレームや訴訟から護るためとのこと。したがって保存期間は医師法準拠の5年程度ではなく刑事訴訟法で時効となる20年は必要と考えているようです。
また、海外の法規制では、HIPPAの医療記録や年金記録など保存期間は100年になるケースもあります。
・再現不可能なデータ
ログデータ、マーケティングデータなどは再現できないデータとして主として問い合わせ対応目的などで5年から10年程度保存されています。ただビッグデータなどで価値があるのは比較的新しいものに限られるようです。
一方、気象データ、フライトデータなども同様な再現できないデータですが、過去データも時系列的な意味があるようで、長期間保存されるようです。
・多いほうが望ましいデータ
予防治療には複数世代のDNAデータが理想であり、多ければ多いほど望ましいとされています。

3.データの長期保存は、経営だけでなく現場にとっての課題でもある

データ長期保存はBCPのような経営課題ではなく、業務の一部としてとらえている企業が多いというのも一つの特長です。 本社や情報システム本部ではデータ長期保存の課題対策や予算には関与せずに、事業部・支店・研究所などそれぞれの部門で自身の業務継続策として検討されます。 コンプライアンスをデータ保存の理由とするのは本社(情報システム部門)ですが、一方事業部・支店・研究所など現場のデータ保存理由は自身を護るための“証拠性保全”や“品質不良対策”、“事業競争力を高めるための再利用”となります。 工事データや医療データなどではこのようなデータ保存の2面性(重複保存)が顕著になりつつあります。

4.保存期間の決め方は、社内ルールだけでなく同業他社の動向が重要

法定保存文書は別として、杭うち問題や研究論文不正など世間をにぎわした課題では監督官庁がルールを設定する場合もありますが、多くの場合、データ保存期間は社内ルールと位置付けられています。 ここで重要なのは同業他社の動向です。工事データではスーパーゼネコンがどうしているか、自動部品製造業では欧州ではどうしているか、というようなことです。

まとめ

さて、前篇ではデジタルデータの長期保存が求められる背景についてお話しました。 しかし、ただ保存すればいいわけではありません。後篇では、保存期間が長期化しているからこそ、配慮すべき問題についてお話したいと思います。 冒頭に登場した「保全」が重要なキーワードです。

関連記事

  • 検査データ改ざんの原因と抜本的な防止対策について

    コラム

  • クラウドは万全ではない。-バックアップの必要性

    コラム

  • 長期化する情報資産の保存期間。いま求められるデータの「保全」(後編)

    コラム