特集

ITよもやま話

従来型バックアップの課題と今後の進むべき方向性

技術本部 技術事業推進部 技術開発課 永松 祐二

 唐突ではあるが、筆者は従来型のバックアップ方式は限界が近づいてきているのではないかと考えている。従来型のバックアップとは、いわゆるバックアップサーバを利用したシステムの統合バックアップ運用方式のことである。
 
 システムは通常、複数のサーバから構成されており、それぞれのサーバには保護すべきデータが保存されている。例えば、業務データであり、監査データ (JSOX対応)などである。
 考えるべきポイントは、保護の対象となるデータは複数のサーバに分散して存在するということである。そこで従来型バックアップ方式では、一旦これらのデータをネットワーク越しにあるサーバに集め、そのうえで2次記憶装置に保管、複製するという手法をとる。
 
 この手法は「IPネットワークが到達可能であれば何でもバックアップ可能」という点において非常に大きなメリットを持っている。一方で、従来型バックアップ方式にはデメリットも存在する。ネットワークが遅ければバックアップにも時間がかかるし、一括管理方式のため処理が直列になりやすいということである。
 
 従来は、このデメリットを認識しつつもある程度許容できていた。なぜなら、そこには次の2つの前提が存在していたからである。

  • i) システム(サーバ)には明確な稼働率の波が存在する
  • ii) バックアップは隙間時間で十分に完了できる。

 つまり、バックアップウィンドウ(バックアップを取得するタイミング・時間枠)は、殊更に検討するまでも無く、自ずと決まっていたのだ。

 ところが、最近のシステムでは、この前提条件が成り立たないことも多くなってきた。サーバの仮想化やクラウド化、システムのグローバル化が進み、稼働率の落ちるタイミングそのものが無くなってしまったのだ。例えばサーバ仮想化を行う場合、より多くのサーバを集約する目的で夜間の稼働率が高いサーバと日中の稼働率の高いサーバを組み合わせて1台の物理サーバに乗せるというような工夫を行う。するとサーバは常に高い稼働率を維持することになる。いわゆるバックアップウィンドウの確保ができないのである。

 また、システムの扱うデータそのものが大きくなってきたということもある。ここ数年の間に構築されたシステムであればテラバイトオーダーのデータをもつことも珍しくないのではないだろうか。これはシステムの扱うデータが多様化し、従来のように構造化されたテキストデータだけではなく、音声、画像、映像といった大容量の非構造化データを扱う必要性が出てきたことによる。これに伴い、日々のバックアップ量も非常に多くなり、短時間でバックアップを終えることが難しくなってしまった。やはり必要なバックアップウィンドウの確保ができないのである。

 ではどうすればよいのか。最も単純な方法は、データの保存先であるストレージをより高性能なものに置き換えることである。ストレージ専用のネットワークであるSAN(※1)を構築し、ディスクそのものの読み書きの速度を上げればバックアップの所要時間は短くできるし、なによりストレージ装置の多くがスナップショットやレプリケーションといった短時間で大容量のデータをバックアップする機能を備えているからである。

 しかし、ストレージ装置は非常に高価であり、システムによっては導入が難しい場合も多い。いまや、コンシューマ向けのハードディスクはテラバイト単価1万円を切ってきたが、我々SIerが導入するハードディスクやストレージ装置は依然として高止まりしたままなのだ。このような状況では大規模システムならば可能な投資も、小・中規模システムにとってはこのうえない負担となる。つまりストレージ装置は、多くのシステムにとっては、未だ簡単には手が出し難い選択肢なのである。

 そこで、筆者は次の3つの技術が今後のバックアップの設計において重要なファクタとなると考えている。

  • (i) データの重要度、鮮度による選別 (ILM ※2)
  • (ii)データの変更を追跡し、常にオンラインでレプリケーションをする(CDP ※3)
  • (iii) 重複するデータのバックアップは極力しない (Dedupe ※4)

 つまり、バックアップは従来のように空き時間に集中して行うのではなく、こまめに本当に必要なものだけを継続的に取得するという方向へ進化すべきなのだ。

 これらを実現するために高価なアプライアンス製品を入れたのでは本末転倒であるが、原則論として、情報とはその値段に見合った入れ物に保存すべきであり、重複するものは必要ない。また、一気にバックアップできないのであれば、こまめに少しずつ行えばいいのである。そのためにはデータに"値札"をつけることが重要になってくるし、「バックアップなんて空き時間にやれば十分」というような古い常識を捨て、状況に則した設計を行うことも必要だ。これからはILM/CDP/Dedupeの3つを如何に安価に効率よく実装するかということもSIerの競争力に関係してきそうだ。今こそ、これらの技術の活用に向けて、本格的な情報収集と情報の整理、検証を始める時と言えるのではないだろうか。

※1 SAN=Storage Area Network

※2 ILM=Information Lifecycle Management

※3 CDP=Continuous Data Protection

※4 Dedupe=重複排除(deduplication)

(2010年10月12日)

本ページ上に記載または参照される製品、サービスの名称等は、それぞれ所有者の商標または登録商標です。
当コラムは掲載した時点の情報であり、閲覧される時点では変更されている可能性があります。また、当社は明示的または暗示的を問わず、本コンテンツにいかなる保証も与えるものではありません。

ページトップへ戻る

JSOLへのお問い合わせ

最新のインタビュー

グローバルの視点でSCMを改革する

"グローバルERPの導入に必要な方法論や手法を体系化して数々のグローバルプロジェクトを手がけきたアプリケーションコンサルタントをご紹介します。

特集

特集SAP

SAP ERPの豊富な導入実績があり、企業の業務改革を総合的にご支援します。

特集Biz∫

人とシステムの融合による業務効率化を目指し、あらゆる企業の変革を迅速かつ確実に実現します。

特集オムニチャネル

コンサルティングからソリューションまでオムニチャネル化に向けた最適なご支援を提供します。

特集JSOLアグリ

農業生産に係る数理計画を中核に、農業生産者の経営指標の見える化と収益拡大を実現します。