Amazon へのデータの転送方法
Amazon に GIS の配備を作成するには、GIS データの一部またはすべてを、インターネット経由でクラウド上の場所に転送する必要があります。このトピックでは、選択可能なクラウド上でのデータの転送場所とデータの転送方法について説明します。また、データの転送時間に影響する要素についても説明します。
データの格納場所
ArcGIS Server を実行する EC2 インスタンスを作成したら、データをクラウドに転送する準備を行う必要があります。データの格納場所として、いくつかの場所を選択できます。以下のオプションはすべて Amazon に対して料金が発生します。金額は変更される場合がありますので、変更を行う前に確認してください。
EBS ボリューム - Amazon EBS(Elastic Block Store)ボリュームは仮想的なディスク ドライブで、EC2 インスタンスにアタッチして格納域を追加することができます。ArcGIS Server AMI には、アタッチ済みの 100 GB の EBS ボリューム(GIS Data)が付属し、ドライブ D: としてマウントされています。ArcGIS Server のディレクトリはこのドライブ上に構成されます。したがって、データをサーバにコピーする方法でサービスを公開する場合、データはこの EBS ボリュームに転送されます。このボリュームに別のフォルダを作成して、データを保持することもできます。
同様に、Enterprise Geodatabase AMI でも 100 GB の EBS ボリュームがアタッチされ、PostgreSQL クラスタが格納されます。必要に応じて、これらの EBS ボリュームを削除したり、別の EBS ボリュームを追加することもできます。
Amazon S3 - Amazon S3(Simple Storage Service)は、特にクラウドでのデータ格納用に設計された Amazon サービスです。この格納オプションでは、データ障害またはデータ損失が発生する可能性が最も低くなります。S3 は、データのバックアップ場所として使用したり、オンプレミス環境と EBS ボリュームの間でデータを転送する際の中間地点として使用することができます。また、作成した EBS ボリュームのスナップショットはすべて S3 に格納されます。
- EC2 インスタンス - データを直接 EC2 インスタンスに転送することは可能ですが、インスタンスを終了すると、C: ドライブにあるデータは直ちに失われます。ArcGIS Server AMI では、このドライブにデータを格納できないように、C: ドライブに比較的小さな領域(30 GB)を割り当てています。これとは対照的に、アタッチされた EBS ボリューム(D: ドライブなど)はインスタンスを終了しても持続されるため、データを安全に格納できます。
注意:
ArcGIS Server の運用配備では、GIS データまたはマップのキャッシュを EC2 インスタンスの C: ドライブに格納しないでください。
クラウドにデータを転送する方法
オンプレミス環境からクラウドへのデータ転送には時間がかかる場合があります。場合によっては、IT セキュリティ スタッフとの調整も必要です。多くの場合、インターネット(つまり、クラウド)上の場所へのデータのエクスポートは、ローカル ネットワーク内での一般的なデータ転送よりも低速で、安全ではありません。
データはさまざまな方法でクラウドに転送できますが、重要なデータを扱う場合は IT スタッフと調整して、使用する方法が安全で、組織で承認されていることを確認してください。データ転送には以下のような方法があります。
サービスを公開するときにデータをコピーするように ArcGIS Server を構成する - サービスを公開するときに常にそのサービスのデータをサーバにコピーするように、ArcGIS Server を構成できます。データはサービス定義(*.sd ファイル)にパッケージ化された後、ArcGIS Server のアップロード ディレクトリに転送され、最終的に ArcGIS Server の入力ディレクトリに解凍されます。マップまたはその他のリソースで使用される範囲とデータセットを制限していない場合、この方法は長い時間がかかり、大量のデータが転送される可能性があることに注意してください。
リモート デスクトップでのコピーと貼り付け - Windows リモート デスクトップではファイル システムのリダイレクトが可能で、ローカル ドライブをリモート コンピュータに割り当てることができます。リモート デスクトップ経由で EC2 インスタンスにログインしている間は、Windows エクスプローラを開いて、ローカル ドライブから EBS ボリュームにデータをコピーできます。
ファイル システムのリダイレクトを有効にするには、[リモート デスクトップ接続] ウィンドウで [ローカル リソース] タブをクリックし、利用可能にするドライブのチェックボックスをオンにします。使用している Windows のバージョンによって表示が異なります。Windows 7 では、ドライブを利用可能にするオプションを表示するために、[詳細] ボタンをクリックする必要があります。
リモート デスクトップを使用して重要なデータを転送する場合は、セキュリティのレイヤが適切に追加されていることを確認してください。古いバージョンのリモート デスクトップには、サーバを装ったコンピュータがデータにアクセスできるというセキュリティの脆弱性があることがわかっています(中間者攻撃と呼ばれています)。
メモ:
コピーと貼り付けによるデータ転送は、時間がかかる場合があります。貼り付け操作が完了する前に、他のファイルやデータをコピーしないでください。操作が完了する前にコピーを行った場合は、貼り付けが途中で終了し、初めからやり直す必要があります。
S3 クライアント ユーティリティ - Amazon S3 は、オンプレミス環境から EBS ボリュームにデータを移動するための中間地点として使用できます。Amazon ソリューションだけを使用してデータを S3 に転送するには API を使用する必要がありますが、サードパーティ製のさまざまな GUI クライアントを利用すると、コードを作成せずに、ポイントとクリックだけでデータを S3 に転送できます。
このような S3 のフロントエンド クライアントには、Firefox プラグインの S3Fox Organizer や、ライトウェイトなデスクトップ アプリケーションの Bucket Explorer などがあります。これらのアプリケーションをローカル コンピュータで使用して、データを S3 に転送できます。データを S3 に転送した後、アタッチされた EBS ボリュームへ転送することで同じユーティリティを EC2 インスタンスにインストールし、これを使用できます。
独自の Web サーバ - HTTP を通して Web で 利用できるデータは、EC2 インスタンスからもアクセスできます。Web に公開されたサーバが組織内にある場合は、データをそのサーバに配置した後、EC2 インスタンスからダウンロードすることができます。この方法の利点は、Web サーバでセキュリティを構成して、データをダウンロードできるユーザを制限し、SSL を使用してトランザクションを暗号化できることです。
FTP - FTP(File Transfer Protocol)を有効にして、ファイルを直接 EC2 インスタンスにアップロードできます。標準的な FTP は情報を暗号化せず、パスワードを平文で送信することに注意してください。FTP を安全に使用するには、SSL による FTP セッションの暗号化、FTP 経由でインスタンスにデータを転送できるユーザの制限、最初のデータ転送後の FTP の無効化など、追加のセキュリティ手段を講じる必要があります。サードパーティ製の製品の中には、安全な FTP 接続を設定できるように設計されたものもあります。
AWS Import/Export - Amazon に大量のデータを転送する必要がある場合は、ポータブル ストレージ デバイスに記録したデータを Amazon に送付し、S3 へのデータの直接読み込みを Amazon に有償で依頼すると、手間がかからず費用効果も高くなる場合があります。Amazon は、このサービスを AWS Import/Export として提供しています。
AWS Import/Export の使用を検討している場合は、組織のデータ機密性に対して適切であるかどうかを判断する必要があります。デバイスを郵送する際にデータが物理的に破損したり傍受される危険性は、わずかでも常に存在します。これらのリスクは、データをバックアップおよび暗号化することにより軽減できます。データに対して AWS Import/Export が適切かどうか判断できない場合は、直接 Amazon にお問い合わせください。
Amazon はさまざまなソリューション プロバイダと連携しています。これらのサービス プロバイダの中には、データ転送、格納、およびセキュリティのソリューションを提供している企業もあります。これらの企業がクラウド戦略に役立つかどうかを判断するには、「Find an AWS Solution Provider」をご参照ください。Esri 自身もこれらのプロバイダの 1 つであり、Amazon クラウドに GIS を配備するためのさまざまなプロジェクトおよび実装サービスを提供しています。
データ転送時間に影響する要素
ここまでに説明したデータ転送方法のパフォーマンスは、Amazon クラウドへの物理的な近さ、時間帯、およびインターネットへの接続品質によって変化します。
GIS データセット(特に画像とマップのキャッシュ)は領域を大量に使用する可能性があります。場合によっては、これらを効率的に転送するために、転送前にデータセットを圧縮し、ファイルのサイズを小さくするかファイルの総数を減らす必要があります。S3 クライアント ユーティリティの一部では、転送できる 1 ファイルあたりのサイズ、または格納できるファイルの数が制限されています。また、圧縮プログラムの一部では圧縮可能なデータの量も制限されています。データ転送方法を選択する際は、圧縮にかかる時間と作業量も考慮に入れてください。
最後に、S3 を使用する場合は、作成できるバケットの数に関する制限と、S3 バケットに関するその他の制限に注意してください。これらの制限については、「Bucket Restrictions and Limitations」をご参照ください。
データ パスの整合性の維持
データを新しい場所に移動する際は常に、そのデータを参照するパスの更新が必要かどうかも注意しなければなりません。これは、さまざまなパスで多数のデータ レイヤを参照するマップ ドキュメントに関係があります。
Amazon EC2 のデータの場所を ArcGIS Server に登録すると、公開後にリンク切れのデータ パスを修正する作業を軽減できます。「ArcGIS Desktop を使用した ArcGIS Server へのデータの登録」をご参照ください。
別の方法として、インスタンスにログインし、ArcMap を使用してリンクの切れたパスを修復することもできます。ArcGIS Server AMI には ArcGIS Desktop が含まれているため、修復を簡単に行えます。マップ ドキュメントのデータ パス情報を更新する方法については、「切れたデータ リンクの修復」をご参照ください。
データ接続を修復する必要性を軽減する別の方法として、マップ ドキュメントで相対パスを使用し、マップとデータを共通フォルダに格納することもできます。