ForgeVision Engineer Blog

フォージビジョン エンジニア ブログ

Data Migration Box(DMB)を使って GoogleDrive へデータ移行してみた

こんにちは、プラットフォームビジネスグループ 浜口です。
今回は Data Migration Box(DMB)を使った Google Drive へのデータ移行について紹介したいと思います。

はじめに

オンプレ環境からクラウドストレージへの移行を検討する企業は少なくないと思いますが、 今回は移行先候補の一つでもある Google Drive に「Data Migration Box」を使ってデータ移行してみたいと思います。

Data Migration Boxとは

Data Migration Box(DMB)は、オンプレミス環境からクラウド環境、またはクラウド環境間でのデータ移行を簡単かつ高速に行えるツールです。

DMB

移行概要

検証機2台を用意し、検証機それぞれにインストールしたDMBを使って検証機1台または検証機2台で並行してGoogleDriveへデータを移行します。

移行概要

インストール

DMBをインストールしていきます。
今回検証するVer.5.8での動作環境は以下になります。

DMB動作環境

  1. インストーラーを起動する
    「DataMigrationBox-Installer.exe」を起動します。

    DMBインストーラー起動

  2. インストールを実行する
    「セットアップウィザード」画面の指示に従い、インストール作業を進めます。
    使用言語の指定、ライセンス契約内容確認、インストール先指定などを行います 。

    言語の指定
    ライセンス契約書
    インストール先

  3. インストールを終了する
    「セットアップの完了」画面が表示されましたら、[完了] ボタンをクリックします。

    セットアップの完了

  4. ライセンス認証をする
    セットアップが完了すると、「Data Migration Boxのアクティベート」ウィンドウが表示されます。
    ライセンス証書に記載されている【アクティベーションコード】を入力してください。

    ライセンスアクティベート

データ同期方式

移行元と移行先のデータ同期の方式は5種類あります。
今回は「更新」の方式で検証してみます。

同期方式 利用シーン
ミラー はじめてオンプレからクラウドに同期をする場合に使用します。
注意:クラウド側にのみ存在するファイルやフォルダは削除されます。
ミラー更新 クラウド側に既にファイルがあり、更新されている場合、そのファイルを残してオンプレのファイルをコピーします。
注意:クラウド側にのみ存在するファイルやフォルダは削除されます。
更新(一方向差分同期) クラウド側に既にデータを移行済であり、オンプレ側で追加、更新されたファイルをクラウド側にコピーします。
双方向(双方向差分同期) クラウド側に既にデータを移行済であり、オンプレ側で追加、更新されたファイルをクラウド側にコピーします。また、クラウド側で追加、更新されたファイルをオンプレ側にコピーします。結果左右同一になります。
カスタマイズ ユーザーによる、上記の自由な選択・組み合わせ。各同操作をプルダウンメニューから選択して設定します。

データ同期設定

  1. 「同期」を選択し、「新しい同期を作成」を選択します。

    新しい同期を作成

  2. 同期画面左側に移行元のフォルダパスを指定し、同期画面右側に移行先のフォルダを指定して、「設定」のボタンを選択します。

    同期画面

  3. 同期設定画面で「更新」を選択して「OK」を選択します。

    同期設定

  4. 同期画面で「保存」を選択し、同期名を指定して「OK」を選択することで同期設定を保存出来ます。

    同期設定保存

スケジュール設定

  1. 「スケジューラ」を選択し、「新規タスク」を選択します。

    スケジューラ 新規タスク

  2. 先ほど保存した同期を選択し、「トリガー」で実行したスケジュールを指定します。

    スケジュールされたタスク

データ移行

スケジュールで実行された同期が完了すると、ログファイルと同期のレポートが確認出来ます。

ログファイル
同期レポート

帯域制御

スケジュールの設定で「帯域制限を有効にする」にチェックを入れて帯域幅スケジューラーで帯域を指定することで、スケジュールで実行された同期の帯域制御が出来ます。

帯域幅スケジューラー
パフォーマンスモニターで「Network Interface」の「Bytes Sent/sec」を収集することで帯域が制御されていることが確認出来ました。
パフォーマンスモニター

性能確認結果

ファイル数が多い場合のデータ移行の転送速度を比較してみました。

並列数 100MB
(100KB×1024ファイル)
1GB
(100KB×10240ファイル)
10GB
(100KB×102328ファイル)
1アカウント
PC1台
移行時間:04:42
転送速度:2.84Mbps
移行時間:44:46
転送速度:3.04Mbps
移行時間:07:49:44
転送速度:2.91Mbps
2アカウント
PC1台
移行時間:02:10, 02:15
転送速度:3.08, 2.96Mbps
移行時間:21:27, 21:52
転送速度:3.11, 3.05Mbps
移行時間:3:38:34, 3:44:07
転送速度:3.12, 3.05Mbps
1アカウント
PC2台
【検証機#1】
移行時間:02:16
転送速度:2.94Mbps
【検証機#2】
移行時間:02:10
転送速度:3.08Mbps
【検証機#1】
移行時間:21:48
転送速度:3.06Mbps
【検証機#2】
移行時間:21:28
転送速度:3.01Mbps
【検証機#1】
移行時間:3:41:06
転送速度:3.09Mbps
【検証機#2】
移行時間:4:22:02
転送速度: 2.61Mbps
2アカウント
PC2台
【検証機#1】
移行時間:01:22, 01:24
転送速度:2.44, 2.38Mbps
【検証機#2】
移行時間:01:16, 1:05
転送速度:2.63, 3.08Mbps
【検証機#1】
移行時間:12:25, 11:57
転送速度:2.68, 2.79Mbps
【検証機#2】
移行時間:12:28, 10:57
転送速度:2.67, 3.04Mbps
【検証機#1】
移行時間:01:56:36, 1:51:21
転送速度:2.86, 2.99Mbps
【検証機#2】
移行時間:1:50:53, 1:48:24
転送速度:2.61, 3.15Mbps

転送速度はファイル数に関係なく3Mbps前後でした。
(ネットワーク速度は、速度測定サイトでアップロードが、180~300Mbps程度出ている環境で今回の検証を実施しております。)
並列処理数を増やすことでの転送速度への影響は少なく、並列処理数を増やすことで移行にかかる時間を短縮できる傾向があります。
(2アカウント2PCの移行時間は1アカウント1PCの約1/4)

Migration Explore

DMBには導入をサポートする「Migration Explore」というツールがあり、このツールを使うことで移行するデータに問題がないか調査し、調査結果をcsvやExcel形式で保存することが出来ます。
Migration Exploreでは、対象フォルダ配下のファイル数やサイズ、パス長、アクセス権限などの項目を調査出来ることを確認しました。

MigrationExplore

まとめ

■今回GoogleDriveにデータ移行してみて感じた点は以下になります。

  • 移行するデータ総量のファイルサイズが小さくてもファイル数が多ければ移行時間がかかりますが、並列数を増やすことで移行にかかる時間を短縮できる傾向があると思われます。
  • Migration Exploreを使うことで、事前調査での作業者の作業負荷を軽減することが出来きそうです。