BLOG

デルのバックアップストレージ「DR4000」を使ってみました。

ipp

今回もまたデル製品のお話ですが、決して私はデルの回し者ではありませんと予め断っておきます。(笑)

先日デルより評価機でDR4000を2台お借りする機会がありましたが、
想定以上の内容でしたので皆様にも紹介したいと思います。
現在DR4000は終息しており、後継モデルのDell DR4100が発売中です。

当初担当営業からの説明であまり良い評価をされていなかった(ように見受けられました)ので、
使い始めるまで期待が薄かったのが正直なところでしたが、
実際使ってみると思ったよりパフォーマンスが良く好印象を受けました。
しかしながらお値段が少しばかり張ってしまうのが難点ではありますが。。。

 

■ DR4000のスペック
まず簡単にDR4000のスペックを紹介したいと思います。
6コアXeonを2つ搭載し、メモリは32GBで、内蔵LANが2ポート、また追加LANが2ポートあります。
ホットスワップ対応ディスクを12台搭載し、OS起動用に2台のディスクを搭載した2Uサーバーで、
PowerEdge R510/520のディスク12台モデルを流用していると思われます。

ipp
(正面パネル)
ホットスワップ対応のハードディスクをRAID6構成、計12台搭載し、
これとは別にOS起動用で非ホットスワップのハードディスクが2台搭載され、RAID1で組まれていました。
これらは全てPERC H700に接続されています。
評価機に搭載されていたハードディスクは全てSASの10000回転、300GB、計14台でしたので、
2.7 TBポストRAID(論理容量は35 TB)のモデルと思われます。

ipp
(背面パネル)
見たところPowerEdge R510/R520サーバーとさほど外観は変わりません。
電源が冗長構成でiDRACポートが用意されている他、
拡張スロットに2ポートのLANカードが1枚、また特殊なボードが1枚搭載されていました。
なぜか評価機の片方だけ6Gbps SASかH810と思われるカードが付いていました。
尚、bondingによるLANポートの負荷分散/冗長化を行っているため、
最低2ポートのLANケーブルを接続する必要があります。

dr4000_manage
(管理画面)
他のデル製品のようにOMSAに似た管理画面を採用しており、慣れた人に使いやすいインターフェースです。
専用アプライアンスで動いていますが、CentOS5をベースにカスタマイズしたOSで動いているとの事です。

 

■ DR4000の特徴とは?
バックアップストレージに位置するDR4000ですが、どのような分野を得意とするのか見ていきたいと思います。

image

・ファイルサイズの圧縮
送られてきたファイルをリアルタイムで圧縮し、必要容量を削減します。

・ブロック単位での重複除外
同一ファイル(重複データ)を除外し、必要容量を削減します。

linux環境で検証を行いましたが、
4GBのファイルを1つ置いたところ、dfコマンドでは使用容量が4GBと表示された状態で、
次に同じファイルをコピーしたところ、inodeは増加したものの、ディスク容量は増えませんでした。
※du –siでファイル容量を計算すると8GBとなります。

・NFS/CIFS/OST各サーバーとして動作
バックアップサーバーという表記ですが、実は普通のファイルサーバーとしても動作します。
LinuxクライアントからはNFSサーバーとして利用できますので、マウントして読み書きが可能です。
またWindowsマシンも同様にCIFSサーバーとして動作しますので、見た目はNASと同じです。

・同一筺体間で変更ブロックに対するレプリケーション
こちらは最低2台の機器が必要ですが、データの書き込むフォルダをコンテナとして提供しており、
複数のDR4000/4100を利用してコンテナ単位でのレプリケーションが可能です。
レプリケーションされるデータは変更点があったデータのみです。

種類 DR4000/4100 DRBD rsync
書き込み方法 NFS/CIFS/OST NFS/CIFS
(ソフトウェアの設定が必要)
NFS/CIFS
(ソフトウェアの設定が必要)
重複除外機能 × ×
圧縮機能 ×
(バッチ処理が必要)
レプリケーション方法 非同期(スケジューリング) 非同期/同期 非同期(スケジューリング)
レプリケーション単位 ブロック単位 ブロック単位 ファイル単位
差分レプリケーション
レプリケーション先の集約 多対1に対応 × 多対1に対応

システム図や比較図も併せて見て頂ければと思いますが、
既存システムの構成を変更せず、この機器を追加して利用する方法を想定しているようです。
そのため既存で使っているバックアップソフトウェアのライセンスは無駄になりませんし、
バックアップの管理方法も変わりません。

 

■ DR4000の凄いトコロ!
ここまでの紹介でDR4000/4100は筺体間レプリケーション、圧縮、重複排除機能を持ち、
既存のバックアップサーバーと連携して付加価値を持つバックアップストレージという事が分かりましたが、
他社製品にも類似した製品はあるかと思います。

そこでパフォーマンスを測ってみると驚くべき数値が出ていました。

・パフォーマンス測定方法
1. NFSサーバーとして構成したDR4000に別のマシンからNFSで接続しました。
2. ddコマンドを用いてブロックサイズ別に2GBのデータを書き込みにかかった時間の平均値を求めました。

performance_graph
(グラフの見方: 青色=mbps単位、赤色=MB/s単位で、下はブロックサイズです。)

なんと16KBのブロックサイズで書き込み速度が100MB/s以上の数値を叩きだしました!!
NFSはオーバーヘッドが大きく、速度を引き出すのが難しいのは言うまでもありません。
ましてやこの機器は重複排除や圧縮機能もあり、なぜこのような速度を出せるのか調べてみました。

・bondingによるパフォーマンス効果
複数枚のLANカードを組み合わせるbondingはパフォーマンス改善でよく使われる方法です。
ハードディスクの高速化によりLANカードがボトルネックになる事もよく見られるようになりました。

特殊なスイッチを必要とせず、OSの機能だけで利用できるbondingの効果ですが、
弊社で検証を行ったところ以下のようにパフォーマンスの向上を確認しました。

種類 1GbE
(bondingなし)
1GbE×2
(bondingあり)
1GbE×3
(bondingあり)
10GbE
(bondingなし)
10GbE×2
(bondingあり)
速度 0.94Gbps 1.40Gbps 2.44Gbps 6.1Gbps 7.5Gbps

・特殊なボードの正体
次に今までに見た事のない増設カードがDR4000には搭載されていた点に注目しました。
LEDが2つ付いており、ファイルを書き込むとディスクより先に光る事から、
キャッシュを行う何らかのカードという予測はできますが、外見はFusion-ioとも異なるため調べてみました。

そこでDR4000のマニュアルを照らし合わせた結果、以下の機器が搭載されている事が分かりました。
wam-board
・Marvell Write Acceleration Module

この機器は書き込みを高速化するアクセラレーションカードで、
以前はDragonFly Virtual Storage Acceleratorという名称でも販売されていたようです。

このモデルでは8GBのDDR2メモリと16GBのSLC-SSDを搭載し、
800MB/sの読み書きをサポートするため、ディスク側がボトルネックにならないようになっているようです。

 

システム管理者の負担を減らす嬉しい機能だけでなく、
ボトルネックとなりやすいストレージ速度を様々な視点から改良したDR4000/4100、
皆様も興味があれば是非お試しください。

その際には「株式会社みどりの技術者ラボを見てきました!」
と担当者の方にお伝えいただければ幸いです。・・・と言っても何もありませんが(笑)

さて、今回の記事で触れたディスクキャッシュはいくつかの手法がありますが、
次回はSSDと組み合わせて実現するキャッシュソフトウェアと構築方法について紹介できればと思います。

Tweet about this on TwitterShare on FacebookShare on Google+