このページの本文へ

ここから本文

  1. Home
  2. コンピュータ発掘
  3. 1990年代、PCサーバーによる超高速データ分析を実現したDIAPRISM開発秘話

Digging the computer Vol.2

1990年代、PCサーバーによる超高速データ分析を実現したDIAPRISM開発秘話(前編)

2022年9月

左から鈴木氏、伏見氏、森田氏、米田氏

左から鈴木氏、伏見氏、森田氏、米田氏

データ集計で数十〜百倍の圧倒的な処理速度を実現

三菱電機が1998年に発売した「DIAPRISM(ダイアプリズム)」は、PCサーバーによるデータ集計や分析で桁違いの高速化を実現し、市場に大きなインパクトを与えました。その性能は例えば他社製データベースでは420秒かかる集計処理を10秒で完了するほどの圧倒的なものでした。

当時は大容量データの高速処理には極めて高価な超並列コンピューターや汎用機が使われることが多く、PCサーバーによる高速処理を実現したDIAPRISMはビジネスにおけるデータ分析を身近なものにしました。

当時、開発チームのリーダーを務めていた伏見信也氏はプロジェクトの始まりを次のように振り返ります。

「開発は1995年頃にスタートしました。DIAPRISMの前にオフィスコンピュータ(オフコン)のデータベース処理を高速化する「GREO(グレオ)」という製品があり、これを共同で開発した東京大学の喜連川優助教授(当時)から、さらに高速化してPCサーバーのようなオープンプラットフォームに載せようといわれたのがDIAPRISMに取り組むきっかけでした。当時はデータを活用した意思決定や、そのためのシステムであるDWH(DataWarehouse)が注目され始めており、データを中心とした事業に取り組むことを検討していました。その中で、高速データ分析には将来性があると思いました」

ハードウエアソートでアルゴリズムの限界を突破

当時のハードウエアで高速処理を実現するためにブレークスルーが必要となり、2つの独自技術が投入されました。1つは集計、分析処理に不可欠なデータの並び替えを高速化するハードウエアソータ「DIAPRISM/SS」です。DIAPRISM/SSは、前述のGREOをコンパクトかつ高性能にしたもの。GREOは約30cm角の大きな基板でしたが、DIAPRISM/SSはPCサーバー内の拡張スロットに収まるように大幅に小型化されました。

「データの並び替え処理は、ソフトウエアではアルゴリズム的にこれ以上速くできないという限界が決まっていて、データ量に応じて処理時間も長くなります。しかしDIAPRISM/SSでは、データを投入し終わった直後に結果が出力されます。当時は入口からデータを入れると出口からソートされて出てくる“土管”のような物と表現していました」(伏見氏)

1999年1月に発売されたDIAPRISM業界標準のソートベンチマークであるDatamationベンチマークにおいて、2000 年の世界最高性能値を達成したDIAPRISMハードウエアソータボード。その時に獲得したDatamationベンチマークアワード・トロフィー

1999年1月に発売されたDIAPRISM
業界標準のソートベンチマークであるDatamationベンチマークにおいて、2000 年の世界最高性能値を達成したDIAPRISMハードウエアソータボード。その時に獲得したDatamationベンチマークアワード・トロフィー

独自のデータ配置技術と専用I/O プロセッサで
PCI バスの渋滞を回避

大容量データ処理のボトルネックとなったのがCPUとメモリや周辺機器を結ぶバスの転送速度でした。そこで開発されたのが、ディスク上のデータベースから必要なフィールドのみを読み込める独自のデータ配置と、データベース処理の前半部分を専用のI/O プロセッサ「DIAPRISM/SP」で並列処理する技術です。

「これはチームにいたエンジニアが考えたものです。彼は大量のデータがあっても、多くの場合、欲しいデータはその一部だけであることに着目し、必要なデータだけをバスに通す方法を追求しました。これによりデータ転送量を大幅に削減できました。最初に聞いた時は、よくそんなコトを思いつくものだと驚きました」(伏見氏)

現在とは開発環境も大きく異なっていました。ミドルウエアの開発を担当していた森田登氏は当時を次のように振り返ります。

「専用ハードを搭載したマシンは研究所にしかなく、マシンが空いている時間を選んで研究所に出向いて使用しました。当時は仮想環境などありませんから、実行環境を変更する時はOSなどもすべてインストールし直しです。当時はそれが当たり前でしたが、今考えると大変でしたね」

試行錯誤の末に完成したDIAPRISMは1998年に市場に投入され、いよいよ実際のビジネスの現場でその力を試されることになります

Digging the computer Vol.2

1990年代、PCサーバーによる超高速データ分析を実現したDIAPRISM開発秘話(後編)

2022年12月

左から鈴木氏、伏見氏、森田氏、米田氏

左から鈴木氏、伏見氏、森田氏、米田氏

本当に計算しているのか? と疑われた高性能

PCサーバー上で一般的なデータベースの数十〜百倍の集計・分析速度を実現した「DIAPRISM(ダイアプリズム)」は、1998年に発売されると市場から大きな驚きをもって迎えられました。ちなみに“DIAPRISM”というネーミングは開発リーダーである伏見氏の発案でした。

販売促進を担当していた鈴木雅也氏は展示会などでの顧客の反応を次のように語ります。

「DIAPRISMはMicrosoft Excelのアドインツールを使って大容量データの集計ができました。本来のExcelでは不可能な100万件以上のデータ集計が1、2秒で終わるのを見て、お客様は大変に驚いていました。本当に集計しているのか?と聞かれることも多かったです。また、お客様が普段お使いのデータをお借りしてのデモストレーションはとても効果的でした」

食品スーパーなどの流通・小売業界のニーズにマッチ

販売ターゲットとしては、データをたくさん持っているところが想定されました。有力な候補として挙がったのが流通・小売業界でした。

「日本には、どの地方にも独立系の食品スーパーのチェーンがあります。当時からスーパーにはPOSやポイントカードが普及しており、大量のデータを分析するニーズがあると考えました」(伏見氏)

実際、DIAPRISMの高速性や導入のしやすさは、地方の食品スーパーのニーズにマッチしていました。各地での販促やサポート活動を通して多くのことを学んだと森田氏は語ります。

「例えば、どんなスーパーがDIAPRISMの見込み客として有望か、お客様に教えていただきました。チェーン店も数店舗までならデータを見なくても勘と経験で売れ筋商品が分かる。しかし10店舗くらいから人の手には負えなくなる。だからそれくらいの規模になったばかりのところに持っていくと売れるはずだ、といったアドバイスです」

現在は、流通大手や、大規模ショッピングモールなどで発生する大量データに対しても、商品分析、顧客分析等の用途で活用いただいています。

DIAPRISM 3つの特長 (2000年代後半)

DIAPRISM 3つの特長 (2000年代後半)

完全ソフトウエア化を経て現在のAnalyticMart へと受け継がれる

DIAPRISMは時代に合わせて進化していきました。大きな変化のひとつが2005 年の完全ソフトウエア化です。PCサーバーの飛躍的な性能向上に合わせて専用ハードウエアは不要になりました。また、DIAPRISMと並行してログ分析に特化した「LogAuditor」という製品も発売されました。

2011 年からはブランド名が「AnalyticMart」に統一されました。AnalyticMart は高速処理をはじめとするDIAPRISMの特徴を受け継ぎながら、現代の技術やニーズに合ったソリューションに進化しています。具体的には、IoTなどによるデータの増加への対応として、サーバー並列化によるスケーラビリティ強化や、個人情報など機密性が高いデータを暗号化するセキュリティー強化を行っています。また、近年では、標準SQLインタフェースを有するPostgreSQLを介してAnalyticMartを利用することが可能となり、アプリケーションとの接続性も向上しています。

AnalyticMart のSEである米田定義氏は次のように語ります。

「AnalyticMartの提案時に、今でもハードウエア処理ですか?と聞かれることがあり、DIAPRISMがとても印象深い製品だったことを実感します。今後は様々なBIツールとの連携やSaaSでの提供、AIやディープラーニングを使った予測など、お客様がより便利に使えるツールとして発展させていきたいと思います」

技術と顧客のギャップを埋められるエンジニアになって欲しい

技術的にもビジネス的にも成功したDIAPRISMですが、伏見氏はもう少し早い段階から顧客の目線に立って開発すべきだったと振り返ります。

「当時は技術を追求することに夢中で、それが何に使えるのかという、技術と顧客の間を埋める作業が後回しになっていたと思います。技術的に優れているだけでなく、お客様の問題を解決して初めて製品としての価値が生まれます。現役のエンジニアの皆さんには、ぜひともそのギャップを埋められる存在になっていただきたいと思います」

プロフィール

三菱電機株式会社シニアアドバイザー 伏見 信也

三菱電機インフォメーションネットワーク株式会社 クラウドプラットフォーム事業部クラウド開発部 次長 鈴木 雅也

三菱電機インフォメーションネットワーク株式会社 クラウドプラットフォーム事業部 データソリューション部管理課 シニアアド バイザー 森田 登

三菱電機インフォメーションネットワーク株式会社 クラウドプラットフォーム事業部 データソリューション部技術第二課 米田 定義