デル株式会社 エンタープライズ・ソリューション & アライアンス部門にて、ビッグデータ ビジネス開発を担当している

 堀田 鋭二郎 と申します。 

 

ビッグデータの活用においては、データの収集、蓄積、処理、分析、それぞれの技術 を押さえる必要があります。  

 

デルのソリューションが主に得意とするデータの収集・蓄積・処理に加え、分析の観点においても多くの課題を解決してきました。今回は、その課題解決の一助となるべく、

オープン・スタンダード・クラウド・アソシエーション (OSCA™) のメンバーで、当社デルの日本におけるパートナー様でもあり、

データマイニングやビジネスアナリティクスなどのプロアクティブな分析環境をご提供されているデータ分析スペシャリスト企業である株式会社KSKアナリティクス様よりデータ分析・活用の観点でご投稿いただきます。

 

当社で多くの実績がございますHadoopともKSKアナリティクス様がご提供する商材は非常に相性が良いため、最適な分析環境を如何に構築し運用すべきか?ご相談いただくケースが多くございます。

また、当社のBigdata/IoT ラボにおいては、お客様が抱えるBigdata/IoTにおける課題解決の一助のため、各種デモ、ワークショップも共同で実施させていただいております。  

 

以下、昨今、非常にお問い合わせが多い機械の稼働ログ(センサデータ)を使った故障予測について非常に興味深い記事内容でございますので、是非ご一読ください。

 

  

 

 

 初めまして。今回からデータ分析と分析処理基盤について記事を投稿させていただきます、株式会社KSKアナリティクス データアナリストの足立と申します。

 

 昨今の「ビッグデータ」「IoT」「人工知能」ブームにより、自社で収集・蓄積したデータを分析・活用し、ビジネス価値を創出したいとお考えの企業さまが増えています(図1)。

では、データからどのような価値が生まれるのでしょうか?例えば・・・

 

・工場の生産ラインに搭載されたセンサデータから機械・設備の故障を予測・異常を検知し、メンテナンス計画を最適化しコストを削減する。

・購買履歴データから顧客の離反を予測し離反を防止する対策を立てる。また、商品の推薦(レコメンデーション)を行い顧客ごとに最適な提案を行う。

・コールセンターに寄せられる消費者の声からクレーム要因を特定・満足度を見える化し、製品・サービスの品質の向上につなげる。

 

 このように、データの分析・活用に取り組むことで、売上拡大やコスト削減が見込めるのです!

 

しかし一方で、データ分析・活用が思うように進まないといった声も挙がっています。その要因は分析ソフトの導入コストや、分析・活用するスキルとその人材などが挙げられます(図2)。 

 

https://www.gartner.co.jp/press/html/pr20150525-01.html

 

 本連載では、オープンソースであり無料で使え、GUI操作で(プログラミング不要)で簡単にデータ分析できるRapidMinerについてご紹介します。

RapidMinerを使えば、初期導入コストや人材教育コストを低く抑えてスタートを切ることができます!

 

 それでは、RapidMinerを使った分析と処理基盤について、以下のポイントに焦点をあてご紹介します。

 

1.ドラッグ&ドロップで簡単にデータ分析

2.世界中で使用・高い評価を獲得

3.ビッグデータ対応と分析処理基盤

 

1.ドラッグ&ドロップで簡単にデータ分析できる

 RapidMinerはデータ統合機能、加工・整形(ETL)機能、分析(機械学習)機能、レポーティング機能を備えた統合型プラットフォームです。

 各機能は「オペレータ」と呼ばれる箱で表現されており、オペレータをマウスのドラッグ&ドロップで移動させ、分析に必要な処理を組み立て実行します。

 

 例えば、機械の稼働ログ(センサデータ)を使って故障予測を行いたい場合、どのような分析処理が必要でしょうか?(図3)

 

図3:機械の稼働ログ(センサデータ)

 

 ここでは、分析手法としてよく使われる決定木(Decision Tree)アルゴリズムを使って、機械が故障するパターン(ルール)を見つけ出します(図4)。

 

図4:機械が故障するパターン(ルール)の検出

 

図5:機械が故障するパターン(ルール)を可視化

 

 ここで生成された故障のパターンは「センサ4の値が3.487を超え、かつセンサ5の値が3.232を超え、かつセンサ2の値が25.034以下の機械は故障する」ことを示しています(図5)。

ここで生成された正常と故障のパターンを使えば、将来故障する機械を予測することができます。

 

図6:パターン(ルール)を当てはめて故障する機械を予測

 

  

prediction(状態)列には、機械が正常/故障の予測結果が格納されています。 

また、confidence(正常)とconfidence(故障)列には、機械が正常/故障を判断した信頼係数(RapidMiner内での計算結果)が格納されています (図6)。

このように、RapidMinerを使えば、簡単にデータ分析でき可視化も行えます。 

今回は機械の故障予測を例に採り上げましたが、購買履歴データから離反する顧客を予測する、商品の推薦(レコメンデーション)を行う、消費者の声データからクレーム要因を特定するなど、他の分析も行えます。

 

 以上、本内容ではRapidMinerを使って簡単に分析できることをご紹介しました。

無料で使える分析ソフトなので、ぜひダウンロードして分析をお試しください!KSKアナリティクスではRapidMinerの情報サイトを公開しており、ソフトもダウンロードしていただけます。 

RapidMiner日本正規代理店-KSK Analytics, RapidMiner Japan Partner- http://www.rapidminer.jp/

 

 また、ビッグデータ・IoT・人工知能に関するニュースや事例を知りたい!とお考えの方はこちらのサイトもご覧ください。

ビッグデータ・IoTの分析・活用ための、最新事例やノウハウ、技術情報を提供する「Analytics News(アナリティクスニュース)」http://analytics-news.jp/

 

次回は、「2.世界中で使用・高い評価を獲得」と「3.ビッグデータ対応と分析処理基盤」についてご紹介します。

次回もどうぞお付合いください!

 

 

 

以上、株式会社KSKアナリティクスにおける第1回目の投稿でした。

 

 今回の記事の内容についてのご質問、自社のデータを分析して活用したい等のお問合せ、デルが実現するビッグデータ関連の内容についてご質問等あれば、どうぞ遠慮なくご連絡ください。

喜んで!我々からご説明の機会をいただきたいと思います。 

 

【関連ブログ】

Bigdata/IoTの取り組み -(第2回)オープンソースで始めるデータ分析と活用-誰もが当たり前にデータを分析・活用できる時代がやって来る!?-

 

 

 

 

 

--------------------------------------------------------------

株式会社KSKアナリティクス

【事業内容】

1. ビジネステクノロジー事業

オープンソースの分析ソフトウェアを活用したBI/BAシステムの導入サポート/活用支援

2. データサイエンス事業

統計や機械学習を活用したデータ解析コンサルティングや分析教育プログラムの提供

3. 分析プラットフォーム事業

オープンなテクノロジーによる統合分析プラットフォームの運営とサービス提供

 

【東京オフィス】

〒104-0045 東京都中央区築地2-7-10 築地シティプラザ6F

TEL:03-6228-4932 FAX:03-6228-4953 MAIL:sales@ksk-anl.com

 

【大阪オフィス】

〒541-0053 大阪市中央区本町1-1-3 本町橋西ビル2F

TEL:06-4705-7607 FAX:06-4705-7602 MAIL:sales@ksk-anl.com

 

【Facebook】https://www.facebook.com/KSK-Analytics-183606811675800/

【Twitter】https://twitter.com/ksk_anl_info

【SlideShare】http://www.slideshare.net/ksk-ada/presentations