RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

RapidMiner Go

以下はWebアプリケーション RapidMiner Go についてのドキュメントです。

RapidMiner Goはデータから予測モデルを速く、シンプルに作成できるように設計されました。必要なものは(Excelスプレッドシートのような)データセットと予測したいものだけです。とてもシンプルです!

データ内にパターンがあり、それらのパターンを発見できれば、データの一部を使用してデータの他の部分がわかるという考え方です。例えば、天気と傘の売り上げについてのデータがあれば、雨の日には傘の売り上げが上がることに気づくでしょう。天気とアイスクリームの売り上げについてのデータがあれば、暑い日にはアイスクリームの売り上げが上がることに気づくでしょう。十分なデータ量があれば、気温と他の関連データを用いて、いくつのアイスクリームが売れるか予測することもできるでしょう。さらに良いことに、関連データはあなたのコントロール下にある要因を含んでおり(天気は異なります)、もっとアイスクリームを売るためにそれらの情報を利用することも可能です。

暑さとアイスクリームの売り上げの関連はわかりやすいですが、すべての問題がこれほど単純なわけではありません。明白でない関連をどのように見つけますか? どのデータが関係しているかどのように知りますか? あなたのビジネスについては私たちよりあなたのほうが詳しく、私たちはすべての答えを与えられませんが、RapidMiner Goは明白でない関連と関連データを見つけるのが得意です。関連があると思うすべてのデータをもらえれば、私たちが残りを行います。

以下のステップで進みます。

  1. データのアップロード — 関連がありそうなすべてのデータをアップロードします。
  2. 列の選択 — 予測したい値をもつ列を選択します。
  3. 入力の選択 — 関係のないデータを削除し、関連があるデータを決めます。
  4. モデルの選択 — 作成するモデルを一つ以上選択します。

ステップ4までで、一つ以上のモデルを作成できました。この後、5. モデルの検証 を行い目的にもっとも合うものを決めます。このためには、発生しうる様々なエラーのタイプについて少し学ぶ必要があります。最小化するものや、許容するエラーなど様々なエラーがあります。

モデルを決定できれば、ついに 予測を行うときです!予測には二つのアプローチがあることを覚えておいてください。

  • モデルの適用: 新規データセットをアップロードし、予測を確認します。
  • モデルの展開: モデルを他の人やソフトウェアが利用できるようにします。