RapidMiner Go
以下はWebアプリケーション RapidMiner Go についてのドキュメントです。
RapidMiner Goはデータから予測モデルを速く、シンプルに作成できるように設計されました。必要なものは(Excelスプレッドシートのような)データセットと予測したいものだけです。とてもシンプルです!
データ内にパターンがあり、それらのパターンを発見できれば、データの一部を使用してデータの他の部分がわかるという考え方です。例えば、天気と傘の売り上げについてのデータがあれば、雨の日には傘の売り上げが上がることに気づくでしょう。天気とアイスクリームの売り上げについてのデータがあれば、暑い日にはアイスクリームの売り上げが上がることに気づくでしょう。十分なデータ量があれば、気温と他の関連データを用いて、いくつのアイスクリームが売れるか予測することもできるでしょう。さらに良いことに、関連データはあなたのコントロール下にある要因を含んでおり(天気は異なります)、もっとアイスクリームを売るためにそれらの情報を利用することも可能です。
暑さとアイスクリームの売り上げの関連はわかりやすいですが、すべての問題がこれほど単純なわけではありません。明白でない関連をどのように見つけますか? どのデータが関係しているかどのように知りますか? あなたのビジネスについては私たちよりあなたのほうが詳しく、私たちはすべての答えを与えられませんが、RapidMiner Goは明白でない関連と関連データを見つけるのが得意です。関連があると思うすべてのデータをもらえれば、私たちが残りを行います。
以下のステップで進みます。
- データのアップロード — 関連がありそうなすべてのデータをアップロードします。
- 列の選択 — 予測したい値をもつ列を選択します。
- 入力の選択 — 関係のないデータを削除し、関連があるデータを決めます。
- モデルの選択 — 作成するモデルを一つ以上選択します。
ステップ4までで、一つ以上のモデルを作成できました。この後、5. モデルの検証 を行い目的にもっとも合うものを決めます。このためには、発生しうる様々なエラーのタイプについて少し学ぶ必要があります。最小化するものや、許容するエラーなど様々なエラーがあります。
モデルを決定できれば、ついに 予測を行うときです!予測には二つのアプローチがあることを覚えておいてください。