RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

モデルの適用

新規データセット

モデルを作成したときは、事前に答えを知っていました。例えば、 広告から売り上げを予測するモデルを作成したときは、テレビやラジオ、新聞の広告予算を知っており、結果の売上がわかっていました。そのような情報がなければ、モデルを作成する明確な方法はありませんでした。

Advertising.csv

TV radio newspaper sales
1 230.1 37.8 69.2 22.1
2 44.5 39.3 45.1 10.4

モデルを作成したら、答えを提供するのがモデルの仕事です。そのためには、入力として、モデルの作成に用いたデータと互換性のある新規データが必要です。

  • モデルを作成するときに 選択した入力データと同じタイプのデータ列を含んでいなければなりません。
  • モデルを作成するときに 選択しなかった入力データ と同じタイプのデータ列は無視するでしょう。
  •  目的変数と同じタイプのデータ列を無視し、予測が行われるでしょう。

Advertising.csvでは、一列目はIDと定義され選択されなかったため、一列目は不要です。目的変数は”sales”で、将来の値は未知です。

来期の広告キャンペーンの予算を計画しており、三つの案があると仮定します。モデルに以下のデータを適用することで、それぞれの”sales”を予測でき、結果を比較できます。

広告予算の三つの案

TV radio newspaper
200 0 100
250 50 0
300 0 0

学習データの値の範囲内からこれらの値が選ばれたことに注意してください。

  • テレビ: 0 – 300
  • ラジオ: 0 – 50
  • 新聞: 0 – 114

範囲外の値をもとに予測を行いたい場合は、テストデータへ起こっていたより大きな誤差が発生しそうです。

新規データセットへのモデルの適用

以下のどちらかの方法で新規データセットへモデルを適用可能です。

  1. すぐに。モデルを作成し終わった後、 結果の検証内から行います。もしくは
  2. あとで。 ホーム > Manage recent analyses(最近の分析の管理)より最近の分析をクリックします。

一つ分析を選ぶと、

  1. モデルを一つ選択します(ここでは Decision Tree)
  2.  Apply Model(モデルの適用)をクリックし、ドロップダウンメニューから Apply to new data set(新規データセットへの適用) を選択します
  3.  Add Data(データの追加)をクリックし新規データセットをアップロードします。
  4. 新規データセットが表示されると、 Calculate Predictions(予測の計算)をクリックします
  5. 予測と一緒に新規データセットが表示されます

今回の広告予算の三つの案について、明らかな勝者がいます!予測モデルは、売上予測を最も大きくするには、ラジオ広告に最も投資すべきと示しています。テレビと新聞広告は、少なくともこれらの例の中では重要度が落ちるようです。

テーブルをExcel形式(prediction_result.xlsx)でダウンロードしたい場合は、 Export(エクスポート) ボタンをクリックします。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル