RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Default Forecast

概要

この演算子は、時系列データのデフォルト予測モデルをトレーニングします。

詳細

デフォルトの予測モデルは、ホライズンウィンドウ全体で同じ予測値を予測することにより予測を実行します。このデフォルト予測モデルによって提供されるベースライン予測パフォーマンスに対して予測方法(ARIMA、Holt-Winters、Windowingなど)をテストするために使用できます。

予測値を決定する方法は、パラメーターmethodによって選択できます。時系列の最後の値を使用するか、 ウィンドウ平均、ウィンドウの 中央値、またはウィンドウの モードを使用できます 。後の3つの方法の場合、ウィンドウは常にユーザーが指定したnを使用して、時系列の最後のn個の値で構成されます(パラメーターwindow sizeを参照)。デフォルトでは、無効な値(数値時系列の欠損、正および負の無限大、名目時系列の空文字列)は、 meanmedian 、またはmodeの計算に含まれます 。パラメータで無効な値を無視するが選択されている場合、無効な値は計算で無視されます。

モードは、ウィンドウ内で最も頻繁な値として導出されます。複数の値の頻度が最も高い場合、ウィンドウ内で最初に発生する値が使用されます。 メソッド はウィンドウ内で、ウィンドウ内の 中央値は数値シリーズにのみ使用できますが、他のメソッド 日付時刻値を持つ名義および時系列に対しても機能します。 平均中央値 、またはモードの計算の詳細については、演算子抽出集約および抽出モードの演算子ヘルプを参照してください。

この演算子は、windowの メソッド last valueおよびmodeのすべての時系列(日付時刻値を含む数値、名義、および時系列)で機能します 。これらの方法 は、ウィンドウでは意味し、ウィンドウでは中央値は数値時系列でのみ機能します

分化

この演算子は他のモデリング演算子に似ていますが、時系列データで動作するように特別に設計されています。これが意味することの1つは、予測モデルがトレーニングされた同じデータに適用されるべきであるということです。

Apply Forecast

この演算子は、トレーニング済みの予測モデル(デフォルトの予測モデルなど)を受け取り、トレーニングされた時系列の予測を作成します。

ARIMA

この演算子は、時系列データでARIMAモデル(自己回帰統合移動平均)をトレーニングして、予測を実行します。

Function and Seasonal Component Forecast

この演算子は、予測を実行するために、時系列データで関数と季節予測モデル(近似関数と季節成分の値を組み合わせたもの)をトレーニングします。

Holt-Winters

この演算子は、予測を実行するために、時系列データでHolt-Wintersモデル(三重指数平滑法)をトレーニングします。

入力

  • サンプルセット (IOObject)時系列データを属性として含むExampleSet。

出力

  • 予測モデル(IOObject)指定された時系列属性から計算されたデフォルトの予測モデル。元の時系列値も含まれます。
  • オリジナル(IOObject)入力として与えられたExampleSetは、変更なしでパススルーされます。

パラメーター

  • time_series_attributeデフォルト予測モデルを構築する対象の時系列属性。必要な属性は、このオプションから選択できます。メタデータがわかっている場合は、パラメーターのドロップダウンボックスから属性名を選択できます。

    範囲:

  • has_indicesこのパラメーターは、時系列に関連付けられたインデックス属性があるかどうかを示します。このパラメーターがtrueに設定されている場合、インデックス属性を選択する必要があります。

    範囲:

  • indices_attributeパラメーターのインデックスがtrueに設定されている場合、このパラメーターは関連するインデックス属性を定義します。日付、date_time、または数値タイプの属性のいずれかです。メタデータがわかっている場合は、パラメーターのドロップダウンボックスから属性名を選択できます。

    範囲:

  • methodこのパラメーターは、デフォルト予測モデルの予測値を計算する方法を指定します。
    • 最終値:時系列の最終値が使用されます。
    • ウィンドウ内の平均:ウィンドウ化された時系列の値の平均。無効な値が無視されない場合、正または負の無限大の時系列値が欠落していると、平均は欠落します。
    • ウィンドウの中央値:ウィンドウ化された時系列の値の中央値。無効な値が無視されない場合、これらの値は中央値を決定するための有限値と同じ方法でリストされます。
    • ウィンドウ内のモード:ウィンドウ化された時系列の値のモード(最も頻繁)。複数の値の頻度が最も高い場合、ウィンドウ内で最初に発生する値が使用されます。無効な値が無視されず、無効な値が時系列で最も頻繁に発生する場合、計算されるモードはこの値です。

    範囲:

  • window_sizeこのパラメーターは、ウィンドウの平均値中央値またはモードの計算で使用される値の数を指定します。ウィンドウは常に時系列の最後のn値です。nはこのパラメーターで指定されます。

    範囲:

  • ignore_invalid_valuesこのパラメーターがtrueに設定されている場合、無効な値(すべての時系列の欠落、数値時系列の正の無限大と負の無限、名目時系列の空の文字列)は、ウィンドウの平均中央値、またはモードの計算で無視されます。

    範囲:

チュートリアルプロセス

ヒューロン湖のデータセットのデフォルトの予測

このチュートリアルプロセスでは、ヒューロン湖のデータで2つのデフォルト予測モデル(メソッド=最後の値とメソッド=ウィンドウ内の平均)をトレーニングすることにより、デフォルト予測演算子の基本的な使用方法を示します。

乳生産データに関する予測モデルのパフォーマンスを比較

このチュートリアルプロセスでは、最後の3つの値のmethod = medianを使用して、ARIMA予測とHolt-Winters予測のパフォーマンスをデフォルト予測のパフォーマンスと比較する方法を示します。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル