RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

STL Decomposition

概要

この演算子は、時系列データのSTL分解を実行します。

詳細

STLは「Loessを使用した季節およびトレンドの分解」の略で、時系列をトレンド、季節、および残りのコンポーネントに分割します。黄土補間( 季節平滑化 )を使用して(現在の傾向推定を削除した後)循環サブシリーズを平滑化し 、季節成分を決定します。次に、推定された季節成分を平滑化するために、別の黄土補間( ローパス平滑化 )が使用されます。最後のステップでは、季節性をなくしたシリーズを再度平滑化して( 傾向平滑化 )、傾向成分の​​推定値を見つけます。このプロセスは、コンポーネントの推定精度を向上させるために数回繰り返されます。

STL分解を実行するには、データの季節性 (たとえば、毎年繰り返されるパターンを持つ月次データの場合は12)を知る必要があります。 STL分解の利点は、季節の成分が時間とともに変化する可能性があることです。変化率は、パラメーターseason widthによって制御されます。パラメーターrobustをtrueに設定して、傾向および季節成分の計算に対する外れ値の影響を除去できます。また、STLの結果は、時系列データのすべてのポイントに対して定義されます。

演算子は、さまざまなレス補間アルゴリズムで使用されるすべてのパラメーターのデフォルト値を提供します。ユーザーは、これらのパラメーターの一部またはすべてを設定して、STL分解をさらに調整することもできます。詳細については、パラメーターの説明を参照してください。

時系列に無効な値の欠落(欠落、正および負の無限大)が含まれる場合、STL分解は定義されません。時系列にこのような無効な値が含まれる場合、3つのコンポーネントすべての結果は失われます。

この演算子は、数値時系列でのみ機能します。

分化

Classic Decomposition

Classic Decompositionは、時系列をトレンド、季節、および残りのコンポーネントに分割します。さまざまなコンポーネントを決定する方法は単純であり、傾向はしばしば過度に平滑化されるため、急激な上昇と下降は滑らかになります。また、季節性成分は時間とともに大きさが変化しません。トレンドおよび残りのコンポーネントには、移動平均フィルターを使用してトレンドコンポーネントを決定するため、系列の最初と最後に欠損値があります。それ以外の場合、クラシック分解は乗算分解を実行できます。

Fast Fourier Transformation

高速フーリエ変換演算子は、時系列を周波数空間に変換します。これは、顕著な振動を識別するために使用できます。たとえば、データの可能な季節成分を識別するために使用できます。

入力

  • サンプルセット (IOObject)時系列データを属性として含むExampleSet。

出力

  • 分解(IOObject)分解された時系列を含むExampleSet。元の時系列と傾向、季節および残りのコンポーネントは、選択されたすべての時系列に対して計算され、このExampleSetで提供されます。
  • オリジナル(IOObject)入力として与えられたExampleSetは、変更なしでパススルーされます。

パラメーター

  • attribute_filter_typeこのパラメーターを使用すると、時系列属性選択フィルターのフィルターを選択できます。時系列値を保持する属性を選択する方法。時系列属性として選択できるのは数値属性のみです。さまざまなフィルタータイプは次のとおりです。
    • all:このオプションは、ExampleSetのすべての属性を時系列属性として選択します。これがデフォルトのオプションです。
    • single:このオプションを使用すると、単一の時系列属性を選択できます。必須の属性は、属性パラメーターによって選択されます。
    • subset:このオプションを使用すると、リストを介して複数の時系列属性を選択できます(パラメーター属性を参照)。 ExampleSetのメタデータがわかっている場合、すべての属性がリストに存在し、必要な属性を簡単に選択できます。
    • regular_expression:このオプションにより、時系列属性選択用の正規表現を指定できます。正規表現フィルターは、正規表現パラメーターによって構成されます。excessexpressionおよびexcept expressionを使用します。
    • value_type:このオプションにより、特定のタイプのすべての属性を選択して時系列属性にすることができます。型は階層的であることに注意してください。たとえば、実数型と整数型は両方とも数値型に属します。値タイプフィルターは、パラメーター値タイプによって構成されます。値タイプを除く値タイプ例外を使用します。
    • block_type:このオプションにより、特定のブロックタイプのすべての属性を選択して時系列属性にすることができます。ブロックタイプは階層的であることに注意する必要があります。たとえば、value_series_startおよびvalue_series_endブロックタイプは両方ともvalue_seriesブロックタイプに属します。ブロックタイプフィルターは、パラメーターブロックタイプによって構成され、ブロックタイプを除くブロックタイプ例外を使用します。
    • no_missing_values:このオプションは、ExampleSetのすべての属性を、どの例でも欠損値を含まない時系列属性として選択します。欠損値が1つでもある属性は選択されません。
    • numeric_value_filter:例がすべて所定の数値条件に一致するすべての数値属性が、時系列属性として選択されます。条件は、数値条件パラメーターによって指定されます。

    範囲:

  • attribute必要な属性は、このオプションから選択できます。メタデータがわかっている場合は、パラメーターのドロップダウンボックスから属性名を選択できます。範囲:
  • attributes必要な属性は、このオプションから選択できます。これにより、2つのリストを含む新しいウィンドウが開きます。すべての属性が左側のリストにあります。これらは、選択した時系列属性のリストである右側のリストに移動できます。範囲:
  • regular_expressionこの式に名前が一致する属性が選択されます。式は、 正規表現の編集およびプレビューメニューで指定できます。このメニューは、正規表現の良いアイデアを提供します。また、異なる表現を試して結果を同時にプレビューすることもできます。範囲:
  • use_except_expression有効にすると、最初の正規表現の例外を指定できます。この例外は、 except regular expressionパラメーターによって指定されます。範囲:
  • except_regular_expressionこのオプションを使用すると、正規表現を指定できます。この表現に一致する属性は、最初の表現( 正規表現パラメーターで指定された表現 )に一致する場合でも除外されます。範囲:
  • value_typeこのオプションにより、属性のタイプを選択できます。次のタイプのいずれかを選択できます:数値、整数、実数。範囲:
  • use_value_type_exception有効にすると、選択したタイプの例外を指定できます。この例外は、 except value typeパラメーターによって指定されます。範囲:
  • except_value_typeこのタイプに一致する属性は、 value typeパラメーターで指定された前に選択されたタイプと一致した場合でも、最終出力から削除されます。ここでは、数値、整数、実数のいずれかのタイプを選択できます。範囲:
  • block_typeこのオプションを使用すると、属性のブロックタイプを選択できます。次のタイプのいずれかを選択できます:value_series、value_series_start、value_series_end。範囲:
  • use_block_type_exception有効にすると、選択したブロックタイプの例外を指定できます。この例外は、 except block typeパラメーターによって指定されます。範囲:
  • except_block_typeこのブロックタイプに一致する属性は、 ブロックタイプパラメータによって選択された前のタイプと一致した場合でも、最終出力から削除されます。ここでは、value_series、value_series_start、value_series_endのいずれかのブロックタイプを選択できます。範囲:
  • numeric_condition数値条件フィルタータイプで使用される数値条件。すべての例がこの属性に指定された条件に一致する場合、数値属性が選択されます。たとえば、数値条件「> 6」は、すべての例で6より大きい値を持つすべての数値属性を保持します。条件の組み合わせが可能です: ‘> 6 && <11’または ‘<= 5 || <0 ‘。しかし、&&および|| 1つの数値条件で一緒に使用することはできません。 ‘(> 0 && <2)のような条件|| (> 10 && <12) ‘は、&&と||の両方を使用するため許可されません。範囲:
  • invert_selectionこのパラメーターをtrueに設定すると、選択が逆になります。その場合、指定された条件に一致しないすべての属性が時系列属性として選択されます。 include特殊属性パラメーターがtrueに設定されていないため、 反転選択パラメーターとは無関係に特殊属性は選択されません。その場合、条件は特別な属性にも適用され、このパラメーターがチェックされている場合は選択が逆になります。範囲:
  • include_special_attributes特別な属性は、特別な役割を持つ属性です。これらは、ID、ラベル、予測、クラスター、重量、バッチです。また、カスタムロールを属性に割り当てることができます。デフォルトでは、フィルター条件に関係なく、特別な属性は時系列属性として選択されません。このパラメーターがtrueに設定されている場合、指定された条件に対して特別な属性もテストされ、条件に一致する属性が選択されます。範囲:
  • has_indicesこのパラメーターは、時系列に関連付けられたインデックス属性があるかどうかを示します。このパラメーターがtrueに設定されている場合、インデックス属性を選択する必要があります。範囲:
  • indices_attributeパラメーターのインデックスがtrueに設定されている場合、このパラメーターは関連するインデックス属性を定義します。日付、date_time、または数値タイプの属性のいずれかです。メタデータがわかっている場合は、パラメーターのドロップダウンボックスから属性名を選択できます。範囲:
  • seasonality季節コンポーネントの1つの季節パターンの長さ。たとえば、毎年発生する季節パターンの場合、季節性は4(四半期データの場合)、12(月データの場合)、または52(週データの場合)です。または、1時間ごとに発生するパターンの場合、季節性は60(毎分データの場合)または3600(2番目のデータの場合)です。範囲:
  • default_robust_calculationsこのパラメーターは、異常値を処理するための堅牢な反復のデフォルト設定を分解に含めるかどうかを定義します。内部反復の数は1に、ロバスト反復の数は15に設定されます。範囲:
  • inner_iterationsこのパラメーターは、分解コンポーネントの推定の精度を向上させるために実行される内部反復の数を定義します。範囲:
  • robust_iterationsこのパラメーターは、傾向と季節成分の推定に対する異常値の影響を減らすために実行される堅牢な(外部)反復の数を定義します。データに異常値が予想されない場合、0に設定できます。範囲:
  • season_smoothing_settingsこのパラメーターは、季節平滑化のどの設定がユーザーによって設定され、どの設定がオペレーターによってデフォルト値に設定されるかを定義します。季節平滑化には、 季節幅季節度季節ジャンプの 3つのパラメーターがあります。個々のパラメーターの効果とデフォルト設定に関する説明を参照してください。
    • default:季節の幅のみを指定する必要があります。
    • periodic:このオプションは、季節的要素が厳密に周期的であることを禁じます。 3つのパラメーターはすべて、オペレーターによって設定されます。
    • width and degree:季節の幅と季節の程度を指定する必要があります。季節のジャンプはデフォルト値に設定されます。
    • width and jump:季節の幅と季節のジャンプを指定する必要があります。季節の度合いはデフォルト値に設定されます。
    • all:3つのパラメーターすべてを指定する必要があります。

    範囲:

  • seasonal_width季節成分を決定するための黄土スムーザーの幅。 2より大きく、不均一でなければなりません。 季節幅が均等である場合、自動的に1ずつ増加します。 seasonal width大きいと、時間の経過に伴う季節成分の変化率が低下します。 seasonal smoothing settingsperiodicに 設定されている場合を除き、常に指定する必要があります。この場合、 seasonal widthは時系列の長さの100倍に設定されます。範囲:
  • seasonal_degree黄土平滑化で使用される多項式の次数。 0、1、または2であり、デフォルトは1である必要があります。 seasonal smoothing settingsperiodic設定されている場合、次数は0に設定されます。範囲:
  • seasonal_jump黄土平滑化の間にスキップされるポイントの数。 0より大きくする必要があり、デフォルトはseasonal width(ceiled)の10%です。範囲:
  • trend_smoothing_settingsこのパラメーターは、ユーザーによって設定されるトレンドスムージングの設定と、オペレーターによってデフォルト値に設定される設定を定義します。トレンドスムージングには、 trend width 、 trend degree、 trend jump 3つのパラメーターがあります。個々のパラメーターの効果とデフォルト設定に関する説明を参照してください。
    • default:3つのパラメーターすべてに対して、デフォルト値が使用されます。
    • flat:トレンドコンポーネントは強制的にフラットになります。 3つのパラメーターはすべて、オペレーターによって設定されます。
    • linear:トレンドコンポーネントは強制的に線形になります。 3つのパラメーターはすべて、オペレーターによって設定されます。
    • width:トレンドの幅のみを指定する必要があります。
    • 度:傾向度のみを指定する必要があります。
    • jump:トレンドジャンプのみを指定する必要があります。
    • width and degree:トレンドの幅とトレンドの度合いを指定する必要があります。トレンドジャンプはデフォルト値に設定されます。
    • width and jump:トレンドの幅とトレンドのジャンプを指定する必要があります。トレンドの程度はデフォルト値に設定されます。
    • degree and jump:トレンドの度とトレンドのジャンプを指定する必要があります。トレンドの幅はデフォルト値に設定されます。
    • all:3つのパラメーターすべてを指定する必要があります。

    範囲:

  • trend_widthトレンド成分を決定するための、より滑らかな黄土の幅。 2より大きく、不均一でなければなりません。trend widthが偶数の場合、自動的に1ずつ増加します。trend widthは、トレンドコンポーネントの平滑化効果を高めます。trend smoothing settings がflat またはlinear 設定されている場合、trend widthは時系列のseasonality 長さの100倍に自動的に設定されます。ユーザーが指定しない場合、trend widthデフォルトでfloor(1.5 x seasonality  /(1-1.5 / seasonal width )+ 0.5)になります。範囲:
  • trend_degree黄土平滑化で使用される多項式の次数。trend smoothing settingsflat またはlinear 設定されている場合、trend widthは自動的に0( flat )または1( linear )に設定されます。範囲:
  • trend_jump黄土平滑化の間にスキップされるポイントの数。 0より大きくする必要があり、デフォルトはtrend width 10%(上限)です。範囲:
  • lowpass_smoothing_settingsこのパラメーターは、ユーザーによって設定されるローパススムージングの設定と、オペレーターによってデフォルト値に設定される設定を定義します。ローパススムージングには、 lowpass widthlowpass degreelowpass jump 3つのパラメーターがあります。個々のパラメーターの効果とデフォルト設定に関する説明を参照してください。
    • default:3つのパラメーターすべてに対して、デフォルト値が使用されます。
    • width:ローパス幅のみを指定する必要があります。
    • 度:ローパス度のみを指定する必要があります。
    • jump:ローパスジャンプのみを指定する必要があります。
    • width and degree:ローパスの幅とローパス度を指定する必要があります。ローパスのジャンプはデフォルト値に設定されます。
    • width and jump:ローパス幅とローパスジャンプを指定する必要があります。ローパス度はデフォルト値に設定されます。
    • degree and jump:ローパス度とローパスジャンプを指定する必要があります。ローパス幅はデフォルト値に設定されます。
    • all:3つのパラメーターすべてを指定する必要があります。

    範囲:

  • lowpass_width時系列データから季節成分を平滑化する(および除去する)ための、より滑らかな黄土の幅。 2より大きく、不均一でなければなりません。 lowpass widthが偶数の場合、自動的に1つ増加します。ユーザーが指定しない場合、 lowpass widthデフォルトでseasonityになります範囲:
  • lowpass_degreeレススムージングで使用される多項式の次数。 0、1、または2である必要があり、デフォルトは1です。範囲:
  • lowpass_jump黄土平滑化の間にスキップされるポイントの数。 0より大きくする必要があり、デフォルトはローパス幅の 10%(上限)です。範囲:

チュートリアルプロセス

毎月の乳生産データセットのSTL分解

このプロセスでは、STL分解演算子を使用して、毎月の乳生産データセットをトレンド、季節、および残りのコンポーネントに分割します。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル