Classic Decomposition
概要
この演算子は、時系列データの古典的な分解を実行します。
詳細
時系列は、トレンド、季節、残りの3つの異なるコンポーネントに分割できます。トレンドコンポーネントは、時系列の長期レベルを表します。季節の構成要素は、長さのreoccuringパターンは、パラメータ季節 (毎年reoccuringパターンとの月次データについて例えば12)に等しいです。残りのコンポーネントは、時系列と、トレンドおよび季節コンポーネントの組み合わせとの間の残りのローカル変動です。
分解のモードは、 相加的または乗法的のいずれかで、 分解モードパラメーターで指定できます。季節、残りの成分の大きさがトレンドレベルに依存しない場合、 添加モードは、他の乗法モードが使用されるべき、appropiateモードです。分解は、時系列(Yで示されている)を次の方法でトレンド(T)、季節(S)、および残り(R)の各コンポーネントに分割します。
- 加法:Y = T + S + R
- 乗法:Y = T x S x R
従来の分解では、元の時系列を季節性 / 2倍季節性移動平均フィルター( 季節 性が偶数の場合は2倍、不均一の場合は季節性 )で平滑化することにより、トレンド成分を計算します。元の系列をトレンドコンポーネントで減算/除算( 加法 / 乗法モード)した後、トレンド除去されたシリーズを使用して季節成分を決定します。これは、時系列全体にわたって個々のコンポーネントを平均化することによって行われます。次に、季節成分は、合計が0 / 季節性 ( 加算 / 乗算モード)になるように調整されます。残りのコンポーネントは、トレンド除去されたシリーズをシリーズコンポーネントで減算/除算( 加算 / 乗算モード)することで実現されます(長さはシリーズ全体の長さに拡張されます)。
この演算子は、数値時系列でのみ機能します。
分化
STL Decomposition
STL分解はまた、時系列をトレンド、季節、および残りのコンポーネントに分割します。黄土補間は、3つのコンポーネントを推定するための反復プロセスで使用されます。これにより、季節の成分は時間とともに大きさが変化します。また、すべての成分は時系列全体に対して明確に定義された値を持ちます。 STL分解は、加法分解のみを実行できます。
Fast Fourier Transformation
高速フーリエ変換演算子は、時系列を周波数空間に変換します。これは、顕著な振動を識別するために使用できます。たとえば、データの可能な季節成分を識別するために使用できます。
入力
- サンプルセット (IOObject)時系列データを属性として含むExampleSet。
出力
- 分解(IOObject)分解された時系列を含むExampleSet。元の時系列と傾向、季節および残りのコンポーネントは、選択されたすべての時系列に対して計算され、このExampleSetで提供されます。
- オリジナル(IOObject)入力として与えられたExampleSetは、変更なしでパススルーされます。
パラメーター
- attribute_filter_typeこのパラメーターを使用すると、時系列属性選択フィルターのフィルターを選択できます。時系列値を保持する属性を選択する方法。時系列属性として選択できるのは数値属性のみです。さまざまなフィルタータイプは次のとおりです。
- all:このオプションは、ExampleSetのすべての属性を時系列属性として選択します。これがデフォルトのオプションです。
- single:このオプションを使用すると、単一の時系列属性を選択できます。必須の属性は、属性パラメーターによって選択されます。
- subset:このオプションを使用すると、リストを介して複数の時系列属性を選択できます(パラメーター属性を参照)。 ExampleSetのメタデータがわかっている場合、すべての属性がリストに存在し、必要な属性を簡単に選択できます。
- regular_expression:このオプションにより、時系列属性選択用の正規表現を指定できます。正規表現フィルターは、正規表現パラメーターによって構成されます。excessexpressionおよびexcept expressionを使用します。
- value_type:このオプションにより、特定のタイプのすべての属性を選択して時系列属性にすることができます。型は階層的であることに注意してください。たとえば、実数型と整数型は両方とも数値型に属します。値タイプフィルターは、パラメーター値タイプによって構成されます。値タイプを除く値タイプ例外を使用します。
- block_type:このオプションにより、特定のブロックタイプのすべての属性を選択して時系列属性にすることができます。ブロックタイプは階層的であることに注意する必要があります。たとえば、value_series_startおよびvalue_series_endブロックタイプは両方ともvalue_seriesブロックタイプに属します。ブロックタイプフィルターは、パラメーターブロックタイプによって構成され、ブロックタイプを除くブロックタイプ例外を使用します。
- no_missing_values:このオプションは、ExampleSetのすべての属性を、どの例でも欠損値を含まない時系列属性として選択します。欠損値が1つでもある属性は選択されません。
- numeric_value_filter:例がすべて所定の数値条件に一致するすべての数値属性が、時系列属性として選択されます。条件は、数値条件パラメーターによって指定されます。
範囲:
- attribute必要な属性は、このオプションから選択できます。メタデータがわかっている場合は、パラメーターのドロップダウンボックスから属性名を選択できます。
範囲:
- attributes必要な属性は、このオプションから選択できます。これにより、2つのリストを含む新しいウィンドウが開きます。すべての属性が左側のリストにあります。これらは、選択した時系列属性のリストである右側のリストに移動できます。
範囲:
- regular_expressionこの式に名前が一致する属性が選択されます。式は、 正規表現の編集およびプレビューメニューで指定できます。このメニューは、正規表現の良いアイデアを提供します。また、異なる表現を試して結果を同時にプレビューすることもできます。
範囲:
- use_except_expression有効にすると、最初の正規表現の例外を指定できます。この例外は、 except regular expressionパラメーターによって指定されます。
範囲:
- except_regular_expressionこのオプションを使用すると、正規表現を指定できます。この表現に一致する属性は、最初の表現( 正規表現パラメーターで指定された表現 )に一致する場合でも除外されます。
範囲:
- value_typeこのオプションにより、属性のタイプを選択できます。次のタイプのいずれかを選択できます:数値、整数、実数。
範囲:
- use_value_type_exception有効にすると、選択したタイプの例外を指定できます。この例外は、 except value typeパラメーターによって指定されます。
範囲:
- except_value_typeこのタイプに一致する属性は、 value typeパラメーターで指定された前に選択されたタイプと一致した場合でも、最終出力から削除されます。ここでは、数値、整数、実数のいずれかのタイプを選択できます。
範囲:
- block_typeこのオプションを使用すると、属性のブロックタイプを選択できます。次のタイプのいずれかを選択できます:value_series、value_series_start、value_series_end。
範囲:
- use_block_type_exception有効にすると、選択したブロックタイプの例外を指定できます。この例外は、 except block typeパラメーターによって指定されます。
範囲:
- except_block_typeこのブロックタイプに一致する属性は、 ブロックタイプパラメータによって選択された前のタイプと一致した場合でも、最終出力から削除されます。ここでは、value_series、value_series_start、value_series_endのいずれかのブロックタイプを選択できます。
範囲:
- numeric_condition数値条件フィルタータイプで使用される数値条件。すべての例がこの属性に指定された条件に一致する場合、数値属性が選択されます。たとえば、数値条件「> 6」は、すべての例で6より大きい値を持つすべての数値属性を保持します。条件の組み合わせが可能です: ‘> 6 && <11’または ‘<= 5 || <0 ‘。しかし、&&および|| 1つの数値条件で一緒に使用することはできません。 ‘(> 0 && <2)のような条件|| (> 10 && <12) ‘は、&&と||の両方を使用するため許可されません。
範囲:
- invert_selectionこのパラメーターをtrueに設定すると、選択が逆になります。その場合、指定された条件に一致しないすべての属性が時系列属性として選択されます。 include特殊属性パラメーターがtrueに設定されていないため、 反転選択パラメーターとは無関係に特殊属性は選択されません。その場合、条件は特別な属性にも適用され、このパラメーターがチェックされている場合は選択が逆になります。
範囲:
- include_special_attributes特別な属性は、特別な役割を持つ属性です。これらは、ID、ラベル、予測、クラスター、重量、バッチです。また、カスタムロールを属性に割り当てることができます。デフォルトでは、フィルター条件に関係なく、特別な属性は時系列属性として選択されません。このパラメーターがtrueに設定されている場合、指定された条件に対して特別な属性もテストされ、条件に一致する属性が選択されます。
範囲:
- has_indicesこのパラメーターは、時系列に関連付けられたインデックス属性があるかどうかを示します。このパラメーターがtrueに設定されている場合、インデックス属性を選択する必要があります。
範囲:
- indices_attribute
パラメーターのインデックスがtrueに設定されている場合、このパラメーターは関連するインデックス属性を定義します。日付、date_time、または数値タイプの属性のいずれかです。メタデータがわかっている場合は、パラメーターのドロップダウンボックスから属性名を選択できます。範囲:
- decomposition_modeモード、さまざまなコンポーネントを組み合わせる方法。
- additive:トレンド、季節および残りのコンポーネントが時系列を構築するために追加されます:Y = T + S +R。季節および残りのコンポーネントがトレンドレベルに依存しない場合に使用されます。
- multiplicative:トレンド、季節および残りの成分を乗算して時系列を作成します:Y = T x S xR。季節および残りの成分の大きさがトレンドレベルに依存する場合に使用します。
範囲:
- seasonality季節コンポーネントの1つの季節パターンの長さ。たとえば、毎年発生する季節パターンの場合、季節性は4(四半期データの場合)、12(月データの場合)、または52(週データの場合)です。または、1時間ごとに発生するパターンの場合、季節性は60(毎分データの場合)または3600(2番目のデータの場合)です。
範囲:
チュートリアルプロセス
毎月の乳生産データセットの古典的な分解
このプロセスでは、Classic Decompositionオペレーターを使用して、毎月の乳生産データセットをトレンド、季節、および残りのコンポーネントに分割します。