RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Moving Average Filter

概要

この演算子は、1つ以上の時系列属性の値に移動平均フィルターを適用します。

詳細

フィルタリングされた値は、この値の周りのウィンドウの加重合計によって計算されます。フィルターの重みは、フィルターの種類フィルターのサイズ、左の フィルターサイズ、右の フィルターサイズ 、およびフィルターサイズによって定義されます。

フィルタータイプ binomおよびspencers 15ポイントは対称ウィンドウですが、 単純なフィルターの場合、フィルターの左側と右側のサイズを個別に指定できます。

欠損値がフィルターウィンドウにある場合、結果のフィルター処理された値も欠損値です。 1つ以上の正の無限大値がフィルターウィンドウにある場合、結果のフィルター処理された値も正の無限大です。負の無限大値についても同じです。負の無限大値と正の無限大値の両方がある場合、結果のフィルター処理された値は失われます。

フィルターウィンドウが時系列の外にある値(時系列の開始時と終了時)では、結果のフィルター処理された値は欠損値に設定されます。

この演算子は、数値時系列でのみ機能します。

入力

  • サンプルセット (IOObject)時系列データを属性として含むExampleSet。

出力

  • サンプルセット(IOObject)移動平均フィルターを適用した後のExampleSet。属性が上書きされる場合、元の時系列属性は上書きされますが、フィルターされた値を持つ新しい属性は追加されません。新しい属性の名前については、新しい属性postfixパラメーターで指定された後置が元の属性の名前に追加されます。他の属性は変更されません。

パラメーター

  • attribute_filter_typeこのパラメーターを使用すると、時系列属性選択フィルターのフィルターを選択できます。時系列値を保持する属性を選択する方法。時系列属性として選択できるのは数値属性のみです。さまざまなフィルタータイプは次のとおりです。
    • all:このオプションは、ExampleSetのすべての属性を時系列属性として選択します。これがデフォルトのオプションです。
    • single:このオプションを使用すると、単一の時系列属性を選択できます。必須の属性は、属性パラメーターによって選択されます。
    • subset:このオプションを使用すると、リストを介して複数の時系列属性を選択できます(パラメーター属性を参照)。 ExampleSetのメタデータがわかっている場合、すべての属性がリストに存在し、必要な属性を簡単に選択できます。
    • regular_expression:このオプションにより、時系列属性選択用の正規表現を指定できます。正規表現フィルターは、正規表現パラメーターによって構成されます。excessexpressionおよびexcept expressionを使用します。
    • value_type:このオプションにより、特定のタイプのすべての属性を選択して時系列属性にすることができます。型は階層的であることに注意してください。たとえば、実数型と整数型は両方とも数値型に属します。値タイプフィルターは、パラメーター値タイプによって構成されます。値タイプを除く値タイプ例外を使用します。
    • block_type:このオプションにより、特定のブロックタイプのすべての属性を選択して時系列属性にすることができます。ブロックタイプは階層的であることに注意する必要があります。たとえば、value_series_startおよびvalue_series_endブロックタイプは両方ともvalue_seriesブロックタイプに属します。ブロックタイプフィルターは、パラメーターブロックタイプによって構成され、ブロックタイプを除くブロックタイプ例外を使用します。
    • no_missing_values:このオプションは、ExampleSetのすべての属性を、どの例でも欠損値を含まない時系列属性として選択します。欠損値が1つでもある属性は選択されません。
    • numeric_value_filter:例がすべて所定の数値条件に一致するすべての数値属性が、時系列属性として選択されます。条件は、数値条件パラメーターによって指定されます。

    範囲:

  • attribute必要な属性は、このオプションから選択できます。メタデータがわかっている場合は、パラメーターのドロップダウンボックスから属性名を選択できます。

    範囲:

  • attributes必要な属性は、このオプションから選択できます。これにより、2つのリストを含む新しいウィンドウが開きます。すべての属性が左側のリストにあります。これらは、選択した時系列属性のリストである右側のリストに移動できます。

    範囲:

  • regular_expressionこの式に名前が一致する属性が選択されます。式は、 正規表現の編集およびプレビューメニューで指定できます。このメニューは、正規表現の良いアイデアを提供します。また、異なる表現を試して結果を同時にプレビューすることもできます。

    範囲:

  • use_except_expression有効にすると、最初の正規表現の例外を指定できます。この例外は、 except regular expressionパラメーターによって指定されます。

    範囲:

  • except_regular_expressionこのオプションを使用すると、正規表現を指定できます。この表現に一致する属性は、最初の表現( 正規表現パラメーターで指定された表現 )に一致する場合でも除外されます。

    範囲:

  • value_typeこのオプションにより、属性のタイプを選択できます。次のタイプのいずれかを選択できます:数値、整数、実数。

    範囲:

  • use_value_type_exception有効にすると、選択したタイプの例外を指定できます。この例外は、 except value typeパラメーターによって指定されます。

    範囲:

  • except_value_typeこのタイプに一致する属性は、 value typeパラメーターで指定された前に選択されたタイプと一致した場合でも、最終出力から削除されます。ここでは、数値、整数、実数のいずれかのタイプを選択できます。

    範囲:

  • block_typeこのオプションを使用すると、属性のブロックタイプを選択できます。次のタイプのいずれかを選択できます:value_series、value_series_start、value_series_end。

    範囲:

  • use_block_type_exception有効にすると、選択したブロックタイプの例外を指定できます。この例外は、 except block typeパラメーターによって指定されます。

    範囲:

  • except_block_typeこのブロックタイプに一致する属性は、 ブロックタイプパラメータによって選択された前のタイプと一致した場合でも、最終出力から削除されます。ここでは、value_series、value_series_start、value_series_endのいずれかのブロックタイプを選択できます。

    範囲:

  • numeric_condition数値条件フィルタータイプで使用される数値条件。すべての例がこの属性に指定された条件に一致する場合、数値属性が選択されます。たとえば、数値条件「> 6」は、すべての例で6より大きい値を持つすべての数値属性を保持します。条件の組み合わせが可能です: ‘> 6 && <11’または ‘<= 5 || <0 ‘。しかし、&&および|| 1つの数値条件で一緒に使用することはできません。 ‘(> 0 && <2)のような条件|| (> 10 && <12) ‘は、&&と||の両方を使用するため許可されません。

    範囲:

  • invert_selectionこのパラメーターをtrueに設定すると、選択が逆になります。その場合、指定された条件に一致しないすべての属性が時系列属性として選択されます。 include特殊属性パラメーターがtrueに設定されていないため、 反転選択パラメーターとは無関係に特殊属性は選択されません。その場合、条件は特別な属性にも適用され、このパラメーターがチェックされている場合は選択が逆になります。

    範囲:

  • include_special_attributes特別な属性は、特別な役割を持つ属性です。これらは、ID、ラベル、予測、クラスター、重量、バッチです。また、カスタムロールを属性に割り当てることができます。デフォルトでは、フィルター条件に関係なく、特別な属性は時系列属性として選択されません。このパラメーターがtrueに設定されている場合、指定された条件に対して特別な属性もテストされ、条件に一致する属性が選択されます。

    範囲:

  • overwrite_attributesこのパラメーターは、元の時系列属性が結果の​​時系列で上書きされるかどうかを示します。このパラメーターがfalseに設定されている場合、結果の新しい時系列は、新しい属性としてExampleSetに追加されます。これらの新しい属性の名前は、後置記号が追加された元の時系列の名前になります。接尾辞は、パラメーターnew attributes postfixによって指定されます。

    範囲:

  • new_attributes_postfix属性の上書きがfalseの場合、このパラメーターは、新しい属性名を作成するために元の時系列の名前に追加される接尾辞を指定します。

    範囲:

  • filter_typeフィルタータイプは、 フィルターの重みを定義します。可能なフィルタータイプは次のとおりです。
    • simple:実際の値の左にあるフィルターサイズの左の値と、実際の値の右にあるフィルターサイズの右の値がフィルターに含まれます。重みはすべて同じ値= 1 /(左のフィルターサイズ+右のフィルターサイズ+ 1)です。このフィルターは、移動平均、移動平均、ローリング平均、ローリング平均または移動平均とも呼ばれます。
    • binom:実際の値の左右それぞれにフィルターサイズ(= q)値を持つ対称フィルター。重みは、二項式(1/2 + 1 / 2s)^(2q)の展開に従います。たとえば、q = 2の場合、重みは[1 / 16、4 / 16、6 / 16、4 / 16、1 / 16]です。 qの値が大きい場合、重みは通常の(ガウス)曲線に近似します。
    • spencers 15 points:スペンサーの15ポイント移動平均フィルターは、死亡率統計を平滑化して生命表を取得するために使用される特別なフィルターです。

    範囲:

  • filter_size_leftこのパラメーターは、 単純なフィルタータイプのフィルターウィンドウの左側のサイズを定義します。このパラメーターは、実際の値に残っている値の数を指定します。これは、フィルタリングに含まれます。実際のフィルターウィンドウのサイズは、 左フィルターサイズ + 右フィルターサイズです。

    範囲:

  • filter_size_rightこのパラメーターは、 単純なフィルタータイプのフィルターウィンドウの右側のサイズを定義します。このパラメーターは、フィルター処理に含まれる実際の値のすぐ近くにある値の数を指定します。実際のフィルターウィンドウのサイズは、 左フィルターサイズ + 右フィルターサイズです。

    範囲:

  • filter_sizeこのパラメーターは、 binomフィルタータイプのフィルターウィンドウのサイズを定義します。このパラメーターは、実際の値の左右の値の数を指定します。これらの値は、フィルタリングに含まれます。したがって、実際のフィルターウィンドウのサイズは2 * フィルターのサイズ + 1です。

    範囲:

チュートリアルプロセス

シンプルな移動平均フィルター

このチュートリアルプロセスでは、単純移動フィルターとbinom移動平均フィルターの使用法と違いを示します。サイズ1およびサイズ5の単純でバイノムの移動平均フィルターは、Samples / Time SeriesフォルダーからのHuron湖のデータセットに適用されます。結果のフィルター処理された時系列は、結果ビューで比較できます。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル