RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Process Windows

概要

この演算子は、入力時系列ExampleSetからスライディングウィンドウを作成し、各ウィンドウの内部サブプロセスをループします。

詳細

ウィンドウサイズパラメーターで定義されたサイズウィンドウが入力時系列から作成され、オペレーターの内部ウィンドウ化されたサンプルセットポートで提供されます。任意の演算子をサブプロセスに挿入して、ウィンドウ化されたExampleSetを操作できます。結果を出力ポートに提供できます。これらの出力ポートはポートエクステンダーです。つまり、ポートの1つを接続するたびに新しい出力ポートが作成されます。

パラメーター作成範囲labels )またはパラメーターの最後のインデックスをウィンドウ属性に追加がtrueに設定されている場合、出力ポートで提供されるExampleSetsに追加の属性が追加されます。詳細については、これらのパラメーターの説明を参照してください。

次の反復では、ウィンドウは、 ステップサイズパラメーターによって定義されたk値だけシフトされます。パラメーターが重複するウィンドウないパラメーターがtrueに設定されている場合、 ステップサイズは、ウィンドウもホライズンウィンドウも(パラメーターcreate horizo​​nlabels )がtrueに設定されている場合)オーバーラップする値に設定されます( ステップサイズ = ウィンドウサイズ + 地平線サイズ + 地平線オフセット )。

この演算子は、すべての時系列(日付時刻値を含む数値、名義、および時系列)で機能します。

入力

  • サンプルセット (IOObject)時系列データを属性として含むExampleSet。
  • 入力 (IOObject)これはportはポートエクステンダーです。つまり、ポートが接続されると、新しい入力ポートが作成されます。 IOObjectはポートに接続でき、各反復で対応する内部入力ポートに渡されます。

出力

  • 出力(IOObject)これは、ポートはポートエクステンダーです。つまり、ポートが接続されている場合、新しい出力ポートが作成されます。ポートは、内部プロセスによって提供されるすべての結果を収集し、すべての反復のコレクションを返します。パラメーターが水平線(ラベル)を作成するか、ウィンドウ属性に最後のインデックスを追加する属性がtrueに設定され、接続されたIOObjectがExampleSetである場合、追加の属性がExampleSetsに追加されます。詳細については、対応するパラメーターの説明を参照してください。

パラメーター

  • attribute_filter_typeこのパラメーターを使用すると、時系列属性選択フィルターのフィルターを選択できます。時系列値を保持する属性を選択する方法。さまざまなフィルタータイプは次のとおりです。
    • all:このオプションは、ExampleSetのすべての属性を時系列属性として選択します。これがデフォルトのオプションです。
    • single:このオプションを使用すると、単一の時系列属性を選択できます。必須の属性は、属性パラメーターによって選択されます。
    • subset:このオプションを使用すると、リストを介して複数の時系列属性を選択できます(パラメーター属性を参照)。 ExampleSetのメタデータがわかっている場合、すべての属性がリストに存在し、必要な属性を簡単に選択できます。
    • regular_expression:このオプションにより、時系列属性選択用の正規表現を指定できます。正規表現フィルターは、正規表現パラメーターによって構成されます。excessexpressionおよびexcept expressionを使用します。
    • value_type:このオプションにより、特定のタイプのすべての属性を選択して時系列属性にすることができます。型は階層的であることに注意してください。たとえば、実数型と整数型は両方とも数値型に属します。値タイプフィルターは、パラメーター値タイプによって構成されます。値タイプを除く値タイプ例外を使用します。
    • block_type:このオプションにより、特定のブロックタイプのすべての属性を選択して時系列属性にすることができます。ブロックタイプは階層的であることに注意する必要があります。たとえば、value_series_startおよびvalue_series_endブロックタイプは両方ともvalue_seriesブロックタイプに属します。ブロックタイプフィルターは、パラメーターブロックタイプによって構成され、ブロックタイプを除くブロックタイプ例外を使用します。
    • no_missing_values:このオプションは、ExampleSetのすべての属性を、どの例でも欠損値を含まない時系列属性として選択します。欠損値が1つでもある属性は選択されません。
    • numeric_value_filter:例がすべて所定の数値条件に一致するすべての数値属性が、時系列属性として選択されます。条件は、数値条件パラメーターによって指定されます。

    範囲:

  • attribute必要な属性は、このオプションから選択できます。メタデータがわかっている場合は、パラメーターのドロップダウンボックスから属性名を選択できます。

    範囲:

  • attributes必要な属性は、このオプションから選択できます。これにより、2つのリストを含む新しいウィンドウが開きます。すべての属性が左側のリストにあります。これらは、選択した時系列属性のリストである右側のリストに移動できます。

    範囲:

  • regular_expressionこの式に名前が一致する属性が選択されます。式は、 正規表現の編集およびプレビューメニューで指定できます。このメニューは、正規表現の良いアイデアを提供します。また、異なる表現を試して結果を同時にプレビューすることもできます。

    範囲:

  • use_except_expression有効にすると、最初の正規表現の例外を指定できます。この例外は、 except regular expressionパラメーターによって指定されます。

    範囲:

  • except_regular_expressionこのオプションを使用すると、正規表現を指定できます。この表現に一致する属性は、最初の表現( 正規表現パラメーターで指定された表現 )に一致する場合でも除外されます。

    範囲:

  • value_typeこのオプションにより、属性のタイプを選択できます。

    範囲:

  • use_value_type_exception有効にすると、選択したタイプの例外を指定できます。この例外は、 except value typeパラメーターによって指定されます。

    範囲:

  • except_value_typeこのタイプに一致する属性は、 value typeパラメーターで指定された前に選択されたタイプと一致した場合でも、最終出力から削除されます。

    範囲:

  • block_typeこのオプションを使用すると、属性のブロックタイプを選択できます。

    範囲:

  • use_block_type_exception有効にすると、選択したブロックタイプの例外を指定できます。この例外は、 except block typeパラメーターによって指定されます。

    範囲:

  • except_block_typeこのブロックタイプに一致する属性は、 ブロックタイプパラメータによって選択された前のタイプと一致した場合でも、最終出力から削除されます。

    範囲:

  • numeric_condition数値条件フィルタータイプで使用される数値条件。すべての例がこの属性に指定された条件に一致する場合、数値属性が選択されます。たとえば、数値条件「> 6」は、すべての例で6より大きい値を持つすべての数値属性を保持します。条件の組み合わせが可能です: ‘> 6 && <11’または ‘<= 5 || <0 ‘。しかし、&&および|| 1つの数値条件で一緒に使用することはできません。 ‘(> 0 && <2)のような条件|| (> 10 && <12) ‘は、&&と||の両方を使用するため許可されません。

    範囲:

  • invert_selectionこのパラメーターをtrueに設定すると、選択が逆になります。その場合、指定された条件に一致しないすべての属性が時系列属性として選択されます。 特殊属性を含めるパラメーターがtrueに設定されていないため、 反転属性とは無関係に特殊属性が選択されます。その場合、条件は特別な属性にも適用され、このパラメーターがチェックされている場合は選択が逆になります。

    範囲:

  • include_special_attributes特別な属性は、特別な役割を持つ属性です。これらは、ID、ラベル、予測、クラスター、重量、バッチです。また、カスタムロールを属性に割り当てることができます。デフォルトでは、フィルター条件に関係なく、特別な属性が時系列属性として選択されます。このパラメーターがtrueに設定されている場合、指定された条件に対して特別な属性もテストされ、条件に一致する属性が選択されます。

    範囲:

  • has_indicesこのパラメーターは、時系列に関連付けられたインデックス属性があるかどうかを示します。このパラメーターがtrueに設定されている場合、インデックス属性を選択する必要があります。

    範囲:

  • indices_attributeパラメーターのインデックスがtrueに設定されている場合、このパラメーターは関連するインデックス属性を定義します。日付、date_time、または数値タイプの属性のいずれかです。メタデータがわかっている場合は、パラメーターのドロップダウンボックスから属性名を選択できます。

    範囲:

  • window_size1つのウィンドウ内の値の数。内部サブプロセスのウィンドウ化されたサンプルセットポートで提供されるExampleSetには、 ウィンドウサイズのサンプル数があります。 ウィンドウサイズは、時系列の長さ以下にする必要があります。

    範囲:

  • no_overlapping_windowsこのパラメーターをtrueに設定すると、パラメーターのステップサイズが自動的に決定され、ウィンドウと水平線が重ならないようになります。ステップサイズは、 ウィンドウサイズ + 地平線サイズ + 地平線オフセットに設定されます

    範囲:

  • step_size2つの連続したウィンドウの最初の値の間のステップサイズ。たとえば、ウィンドウサイズが10、ステップサイズが2の場合、最初のウィンドウの値は0、…、9、2番目のウィンドウの値は2、…、11などになります。 オーバーラップするウィンドウがtrueに設定されていない場合、 ステップサイズウィンドウサイズ水平線サイズ 、および水平線オフセットに応じて自動的に決定されます

    範囲:

  • create_horizon_(labels)このパラメーターがtrueに設定されている場合、内部サブプロセスの出力ポートで提供されるすべてのExampleSetsに1つ以上の属性が追加されます。それらは、パラメータ地平線属性地平線サイズ 、および地平線オフセットによって定義される地平線ウィンドウの値を含みます。 ExampleSetではない出力ポートで提供されるオブジェクトは変更されません。

    範囲:

  • horizo​​n_attributeパラメーターcreate horizo​​nlabels )がtrueに設定されている場合、このパラメーターはhorizo​​nを保持する属性を定義します。メタデータがわかっている場合は、パラメーターのドロップダウンボックスから属性名を選択できます。

    範囲:

  • horizo​​n_size地平線としてとられる値の数。 horizo​​nの各値に対して、 <time series attribute name> + ihorizo​​n )という名前の属性が作成され、iは1、…、 horizo​​n sizeから実行されます。 水平サイズが1の場合、作成された属性のロールはlabelに設定されます。サイズが大きい場合(つまり、複数の属性が作成される場合)、属性のロールはHorizo​​n + iに設定され、iは1、…、 horizo​​n sizeから実行されます。

    範囲:

  • horizo​​n_offsetウィンドウとそれに対応する水平線との間のオフセット。オフセットが0の場合、水平線はウィンドウの後ろの連続した値から取得されます。それ以外の場合、地平線はウィンドウの端の後ろの地平線オフセット値です。

    範囲:

  • add_last_index_in_window_attributeこのパラメーターをtrueに設定すると、内部サブプロセスの出力ポートで提供されるすべてのExampleSetsに追加の属性が追加されます。パラメータのインデックスがtrueの場合、追加属性の名前は「ウィンドウ内の最後の<インデックス属性>」で、対応するウィンドウ内の最後のインデックス値が含まれます。 インデックスがfalseの場合、追加の属性はウィンドウIDと呼ばれ、対応するウィンドウの番号が含まれます(フォーム0から開始)。 ExampleSetではない出力ポートで提供されるオブジェクトは変更されません。

    範囲:

  • enable_parallel_executionこのパラメーターは、サブプロセスの並列実行を有効にします。メモリの問題が発生した場合は、並列実行を無効にしてください。

    範囲:

チュートリアルプロセス

ヒューロン湖のデータセットのウィンドウの集計抽出

このチュートリアルのプロセスでは、Process Windowsオペレーターを使用して、Huron Lakeデータセットのサイズ30のウィンドウをループします。ウィンドウごとに、集計集計演算子を使用して、ウィンドウの一部の機能を計算します。計算された機能は、内部サブプロセスの出力ポートに提供されます。パラメーターが地平線を作成し(ラベル)、ウィンドウ属性に最後のインデックスを追加する属性がtrueに設定され、地平線の値を保持する属性(地平線のサイズが1であるため)と最後の日付を保持する属性(時系列のインデックス属性)ウィンドウ内のExampleSet機能に追加されます。

追加演算子は、すべてのウィンドウの機能を1つのExampleSetに追加するために使用されます。これは、機械学習モデルのトレーニングに使用できます。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル