RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Loop Attributes

概要

この演算子は、入力ExampleSetのサブセット(1つ以上の属性)を選択し、選択したすべての属性のサブプロセスを反復処理します。サブプロセスは、マクロによって現在の反復の属性にアクセスできます。

詳細

ループ属性演算子には、入力ExampleSetの必要な属性を選択できる多数のパラメーターがあります。属性が選択されると、ループ属性演算子は各属性にサブプロセスを適用します。つまり、サブプロセスはn回実行されます。nは選択された属性の数です。すべての反復で、 反復マクロパラメーターで指定されたマクロを使用して、現在の反復の属性にアクセスできます。この演算子を適用するには、マクロの基本的な理解が必要です。マクロの基本的な理解については、マクロの抽出演算子のドキュメントをご覧ください。マクロの抽出演算子は、添付のサンプルプロセスでも使用されます。サブプロセスに関する詳細については、サブプロセス演算子をご覧ください。

入力

  • サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。

出力

  • サンプルセット(IOObject)結果のExampleSet、またはExampleSetのコレクションは、このポートを介して配信されます。

パラメーター

  • attribute_filter_typeこのパラメーターを使用すると、属性選択フィルターを選択できます。属性の選択に使用する方法。次のオプションがあります。
    • all:このオプションは、ExampleSetのすべての属性を選択するだけで、属性は削除されません。これがデフォルトのオプションです。
    • single:このオプションを使用すると、単一の属性を選択できます。このオプションを選択すると、別のパラメーター(属性)がパラメーターパネルに表示されます。
    • subset:このオプションを使用すると、リストから複数の属性を選択できます。 ExampleSetのすべての属性がリストに存在します。必要な属性は簡単に選択できます。メタデータが不明な場合、このオプションは機能しません。このオプションを選択すると、別のパラメーターがパラメーターパネルに表示されます。
    • regular_expression:このオプションを使用すると、属性選択の正規表現を指定できます。このオプションを選択すると、他のパラメーター(正規表現、式以外の使用)がパラメーターパネルに表示されます。
    • value_type:このオプションを使用すると、特定のタイプのすべての属性を選択できます。型は階層的であることに注意してください。たとえば、実数型と整数型は両方とも数値型に属します。ユーザーは、このオプションを使用して属性を選択するときに、タイプ階層の基本的な理解が必要です。このオプションを選択すると、他のパラメーター(値の型、値の型の例外を使用)がパラメーターパネルに表示されます。
    • block_type:このオプションは、value_typeオプションと同様に機能します。このオプションを使用すると、特定のブロックタイプのすべての属性を選択できます。ブロックタイプは階層的であることに注意する必要があります。たとえば、value_series_startおよびvalue_series_endブロックタイプは両方ともvalue_seriesブロックタイプに属します。このオプションを選択すると、他のいくつかのパラメーター(ブロックタイプ、ブロックタイプの例外を使用)がパラメーターパネルに表示されます。
    • no_missing_values:このオプションは、どの例でも欠損値を含まないExampleSetのすべての属性を選択するだけです。欠損値が1つでもある属性は削除されます。
    • numeric_value_filter:このオプションを選択すると、別のパラメーター(数値条件)がパラメーターパネルに表示されます。例がすべて上記の数値条件を満たす数値属性がすべて選択されます。指定された数値条件に関係なく、すべての名義属性も選択されることに注意してください。

    範囲:選択

  • attributeこのオプションから必要な属性を選択できます。メタデータがわかっている場合、 属性パラメーターのドロップダウンボックスから属性名を選択できます。 範囲:文字列
  • attributesこのオプションから必要な属性を選択できます。これにより、2つのリストを含む新しいウィンドウが開きます。すべての属性は左側のリストにあり、右側のリストにシフトできます。右側のリストは、出力ポートに到達するために選択された属性のリストです。他のすべての属性は削除されます。 範囲:文字列
  • regular_expressionこの式に名前が一致する属性が選択されます。正規表現は非常に強力なツールですが、初心者には詳細な説明が必要です。正規表現の編集およびプレビューメニューから正規表現を指定することは常に有効です。このメニューは、正規表現の良いアイデアを提供します。また、異なる表現を試して結果を同時にプレビューすることもできます。これにより、正規表現の概念が強化されます。 範囲:文字列
  • use_except_expression有効にすると、最初の正規表現の例外を指定できます。このオプションを選択すると、別のパラメーター(正規表現を除く)がパラメーターパネルに表示されます。 範囲:ブール
  • except_regular_expressionこのオプションを使用すると、正規表現を指定できます。この表現に一致する属性は、最初の表現( 正規表現パラメーターで指定された表現 )に一致する場合でも除外されます。 範囲:文字列
  • value_type選択する属性のタイプは、ドロップダウンリストから選択できます。次のタイプのいずれかを選択できます:名義、数値、整数、実数、テキスト、二項、多項式、file_path、date_time、date、time。 範囲:選択
  • use_value_type_exception有効にすると、選択したタイプの例外を指定できます。このオプションを選択すると、別のパラメーター(値のタイプを除く)がパラメーターパネルに表示されます。 範囲:ブール
  • except_value_typeこの型に一致する属性は、前述の型、つまり値型パラメーターの値に一致した場合でも、最終出力から削除されます。ここでは、名義、数値、整数、実数、テキスト、二項、多項式、file_path、date_time、date、timeのいずれかのタイプを選択できます。 範囲:選択
  • block_type選択する属性のブロックタイプは、ドロップダウンリストから選択できます。次のタイプのいずれかを選択できます:single_value、value_series、value_series_start、value_series_end、value_matrix、value_matrix_start、value_matrix_end、value_matrix_row_start。 範囲:選択
  • use_block_type_exception有効にすると、選択したブロックタイプの例外を指定できます。このオプションを選択すると、別のパラメーター(ブロックタイプを除く)がパラメーターパネルに表示されます。 範囲:ブール
  • except_block_typeこのブロックタイプに一致する属性は、前述のブロックタイプに一致した場合でも、最終出力から削除されます。ここでは、single_value、value_series、value_series_start、value_series_end、value_matrix、value_matrix_start、value_matrix_end、value_matrix_row_startのいずれかのブロックタイプを選択できます。 範囲:選択
  • numeric_conditionここでは、数値属性の例をテストするための数値条件について説明します。たとえば、数値条件「> 6」は、すべての例ですべての名義属性と6より大きい値を持つすべての数値属性を保持します。条件の組み合わせが可能です: ‘> 6 && <11’または ‘<= 5 || <0 ‘。しかし、&&および|| 1つの数値条件で一緒に使用することはできません。 ‘(> 0 && <2)のような条件|| (> 10 && <12) ‘は、&&と||の両方を使用するため許可されません。 「>」、「=」、「<」の後に空白を使用します。たとえば、「<5」は機能しないため、代わりに「<5」を使用します。 範囲:文字列
  • invert_selectionこのパラメーターをtrueに設定すると、NOTゲートとして機能し、選択を反転します。その場合、選択されたすべての属性が削除され、以前に削除された属性が選択されます。たとえば、属性「att1」が選択され、属性「att2」がこのパラメーターの選択前に削除された場合。このパラメーターを選択すると、「att1」が削除され、「att2」が選択されます。 範囲:ブール
  • include_special_attributes特別な属性は、例を識別する特別な役割を持つ属性です。対照的に、通常の属性は単に例を示しています。特別な属性は、id、ラベル、予測、クラスター、重量、およびバッチです。デフォルトでは、属性の選択演算子の条件に関係なく、すべての特別な属性が出力ポートに配信されます。このパラメーターがtrueに設定されている場合、特殊属性は、属性の選択演算子で指定された条件に対してもテストされ、条件を満たす属性のみが選択されます。 範囲:ブール
  • attribute_name_macroこのパラメーターは、各反復で現在の属性の名前を保持するマクロの名前を指定します。 範囲:文字列
  • reuse_results各反復の結果を次の反復の入力として再使用するかどうかを設定します。 trueに設定すると、各反復の出力が次の反復の入力として使用されます。明らかな理由により、これによりループが単一スレッドで実行されるように制限され、CPUコアを使用しなくなります。 falseに設定すると、各反復の入力がループの元の入力になります。 範囲:ブール
  • enable_parallel_executionこのパラメーターは、サブプロセスの並列実行を有効にします。メモリの問題が発生した場合は、並列実行を無効にしてください。 範囲:ブール

チュートリアルプロセス

ループ属性演算子での新しい属性の生成

「ゴルフ」データセットは、検索演算子を使用してロードされます。ここにブレークポイントが挿入されるため、ループ属性演算子を適用する前にExampleSetを確認できます。ループ属性演算子のパラメーターをご覧ください。属性フィルタータイプパラメーターは「値タイプ」に設定され、値タイプパラメーターは「数値」に設定され、特殊属性を含めるパラメーターはtrueに設定されます。したがって、すべての数値属性は「ゴルフ」データセットから選択されます。つまり、温度と湿度の属性が選択されます。したがって、ループ属性演算子のサブプロセスは2回繰り返されます。各反復では、反復マクロパラメーターで定義された ‘loop_attribute’マクロによって現在の属性にアクセスできます。次に、ループ属性演算子のサブプロセスを見てみましょう。マクロの抽出演算子が最初に適用されます。マクロの抽出演算子のパラメーターは、「avg」マクロが現在の反復の属性の平均または平均を保持するように調整されます。 「マクロの抽出」演算子のパラメーターで「loop_attribute」マクロがどのように使用されるかに注意してください。次に、属性の生成演算子が適用されます。現在の反復の属性から新しい属性を生成します。新しい属性は、その属性の平均からの例の偏差を保持します。平均は「avg」マクロに保存されました。 [属性の生成]演算子の関数説明パラメーターでのマクロの使用に注意してください。

したがって、ループ属性演算子のサブプロセスは、選択した属性の値ごとに1回ずつ、2回実行されます。最初の反復では、温度属性の平均値からの温度値の偏差を保持する「Deviation(Temperature)」という名前の新しい属性が作成されます。 2番目の反復では、湿度属性の平均からの湿度値の偏差を保持する「偏差(湿度)」という名前の新しい属性が作成されます。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル