RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Loop Attribute Subsets

概要

この演算子は、入力ExampleSetの通常の属性のすべての可能な組み合わせについて、そのサブプロセスを反復処理します。オプションで、組み合わせの属性の最小数と最大数をユーザーが指定できます。

詳細

ループ属性サブセット演算子は、ネストされた演算子です。つまり、サブプロセスがあります。ループ属性のサブセットオペレータが実行n回の数のサブプロセス、nが所与ExampleSetにおける正規属性の可能な組み合わせの数です。ユーザーは、それぞれのパラメーターを使用して、組み合わせで属性の最小数と最大数を指定できます。この場合、 nの値はそれに応じて変化します。したがって、ExampleSetにa、b、cなどの3つの通常の属性がある場合。次に、この演算子は7回実行されます。属性の組み合わせごとに1回。組み合わせは、{a}、{b}、{c}、{a、b}、{a、c}、{b、c}、および{a、b、c}になります。詳細については、添付のプロセス例をご覧ください。

この演算子は、Log演算子やパフォーマンス評価演算子などと組み合わせて使用​​すると便利です。同様のタスクを実行するブルートフォース機能の選択とは対照的に、この反復アプローチではメモリの必要量がはるかに少なく、より大きなデータセットで実行できます。

入力

  • サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。

出力

  • サンプルセット(IOObject)入力として与えられたExampleSetは、変更なしでこのポートを介して配信されます。

パラメーター

  • use_exact_numberこのパラメーターがtrueに設定されている場合、サブプロセスは指定された長さ、つまり指定された数の属性の組み合わせに対してのみ実行されます。組み合わせの長さは、属性パラメーターの正確な数によって指定されます。 範囲:ブール
  • exact_number_of_attributesこのパラメーターは、組み合わせに使用される属性の正確な数を決定します。 範囲:整数
  • min_number_of_attributesこのパラメーターは、組み合わせに使用される属性の最小数を決定します。 範囲:整数
  • limit_max_numberこのパラメーターをtrueに設定すると、サブプロセスは、 m個以下の属性を持つ組み合わせに対してのみ実行されます。ここで、 m属性パラメーターの最大数で指定されます。 範囲:ブール
  • max_number_of_attributesこのパラメーターは、組み合わせに使用される属性の最大数を決定します。 範囲:整数

チュートリアルプロセス

ループ属性サブセット演算子の概要

「ゴルフ」データセットは、検索演算子を使用してロードされます。ここにブレークポイントが挿入されるため、ループ属性サブセット演算子を適用する前にExampleSetを確認できます。 ExampleSetには4つの通常の属性があることがわかります。ループ属性サブセット演算子は、すべてのパラメーターのデフォルト値とともにこのExampleSetに適用されます。組み合わせの属性の最小数と最大数には制限が適用されないため、この演算子のサブプロセスは、4つの通常の属性のすべての可能な組み合わせに対して実行されます。ループ属性サブセット演算子のサブプロセスをご覧ください。そこでLog演算子が適用され、各反復の属性の名前がLogテーブルに保存されます。プロセスを実行し、結果ワークスペースに移動します。ログ結果のテーブルビューを確認します。各反復の属性の名前が表示されます。 4つの属性があるため、15の非NULLの組み合わせがあります。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル