Select by Weights
概要
この演算子は、重みが入力重みに関して指定された基準を満たす入力ExampleSetの属性のみを選択します。
詳細
この演算子は、重みが入力重みに関して指定された基準を満たす入力ExampleSetの属性のみを選択します。入力ウェイトは、 ウェイト入力ポートから提供されます。重みによる属性選択の基準は、 重み関係パラメーターによって指定されます。
入力
- サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。メタデータで属性が指定されているため、入力用のデータにメタデータを添付する必要があります。 Retrieveオペレーターは、メタデータとデータを提供します
- 重りこのポートは属性の重みを想定しています。属性の重みを提供する演算子は多数あります。相関による重み演算子は、サンプルプロセスで使用されます。
出力
- サンプルセット(IOObject)選択された属性を持つExampleSetは、このポートの出力です。
- オリジナル(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
- 重り重み入力ポートで提供された属性の重みは、この出力ポートを介して配信されます。
パラメーター
- weight_relation重みがこの関係を満たす属性のみが選択されます。
- greater:重みが重みパラメーターよりも大きい属性が選択されます。
- greater_equals:重みがweightパラメーター以上の属性が選択されます。
- equals:重みが重みパラメーターと等しい属性が選択されます。
- less_equals:重みがweightパラメーター以下の属性が選択されます。
- less:重みが重みパラメータより小さい属性が選択されます。
- top_k:最も高い重みを持つk属性が選択されます。 kはkパラメータで指定されます。
- bottom_k:最も低い重みを持つk属性が選択されます。 kはkパラメータで指定されます。
- all_but_top_k:最大の重みを持つk属性以外のすべての属性が選択されます。 kはkパラメータで指定されます。
- all_but_bottom_k:最小の重みを持つk属性以外のすべての属性が選択されます。 kはkパラメータで指定されます。
- top_p%:最も高い重みを持つ上位pパーセント属性が選択されます。 pはpパラメーターで指定されます。
- bottom_p%:最も低い重みを持つ下位pパーセント属性が選択されます。 pはpパラメーターで指定されます。
範囲:
- weightこのパラメーターは、重み関係パラメーターが「より大きい」、「より大きい」、「等しい」、「より小さい」または「より小さい」に設定されている場合にのみ使用可能です。このパラメーターは、重みを比較するために使用されます。 範囲:
- kこのパラメーターは、重み関係パラメーターが「トップk」、「ボトムk」、「トップkを除くすべて」、または「ボトムkを除くすべて」に設定されている場合にのみ使用できます。選択する属性の数をカウントするために使用されます。 範囲:
- pこのパラメーターは、重量関係パラメーターが「top p%」または「bottom p%」に設定されている場合にのみ使用できます。選択する属性の割合を指定するために使用されます。 範囲:
- deselect_unknownこれはエキスパートパラメータです。このパラメーターは、重みが不明な属性をExampleSetから削除する必要があるかどうかを示します。 範囲:
- use_absolute_weightsこれはエキスパートパラメータです。このパラメーターは、重みの絶対値を比較に使用するかどうかを示します。 範囲:
チュートリアルプロセス
Sonarデータセットから属性を選択する
「ソナー」データセットは、検索演算子を使用してロードされます。相関演算子による重みが適用され、属性の重みが生成されます。ここにブレークポイントが挿入されます。ここで、属性とその重みを確認できます。次に、重量で選択演算子が適用されます。 ‘Sonar’データセットはexamplesetポートで提供され、Weight by Correlationオペレーターによって計算された重みは重み入力ポートで提供されます。重み関係パラメーターは「bottom k」に設定され、kパラメーターは4に設定されます。したがって、最小の重みを持つ4つの属性が選択されます。ご覧のように、「attribute_57」、「attribute_17」、「attribute_30」、および「attribute_16」の重みが最も低いため、これら4つの属性が選択されています。また、ラベル属性「クラス」も選択されていることに注意してください。これは、重み条件に関係なく、特別な役割を持つ属性が選択されるためです。