Weight by Uncertainty
概要
この演算子は、クラスに関する対称不確実性を測定することにより、指定されたExampleSetの属性の関連性を計算します。
詳細
不確実性による重み演算子は、クラスに関する対称不確実性を測定することにより、ラベル属性に関する属性の重みを計算します。属性の重みが大きいほど、より関連性が高いと見なされます。この演算子は、名義ラベルのあるExampleSetにのみ適用できることに注意してください。関連性は次の式で計算されます。
関連性= 2 *(P(クラス)-P(クラス|属性))/ P(クラス)+ P(属性)
入力
- サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。添付のプロセス例のRetrieveオペレーターの出力です。
出力
- 重み(平均ベクトル)このポートは、ラベル属性に関する属性の重みを提供します。重みが大きい属性ほど関連性が高いと見なされます。
- サンプルセット(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
パラメーター
- normalize_weightsこのパラメーターは、計算された重みを正規化するかどうかを示します。 trueに設定されている場合、すべての重みは0〜1の範囲で正規化されます。 範囲:ブール値
- sort_weightsこのパラメーターは、結果の重みに従って属性をソートするかどうかを示します。このパラメーターがtrueに設定されている場合、ソートの順序は、 ソート方向パラメーターを使用して指定されます。 範囲:ブール
- sort_directionこのパラメーターは、 ソートの重みパラメーターがtrueに設定されている場合にのみ使用できます。このパラメーターは、重みに応じて属性のソート順を指定します。 範囲:選択
- normalizeこのパラメーターは、標準偏差を属性の最小値、最大値、または平均値で割るかどうかを示します。 範囲:選択
- number_of_binsこのパラメーターは、使用するビンの数を指定します。 範囲:整数
チュートリアルプロセス
ゴルフデータセットの属性ウェイトの計算
「ゴルフ」データセットは、検索演算子を使用してロードされます。不確実性による重み演算子が適用され、属性の重みが計算されます。すべてのパラメーターはデフォルト値で使用されます。重みの正規化パラメーターがtrueに設定されているため、すべての重みは0〜1の範囲で正規化されます。重みの並べ替えパラメーターはtrueに設定され、並べ替え方向パラメーターは「昇順」に設定されます。重みの昇順。これを確認するには、結果ワークスペースでこのプロセスの結果を表示します。