Weight by User Specification
概要
この演算子は、指定された属性にユーザー定義の重みを割り当てます。属性は、正規表現を使用して選択できます。
詳細
ユーザー指定の重み演算子は、指定されたExampleSetの選択された属性にユーザー定義の重みを割り当てます。属性の重みが大きいほど、より関連性が高いと見なされます。他の多くの重み付け演算子とは異なり、この演算子は名義ラベルまたは数値ラベルの両方を持つExampleSetに適用できます。
name regex to weightsパラメーターは、属性を選択し、それらに重みを割り当てるために使用されます。属性は、正規表現を介して選択されます。複数の正規表現を異なる属性選択に使用できます。正規表現リストで定義された重みは、リストで定義された順序で設定されることに注意してください。つまり、重みは以前に設定された重みを上書きできます。
distribute weightsパラメーターがtrueに設定されている場合、 regex to weightsパラメーターに指定された重みは、正規表現に一致するすべての属性に均等に分割されます。 デフォルトの重みパラメータは、正規表現と一致しないすべての属性の重みを指定します。詳細については、添付のプロセス例をご覧ください。
入力
- サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。添付のプロセス例のRetrieveオペレーターの出力です。
出力
- 重み(平均ベクトル)このポートは、ラベル属性に関する属性の重みを提供します。重みが大きい属性ほど関連性が高いと見なされます。
- サンプルセット(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更されることなく渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
パラメーター
- normalize_weightsこのパラメーターは、計算された重みを正規化するかどうかを示します。 trueに設定すると、すべての重みが0〜1の範囲で正規化されます。 範囲:ブール値
- sort_weightsこのパラメーターは、結果の重みに従って属性をソートするかどうかを示します。このパラメーターがtrueに設定されている場合、ソートの順序は、 ソート方向パラメーターを使用して指定されます。 範囲:ブール
- sort_directionこのパラメーターは、 ソートの重みパラメーターがtrueに設定されている場合にのみ使用できます。このパラメーターは、重みに応じて属性のソート順を指定します。 範囲:選択
- name_regex_to_weightsこのパラメーターは、属性を選択し、それらに重みを割り当てるために使用されます。属性は、正規表現を介して選択されます。複数の正規表現を異なる属性選択に使用できます。正規表現リストで定義された重みは、リストで定義された順序で設定されることに注意してください。つまり、重みは以前に設定された重みを上書きできます。 範囲:リスト
- distribute_weightsこのパラメーターをtrueに設定すると、 name regex to weightsパラメーターで指定された重みが分割され、対応する正規表現に一致する属性に均等に分散されます。 範囲:ブール
- default_weightこのパラメーターは、正規表現と一致しないすべての属性の重みを指定します。 範囲:実数
チュートリアルプロセス
ゴルフデータセットの属性ウェイトを手動で設定する
「ゴルフ」データセットは、検索演算子を使用してロードされます。ユーザー指定による重み演算子が適用され、属性の重みが割り当てられます。重みの正規化パラメーターがfalseに設定されているため、重みは正規化されません。並べ替えの重みパラメーターがtrueに設定され、並べ替えの方向パラメーターが「昇順」に設定されているため、結果は重みの昇順になります。 name regex to weightsパラメーターは、正規表現を使用して重みを割り当てるために使用されます。このプロセスでは、1つの正規表現のみが定義されています。この正規表現は、名前にアルファベット「i」が含まれるすべての属性を選択します。一致する属性(湿度と風)には重み4.0が割り当てられます。正規表現と一致しないすべての属性(温度とOutlookなど)には、デフォルトの重みパラメーターで定義されているデフォルトの重みが割り当てられます。このプロセスでは、1.0に設定されます。プロセスを実行すると、正規表現に一致した属性が対応する重み(4.0)を取得し、残りの属性がデフォルトの重み(1.0)を取得することがわかります。ここで、ウェイトの配布パラメータをtrueに設定し、プロセスを再度実行します。これで、重み4.0は風属性と湿度属性に均等に分割されるため、それらの重みは2.0に設定されます。これを確認するには、結果ワークスペースでプロセスの結果を表示します。