RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Weight by Deviation

概要

この演算子は、属性の(正規化された)標準偏差に基づいて、指定されたExampleSetの属性の関連性を計算します。

詳細

偏差による重み演算子は、属性の(正規化された)標準偏差に基づいて、ラベル属性に関する属性の重みを計算します。属性の重みが大きいほど、より関連性が高いと見なされます。標準偏差は、属性の平均、最小、または最大によって正規化できます。この演算子は、数値ラベルのあるExampleSetにのみ適用できることに注意してください。

標準偏差は、平均からどれだけの変動または分散が存在するかを示します(平均値または期待値)。標準偏差が低い場合は、データポイントが平均値に非常に近い傾向があることを示し、標準偏差が高い場合は、データポイントが値の広い範囲に分散していることを示します。標準偏差は、数値がどのように広がっているかの尺度です。式は単純です。これは、分散の平方根です。

入力

  • サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。添付のプロセス例のRetrieveオペレーターの出力です。

出力

  • 重み(平均ベクトル)このポートは、ラベル属性に関する属性の重みを提供します。重みが大きい属性ほど関連性が高いと見なされます。
  • サンプルセット(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。

パラメーター

  • normalize_weightsこのパラメーターは、計算された重みを正規化するかどうかを示します。 trueに設定されている場合、すべての重みは0〜1の範囲で正規化されます。 範囲:ブール値
  • sort_weightsこのパラメーターは、結果の重みに従って属性をソートするかどうかを示します。このパラメーターがtrueに設定されている場合、ソートの順序は、 ソート方向パラメーターを使用して指定されます。 範囲:ブール
  • sort_directionこのパラメーターは、 ソートの重みパラメーターがtrueに設定されている場合にのみ使用できます。このパラメーターは、重みに応じて属性のソート順を指定します。 範囲:選択
  • normalizeこのパラメーターは、標準偏差を属性の最小値、最大値、または平均値で割るかどうかを示します。 範囲:選択

チュートリアルプロセス

多項式データセットの属性の重みの計算

「多項式」データセットは、Retrieve演算子を使用してロードされます。 ExampleSetを見ることができるように、ブレークポイントがここに挿入されます。メタデータビューの[統計]列で、すべての属性の標準偏差を確認することもできます。重みによる偏差演算子がこのExampleSetに適用され、属性の重みが計算されます。重みの正規化パラメーターがfalseに設定されているため、重みは正規化されません。並べ替えの重みパラメーターがtrueに設定され、並べ替えの方向パラメーターが「昇順」に設定されているため、結果は重みの昇順になります。これを確認するには、結果ワークスペースでこのプロセスの結果を表示します。また、これらの重みが属性の標準偏差とまったく同じであることもわかります。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル