RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Weight by PCA

概要

この演算子は、PCAによって作成されたコンポーネントを使用して、ExampleSetの属性の重みを作成します。この演算子は、PCAモデルがコンポーネントモデルの重み演算子に与えられた場合とまったく同じように動作します。

詳細

PCAによる重み演算子は、PCAによって作成されたコンポーネントを使用して、指定されたExampleSetの属性重みを生成します。コンポーネントは、 コンポーネント番号パラメーターによって指定されます。 重み正規化パラメーターがtrueに設定されていない場合、選択したコンポーネントの正確な値が属性の重みとして使用されます。通常、 重み正規化パラメーターは、0から1の間で重みを分散するためにtrueに設定されます。属性の重みは、クラス属性に関する属性の関連性を反映しています。属性の重みが大きいほど、より関連性が高いと見なされます。

主成分分析(PCA)は、直交変換を使用して、相関する可能性のある属性の観測値のセットを、主成分と呼ばれる相関のない属性の値のセットに変換する数学的手順です。主成分の数は、元の属性の数以下です。この変換は、最初の主成分の分散ができるだけ大きくなるように定義され(データの変動を可能な限り多く考慮して)、後続の各コンポーネントは、先行するコンポーネントに直交(相関関係なし)する必要があります。

入力

  • サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。

出力

  • 重み(平均ベクトル)このポートは、ラベル属性に関する属性の重みを提供します。重みが大きい属性ほど関連性が高いと見なされます。
  • サンプルセット(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。

パラメーター

  • normalize_weightsこのパラメーターは、計算された重みを正規化するかどうかを示します。 trueに設定されている場合、すべての重みは0〜1の範囲で正規化されます。 範囲:ブール値
  • sort_weightsこのパラメーターは、結果の重みに従って属性をソートするかどうかを示します。このパラメーターがtrueに設定されている場合、ソートの順序は、 ソート方向パラメーターを使用して指定されます。 範囲:ブール
  • sort_directionこのパラメーターは、 ソートの重みパラメーターがtrueに設定されている場合にのみ使用できます。このパラメーターは、重みに応じて属性のソート順を指定します。 範囲:選択
  • component_numberこのパラメーターは、属性の重みとして使用されるコンポーネントの番号を指定します。 範囲:整数

チュートリアルプロセス

PCAによるSonarデータセットの属性の重みの計算

「ソナー」データセットは、検索演算子を使用してロードされます。 PCAオペレーターがそれに適用されます。次元削減パラメーターは「なし」に設定されます。ここにブレークポイントが挿入されるため、PCAオペレーターによって作成されたコンポーネントを見ることができます。 PCAオペレーター、特に「PC1」によって生成されたEigenVectorsを見てください。これは、コンポーネントモデルによるウェイトオペレーターを使用してウェイトとして使用されるためです。次に、コンポーネントモデルごとの重み演算子が適用されます。 PCA演算子のExampleSetおよびModelポートは、コンポーネントモデルの重み演算子の対応するポートに接続されます。ウェイトの正規化とウェイトの並べ替えのパラメーターはfalseに設定されているため、すべてのウェイトは選択したコンポーネントとまったく同じになります。コンポーネント番号パラメーターは1に設定されているため、「PC1」が属性の重みとして使用されます。ウェイトは、結果ワークスペースで確認できます。これらの重みが「PC1」の値とまったく同じであることがわかります。

2番目の演算子チェーンでは、PCA演算子による重みが「ソナー」データセットに適用され、まったく同じタスクを実行します。 PCAによる重み演算子のパラメーターは、コンポーネントモデルによる重み演算子のパラメーターとまったく同じに設定されます。結果ワークスペースで確認できるように、ここではまったく同じウェイトが生成されます。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル