RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Weight by Relief

概要

この演算子は、Reliefによって属性の関連性を計算します。 Reliefの重要な考え方は、それらの値が互いに近くにある同じクラスのインスタンスと異なるクラスのインスタンスをどれだけ区別できるかに応じて、フィーチャの品質を推定することです。

説明

リリーフは、そのシンプルさと有効性により、機能の品質を評価するための最も成功したアルゴリズムの1つと考えられています。 Reliefの重要な考え方は、それらの値が互いに近くにある同じクラスのインスタンスと異なるクラスのインスタンスをどれだけ区別できるかに応じて、フィーチャの品質を推定することです。リリーフは、サンプルをサンプリングし、同じクラスと異なるクラスの最も近いサンプルの現在のフィーチャの値を比較することにより、フィーチャの関連性を測定します。このバージョンは、複数のクラスと回帰データセットでも機能します。重みの正規化パラメーターがtrueに設定されている場合、結果の重みは0〜1の間隔に正規化されます。

入力

  • サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。添付のプロセス例のRetrieveオペレーターの出力です。

出力

  • 重み (平均ベクトル)このポートは、ラベル属性に関する属性の重みを提供します。重みが大きい属性ほど関連性が高いと見なされます。
  • サンプルセット (IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。

パラメーター

  • normalize_weightsこのパラメーターは、計算された重みを正規化するかどうかを示します。 trueに設定すると、すべての重みが0〜1の範囲で正規化されます。 範囲:ブール値
  • sort_weightsこのパラメーターは、結果の重みに従って属性をソートするかどうかを示します。このパラメーターがtrueに設定されている場合、ソートの順序は、 ソート方向パラメーターを使用して指定されます。 範囲:ブール
  • sort_directionこのパラメーターは、 ソートの重みパラメーターがtrueに設定されている場合にのみ使用できます。このパラメーターは、重みに応じて属性のソート順を指定します。 範囲:選択
  • number_of_neighborsこのパラメーターは、関連度計算のための最近傍の数を指定します。 範囲:整数
  • sample_ratioこのパラメーターは、重みを決定するために使用される例の比率を指定します。 範囲:実数
  • use_local_random_seedこのパラメーターは、サブセットの例をランダム化するためにローカルランダムシードを使用する必要があるかどうかを示します。 ローカルランダムシードの同じ値を使用すると、同じサンプルが生成されます。このパラメーターの値を変更すると、サンプルのランダム化方法が変更されるため、サンプルにはサンプルの異なるセットが含まれます。 範囲:ブール
  • local_random_seedこのパラメータは、 ローカルランダムシードを指定します。このパラメーターは、 ローカルシードの使用パラメーターがtrueに設定されている場合にのみ使用できます。 範囲:整数

チュートリアルプロセス

多項式データセットの属性の重みの計算

「多項式」データセットは、Retrieve演算子を使用してロードされます。属性にウェイトを計算するために、Weight by Relief演算子が適用されます。すべてのパラメーターはデフォルト値で使用されます。ウェイトの正規化パラメーターがtrueに設定されているため、すべてのウェイトは0〜1の範囲で正規化されます。ソートウェイトパラメーターはtrueに設定され、ソート方向パラメーターは「昇順」に設定されます。重みの。これを確認するには、結果ワークスペースでこのプロセスの結果を表示します。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル