RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Select by Weights

概要

この演算子は、重みが入力重みに関して指定された基準を満たす入力ExampleSetの属性のみを選択します。

詳細

この演算子は、重みが入力重みに関して指定された基準を満たす入力ExampleSetの属性のみを選択します。入力ウェイトは、 ウェイト入力ポートから提供されます。重みによる属性選択の基準は、 重み関係パラメーターによって指定されます。

入力

  • サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。メタデータで属性が指定されているため、入力用のデータにメタデータを添付する必要があります。 Retrieveオペレーターは、メタデータとデータを提供します
  • 重りこのポートは属性の重みを想定しています。属性の重みを提供する演算子は多数あります。相関による重み演算子は、サンプルプロセスで使用されます。

出力

  • サンプルセット(IOObject)選択された属性を持つExampleSetは、このポートの出力です。
  • オリジナル(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
  • 重り重み入力ポートで提供された属性の重みは、この出力ポートを介して配信されます。

パラメーター

  • weight_relation重みがこの関係を満たす属性のみが選択されます。
    • greater:重みが重みパラメーターよりも大きい属性が選択されます。
    • greater_equals:重みがweightパラメーター以上の属性が選択されます。
    • equals:重みが重みパラメーターと等しい属性が選択されます。
    • less_equals:重みがweightパラメーター以下の属性が選択されます。
    • less:重みが重みパラメータより小さい属性が選択されます。
    • top_k:最も高い重みを持つk属性が選択されます。 kはkパラメータで指定されます。
    • bottom_k:最も低い重みを持つk属性が選択されます。 kはkパラメータで指定されます。
    • all_but_top_k:最大の重みを持つk属性以外のすべての属性が選択されます。 kはkパラメータで指定されます。
    • all_but_bottom_k:最小の重みを持つk属性以外のすべての属性が選択されます。 kはkパラメータで指定されます。
    • top_p%:最も高い重みを持つ上位pパーセント属性が選択されます。 pはpパラメーターで指定されます。
    • bottom_p%:最も低い重みを持つ下位pパーセント属性が選択されます。 pはpパラメーターで指定されます。

    範囲:

  • weightこのパラメーターは、重み関係パラメーターが「より大きい」、「より大きい」、「等しい」、「より小さい」または「より小さい」に設定されている場合にのみ使用可能です。このパラメーターは、重みを比較するために使用されます。 範囲:
  • kこのパラメーターは、重み関係パラメーターが「トッ​​プk」、「ボトムk」、「トップkを除くすべて」、または「ボトムkを除くすべて」に設定されている場合にのみ使用できます。選択する属性の数をカウントするために使用されます。 範囲:
  • pこのパラメーターは、重量関係パラメーターが「top p%」または「bottom p%」に設定されている場合にのみ使用できます。選択する属性の割合を指定するために使用されます。 範囲:
  • deselect_unknownこれはエキスパートパラメータです。このパラメーターは、重みが不明な属性をExampleSetから削除する必要があるかどうかを示します。 範囲:
  • use_absolute_weightsこれはエキスパートパラメータです。このパラメーターは、重みの絶対値を比較に使用するかどうかを示します。 範囲:

チュートリアルプロセス

Sonarデータセットから属性を選択する

「ソナー」データセットは、検索演算子を使用してロードされます。相関演算子による重みが適用され、属性の重みが生成されます。ここにブレークポイントが挿入されます。ここで、属性とその重みを確認できます。次に、重量で選択演算子が適用されます。 ‘Sonar’データセットはexamplesetポートで提供され、Weight by Correlationオペレーターによって計算された重みは重み入力ポートで提供されます。重み関係パラメーターは「bottom k」に設定され、kパラメーターは4に設定されます。したがって、最小の重みを持つ4つの属性が選択されます。ご覧のように、「attribute_57」、「attribute_17」、「attribute_30」、および「attribute_16」の重みが最も低いため、これら4つの属性が選択されています。また、ラベル属性「クラス」も選択されていることに注意してください。これは、重み条件に関係なく、特別な役割を持つ属性が選択されるためです。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル