RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Select by Random

概要

この演算子は、指定されたExampleSetの属性のランダムなサブセットを選択します。

詳細

ランダム選択演算子は、入力ExampleSetからランダムに属性を選択します。 属性の固定数使用パラメーターがtrueに設定されている場合、必要な数の属性は、 number of attributesパラメーター指定されます。それ以外の場合、ランダムな数の属性が選択されます。ランダム化は、対応するパラメーターのシード値を変更することで変更できます。この演算子は、ループパラメーター演算子と組み合わせて使用​​したり、機能選択手法の有意差検定比較のベースラインとして使用したりできます。

入力

  • サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。メタデータで属性が指定されているため、入力用のデータにメタデータを添付する必要があります。 Retrieveオペレーターは、データとともにメタデータを提供します。

出力

  • サンプルセット(IOObject)選択された属性を持つExampleSetは、このポートの出力です。
  • オリジナル(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。

パラメーター

  • use_fixed_number_of_attributesこのパラメーターは、固定数の属性を選択する必要があるかどうかを指定します。 範囲:ブール
  • number_of_attributesこのパラメーターは、 use fixed number of attributesパラメーターがtrueに設定されている場合にのみ使用可能です。このパラメーターは、ランダムに選択する必要がある属性の数を指定します。 範囲:整数
  • use_local_random_seedこのパラメーターは、ランダム化にローカルランダムシードを使用する必要があるかどうかを示します。同じ値のローカルランダムシードを使用すると、同じExampleSetが生成されます。ローカルシードの値を変更すると、ランダム化が変更されるため、ExampleSetには異なる属性セットが含まれます。 範囲:ブール
  • local_random_seedこのパラメータは、 ローカルランダムシードを指定します。このパラメーターは、 ローカルシードの使用パラメーターがtrueに設定されている場合にのみ使用できます。 範囲:整数

チュートリアルプロセス

Sonarデータセットからランダム属性を選択する

「ソナー」データセットは、検索演算子を使用してロードされます。 ExampleSetを見ることができるように、ブレークポイントがここに挿入されます。 ExampleSetには60個の属性があります。ランダム選択演算子は、このExampleSetに適用されます。属性の固定数の使用パラメーターはtrueに設定され、属性の数パラメーターは10に設定されます。したがって、「ソナー」データセットから10個の属性がランダムに選択されます。結果のExampleSetは、結果ワークスペースで確認できます。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル