RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Generate Weight (Stratification)

概要

この演算子は、指定された重みをすべての例に分配し、重みがラベルごとに等しくなるようにします。

詳細

Generate Weight(Stratification)演算子は、すべての例で、 合計重量パラメーターで指定された重量を分割します。この演算子は、重みを分割するときに、すべてのラベル値の例の重みの合計が同じになるようにします。これにより、ラベル値の代表性が向上します。理解を深めるために、添付のプロセス例をご覧ください。

入力

  • サンプル入力 (IOObject)この入力ポートには、ExampleSetが必要です。添付のプロセス例のRetrieveオペレーターの出力です。

出力

  • 設定出力の例(IOObject)例には重みが割り当てられ、結果のExampleSetがこのポートを介して返されます。
  • オリジナル(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。

パラメーター

  • total_weightこのパラメーターは、すべての例に配分する必要がある総重量を指定します。 範囲:実数

チュートリアルプロセス

重みがラベルごとに等しくなるように重みを割り当てる

「ゴルフ」データセットは、検索演算子を使用してロードされます。 ExampleSetを見ることができるように、ブレークポイントがここに挿入されます。このExampleSetのラベルには、「yes」と「no」の2つの可能な値があることがわかります。ウェイトの割り当てには、このExampleSetにウェイトの生成(階層化)演算子が適用されます。総重量パラメーターは10に設定されます。この演算子は、次のような例に重量を割り当てます。すべての重量の合計が総重量に等しくなります。重みの合計はラベルごとに等しくなります。したがって、このプロセスでは、すべての重みの合計は10で、ラベル「no」の例の重みの合計は、ラベル「yes」の例の重みの合計と等しくなければなりません。結果ワークスペースで結果セットを表示することにより、これを確認できます。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル