Generate Weight (Stratification)
概要
この演算子は、指定された重みをすべての例に分配し、重みがラベルごとに等しくなるようにします。
詳細
Generate Weight(Stratification)演算子は、すべての例で、 合計重量パラメーターで指定された重量を分割します。この演算子は、重みを分割するときに、すべてのラベル値の例の重みの合計が同じになるようにします。これにより、ラベル値の代表性が向上します。理解を深めるために、添付のプロセス例をご覧ください。
入力
- サンプル入力 (IOObject)この入力ポートには、ExampleSetが必要です。添付のプロセス例のRetrieveオペレーターの出力です。
出力
- 設定出力の例(IOObject)例には重みが割り当てられ、結果のExampleSetがこのポートを介して返されます。
- オリジナル(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
パラメーター
- total_weightこのパラメーターは、すべての例に配分する必要がある総重量を指定します。 範囲:実数
チュートリアルプロセス
重みがラベルごとに等しくなるように重みを割り当てる
「ゴルフ」データセットは、検索演算子を使用してロードされます。 ExampleSetを見ることができるように、ブレークポイントがここに挿入されます。このExampleSetのラベルには、「yes」と「no」の2つの可能な値があることがわかります。ウェイトの割り当てには、このExampleSetにウェイトの生成(階層化)演算子が適用されます。総重量パラメーターは10に設定されます。この演算子は、次のような例に重量を割り当てます。すべての重量の合計が総重量に等しくなります。重みの合計はラベルごとに等しくなります。したがって、このプロセスでは、すべての重みの合計は10で、ラベル「no」の例の重みの合計は、ラベル「yes」の例の重みの合計と等しくなければなりません。結果ワークスペースで結果セットを表示することにより、これを確認できます。