Wrapper Split Validation
概要
機能の重み付けまたは選択ラッパーのパフォーマンスを確認するための簡単な検証方法。
詳細
この演算子は、特徴選択を含む特徴重み付けアルゴリズムのパフォーマンスを評価します。最初の内部演算子は、それ自体が評価される重み付けアルゴリズムです。データに適用される属性重みベクトルを返す必要があります。次に、2番目の内部演算子を使用して新しいモデルが作成され、3番目の内部演算子を使用してパフォーマンスが取得されます。このパフォーマンスベクトルは、実際のアルゴリズムのパフォーマンスインジケータとして機能します。この実装はRandomSplitValidationChainについて説明されています 。
入力
- 設定された例(IOObject) この入力ポートには、ExampleSetが必要です。このExampleSetのサブセットは、トレーニングおよびテストデータセットとして使用されます。
出力
- パフォーマンスベクトル出力(パフォーマンスベクトル)モデル評価サブプロセスは、各反復でパフォーマンスベクトルを返す必要があります。これは通常、モデルを適用し、そのパフォーマンスを測定することにより生成されます。この推定スキームによって計算される統計的性能は、完全な配信データセットに基づいて構築されたモデルで達成される性能の(正確な計算ではなく)推定にすぎないことに注意してください。
- 属性の重み(平均ベクトル)属性の重み付けサブプロセスは、各反復で属性の重みベクトルを返す必要があります。完全な入力ExampleSetで構築された属性重みベクトルは、このポートから配信されることに注意してください。
パラメーター
- split_ratioトレーニングセットの相対サイズ。 範囲:
- sampling_type Wrapper Split Validationオペレーターは、サブセットを構築するためにいくつかのタイプのサンプリングを使用できます。次のオプションが利用可能です。
- linear_sampling:線形サンプリングは、サンプルの順序を変更せずに、単にExampleSetをパーティションに分割します。つまり、連続したサンプルを持つサブセットが作成されます。
- shuffled_sampling:シャッフルサンプリングは、ExampleSetのランダムなサブセットを構築します。例は、サブセットを作成するためにランダムに選択されます。
- stratified_sampling:階層化サンプリングはランダムなサブセットを構築し、サブセット内のクラス分布がExampleSet全体と同じであることを保証します。たとえば、二項分類の場合、層化サンプリングでは、各サブセットにクラスラベルの2つの値のほぼ同じ割合が含まれるように、ランダムなサブセットが構築されます。
- automatic:自動モードでは、デフォルトで層別サンプリングが使用されます。適用できない場合、たとえばExampleSetに名義ラベルが含まれていない場合、シャッフルサンプリングが代わりに使用されます。
範囲:
- use_local_random_seedこのパラメーターは、サブセットの例をランダム化するためにローカルランダムシードを使用する必要があるかどうかを示します。 ローカルランダムシードの同じ値を使用すると、同じサブセットが生成されます。このパラメーターの値を変更すると、サンプルのランダム化方法が変更されるため、サブセットには異なるサンプルセットが含まれます。このパラメーターは、シャッフル、成層、または自動サンプリングが選択されている場合にのみ使用できます。ランダム化を必要としないため、線形サンプリングには使用できません。例は順番に選択されます。 範囲:
- local_random_seedこのパラメータは、 ローカルランダムシードを指定します。このパラメーターは、 ローカルシードの使用パラメーターがtrueに設定されている場合にのみ使用できます。 範囲: