Vote
概要
この演算子は、内部学習者(つまり、サブプロセスの学習演算子)の予測に加えて、多数決(分類)または平均(回帰)を使用します。
詳細
投票演算子はネストされた演算子です。つまり、サブプロセスがあります。サブプロセスには、ベース学習器と呼ばれる少なくとも2つの学習器が必要です。この演算子は、ExampleSetと学習器に応じて分類モデルまたは回帰モデルを構築します。この演算子は、サブプロセスで提供される基本学習器の予測に加えて、多数決(分類用)または平均(回帰用)を使用します。この演算子を適用するには、サブプロセスの基本的な理解が必要です。サブプロセスの基本的な理解については、サブプロセス演算子のドキュメントをご覧ください。サブプロセス内のすべての演算子チェーンは、ExampleSetを受け入れ、モデルを返す必要があります。
分類タスクの場合、Vote演算子のサブプロセス内のすべての演算子は、指定されたExampleSetを受け入れ、分類モデルを生成します。未知の例の予測では、投票演算子はそのサブプロセスからすべての分類モデルを適用し、予測されたクラスに最大投票数を未知の例に割り当てます。同様に、回帰タスクの場合、投票演算子のサブプロセス内のすべての演算子は、指定されたExampleSetを受け入れ、回帰モデルを生成します。未知の例の予測では、投票演算子はそのサブプロセスからのすべての回帰モデルを適用し、すべての予測値の平均を未知の例に割り当てます。
入力
- トレーニングセット (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。
出力
- モデル(多数決モデル)この出力ポートから、分類または回帰の単純な投票モデルが提供されます。このモデルは、ラベル属性の予測のために、見えないデータセットに適用できます。
チュートリアルプロセス
分類に投票演算子を使用する
「ソナー」データセットは、検索演算子を使用してロードされます。スプリット検証演算子は、モデルのトレーニングとテストのために適用されます。投票演算子は、スプリット検証演算子のトレーニングサブプロセスで適用されます。 3人の学習者が投票演算子のサブプロセスに適用されます。これらの基本学習者は、ディシジョンツリー、ニューラルネットワーク、SVMです。投票演算子は、各学習者の投票を使用して例の分類を行い、最大投票数の予測が未知の例に割り当てられます。言い換えると、3人の基本学習者の予測を使用して、(単純な投票を使用して)組み合わせた予測を行います。モデルの適用演算子は、投票演算子によって生成されたモデルを適用するために、スプリット検証演算子のテストサブプロセスで使用されます。結果のラベルが付いたExampleSetは、モデルのパフォーマンスを測定するためにパフォーマンスオペレーターによって使用されます。投票モデルとそのパフォーマンスベクトルは出力に接続されており、結果ワークスペースで確認できます。