Performance (Ranking)
概要
この演算子は、真のラベルの信頼ランクのコストを表すパフォーマンス値を提供します。
詳細
パフォーマンス(ランキング)演算子は、タスクに使用する必要があります。タスクでは、実際のクラスが選択されるだけでなく、比較的高い信頼度を受け取ることが重要です。
この演算子は、各ラベルの信頼度をソートし、実際のラベルのランク位置に応じて、コストが生成されます。これらのコストは、ranking_costsパラメーターで定義できます。コストは間隔全体で入力されるため、ランクごとにコスト値を入力する必要はありません。これらの間隔は、次の間隔の開始までまたは無限の開始ランクと範囲によって定義されます。最初に言及されたランクの前はすべてコスト0を受け取ります。ランクのカウントは0から始まるため、最も信頼できるラベルはランク0です。
コストはテーブルの右側に入力されます。
たとえば、真のラベルが最も高い信頼度で予測される場合にゼロのコストを割り当てたい場合、2番目に1、3番目に2、次の各に10を入力する必要があります。
1 1
2 2
3 10
入力
- ラベル付きデータこの入力ポートには、ラベル付きのExampleSetが必要です。モデルの適用演算子は、ラベル付きデータを提供するこのような演算子の良い例です。 ExampleSetにラベル属性と予測属性があることを確認してください。属性のラベルおよび予測ロールの詳細については、ロールの設定演算子を参照してください。
出力
- サンプルセット(IOObject)入力として与えられたExampleSetは、この出力ポートに変更なしで渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
- パフォーマンスこのポートはパフォーマンスベクターを提供します(ここでは、output-performance-vectorと呼びます)。パフォーマンスベクトルは、パフォーマンス基準値のリストです。パフォーマンスベクトルは、入力ExampleSetのラベル属性と予測属性に基づいて計算されます。 output-performance-vectorには、このPerformanceオペレーターによって計算されたパフォーマンス基準が含まれています(ここでは、calculated-performance-vectorと呼びます)。パフォーマンスベクトルもパフォーマンス入力ポートに入力された場合(ここではinput-performance-vectorと呼びます)、input-performance-vectorの基準もoutput-performance-vectorに追加されます。 input-performance-vectorとCalculated-performance-Vectorの両方に同じ基準があり、値が異なる場合、calculated-performance-vectorの値は出力ポートを介して配信されます。この概念は、添付のサンプルプロセスを調べることで簡単に理解できます。
パラメーター
- ranking costs実際のラベルが最も信頼度の高いラベルではない場合のコストを定義する表:範囲:リスト
チュートリアルプロセス
ゴルフデータセットにパフォーマンス(ランキング)演算子を適用
「ゴルフ」データセットは、検索演算子を使用してロードされます。すべてのパラメーターのデフォルト値を使用して、決定木演算子が適用されます。ディシジョンツリーオペレータによって生成されたツリーモデルは、モデルの適用オペレータを使用して「ゴルフテストセット」データセットに適用されます。モデルの適用演算子からのラベル付きデータは、パフォーマンス(ランキング)演算子に提供されます。ランキングコストパラメーターは上記のように構成されます。その結果、モデルの適用演算子によって行われた予測のコストを確認できます。