Drop Uncertain Predictions
概要
この演算子は、対応する信頼度が指定された最小信頼度より小さい場合、すべての予測を「不明」(欠損値)に設定します。この演算子は、信頼度の低い予測を削除するために使用されます。
詳細
Drop Uncertain Predictions演算子は、ラベル付きのExampleSet、つまり、ラベルと予測の属性が予測の信頼度とともに含まれるExampleSetを期待しています。最小信頼性しきい値は、 最小信頼性パラメーターによって指定されます。指定されたExampleSetのこれらの予測はすべて、対応する予測信頼度が指定されたしきい値を下回っている場合は削除されます。 2つの可能なクラス「positive」と「negative」を持つExampleSetがあるとします。 最小信頼性パラメーターが0.700に設定されている場合、「陽性」と予測されたが、対応する「信頼性(陽性)」値が0.700未満のすべての例は、欠損値として分類されます。同様に、ラベル値は、「負」と予測されたすべての例の欠損値に設定されますが、対応する信頼「(負)」値は0.700未満です。また、この演算子を使用すると、最小信頼度パラメーターを使用して、さまざまなクラスのさまざまな最小信頼しきい値を定義できます。
入力
- サンプル入力 (IOObject)この入力ポートには、ラベル付きのExampleSetが必要です。これは、添付のプロセス例のモデルの適用演算子の出力です。他の演算子の出力は、ラベルがExampleSetの場合、入力として使用することもできます。
出力
- 設定出力の例(IOObject)不確実な予測は削除され、結果のExampleSetはこのポートを介して配信されます。
- オリジナル(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
パラメーター
- class_handlingこのパラメータは、すべてのクラスを同等に処理するか、個々のクラスのしきい値を設定するかを定義するクラス処理のモードを指定します。
- balanced:この場合、すべてのクラスが等しく処理されます。つまり、ラベルのすべての可能な値に同じ信頼しきい値が適用されます。最小信頼性しきい値は、最小信頼性パラメーターによって指定されます。
- unbalanced:この場合、クラスは同等に処理されません。つまり、最小信頼度パラメーターを使用して、異なるクラスに異なる信頼しきい値を指定できます。
範囲:選択
- min_confidenceこのパラメーターは、 クラス処理パラメーターが「balanced」に設定されている場合にのみ使用可能です。このパラメーターは、すべてのクラスの最小信頼しきい値を設定します。この信頼度を下回る予測は削除されます。 範囲:実数
- min_confidencesこのパラメーターは、 クラス処理パラメーターが「unbalanced」に設定されている場合にのみ使用可能です。このパラメーターは、クラスの個々のしきい値を指定します。これらの信頼度を下回る予測は削除されます。 範囲:リスト
チュートリアルプロセス
Naive Bayes演算子の不確実な予測の削除
「ゴルフ」データセットは、検索演算子を使用してロードされます。 Naive Bayes演算子がそれに適用され、分類モデルが生成されます。結果の分類モデルは、モデルの適用演算子を使用して、「ゴルフテストセット」データセットに適用されます。ここにブレークポイントが挿入され、モデルの適用演算子によって生成されたラベル付きのExampleSetを確認できます。 10の例が「はい」として分類されていることがわかりますが、0.700を超える「確信(はい)」を持っているのは6つだけです。 2つの例のみが「いいえ」として分類されていますが、そのうちの1つだけが0.700を超える「信頼性(いいえ)」です。このラベルが付いたExampleSetは、不確実な予測の削除演算子に提供されます。最小信頼性パラメーターは0.7に設定されます。したがって、予測信頼度が0.7未満のすべての例は欠損値に設定されます。これは、結果ワークスペースで確認できます。 7つの例の予測信頼度は0.7未満であり、すべて削除されました。