Default Model
概要
この演算子は、指定されたデフォルト値を予測として提供するモデルを生成します。
詳細
デフォルトモデル演算子は、すべての例でラベルに指定されたデフォルト値を予測するモデルを生成します。デフォルト値の生成に使用する方法は、 methodパラメーターを使用して選択できます。数値ラベルの場合、デフォルト値はラベル値の中央値または平均にすることができます。または、 定数パラメーターを使用して定数のデフォルト値を指定できます。公称値の場合、ラベルのモードを使用できます。属性の値は予測として使用できます。属性は、 attributeパラメーターを介して選択できます。この演算子は、「実際の」予測タスクには使用しないでくださいが、「実際の」学習スキームの結果と推測を比較するために使用できます。
入力
- トレーニングセット (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。
出力
- モデル(モデル)デフォルトのモデルは、この出力ポートから配信されます。このモデルは、ラベル属性の予測のために、見えないデータセットに適用できるようになりました。このモデルは「実際の」予測タスクには使用しないでくださいが、「実際の」学習スキームの結果と推測を比較するのに使用できます。
- サンプルセット(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
パラメーター
- methodこのパラメータは、デフォルト値を計算する方法を指定します。数値ラベルの場合、デフォルト値はラベル値の中央値または平均にすることができます。または、 定数パラメーターを使用して定数のデフォルト値を指定できます。公称値の場合、ラベルのモードを使用できます。属性の値は予測として使用できます。属性は、 attributeパラメーターを介して選択できます。 範囲:選択
- constantこのパラメーターは、 methodパラメーターが「constant」に設定されている場合にのみ使用可能です。このパラメーターは、数値ラベルの定数のデフォルト値を指定します。 範囲:実数
- attributeこのパラメーターは、 methodパラメーターが「attribute」に設定されている場合にのみ使用可能です。このパラメーターは、予測値を取得する属性を指定します。名義ラベルに適用する場合は、選択した属性がラベルと同じ可能な値のセットを持っていることを確認する必要があります。 範囲:文字列
チュートリアルプロセス
「mode」メソッドでデフォルトモデル演算子を使用する
「ソナー」データセットは、検索演算子を使用してロードされます。 ExampleSetを見ることができるように、ブレークポイントがここに挿入されます。 「Rock」と「Mine」の2つの可能なラベル値があることがわかります。最も頻繁に発生するラベル値は「Mine」です。スプリット検証演算子は、分類モデルのトレーニングとテストのためにこのExampleSetに適用されます。 Default Modelオペレーターは、Split Validationオペレーターのトレーニングサブプロセスに適用されます。デフォルトモデル演算子のメソッドパラメーターは「モード」に設定されているため、すべての例で最も頻繁に発生するラベル値(「鉱山」)が予測として使用されます。モデルの適用演算子は、デフォルトモデル演算子によって生成されたモデルを適用するためのテストサブプロセスで使用されます。ここにブレークポイントが挿入され、ExampleSetというラベルが表示されます。すべての例が「鉱山」として予測されていることがわかります。このラベルが付いたExampleSetは、モデルのパフォーマンスを測定するためにパフォーマンスオペレーターによって使用されます。デフォルトのモデルとそのパフォーマンスベクトルは出力に接続されており、結果ワークスペースで確認できます。