Gaussian Process
概要
この演算子は、分類と回帰の両方の確率的方法であるガウス過程(GP)の実装です。
詳細
ガウス過程は確率的過程であり、その実現は、そのようなランダム変数のそれぞれが正規分布を持つように、時間範囲(または空間)のすべての点に関連付けられたランダム値で構成されます。さらに、これらのランダム変数のすべての有限コレクションには、多変量正規分布があります。正規分布から継承されたプロパティのため、ガウス過程は統計モデリングで重要です。たとえば、ランダムプロセスがガウスプロセスとしてモデル化されている場合、さまざまな派生量の分布を明示的に取得できます。そのような量には次のものが含まれます。時間の範囲にわたるプロセスの平均値。少数の時間でサンプル値を使用して平均を推定する際のエラー。
ガウス過程(GP)は、多変量ガウス分布を無限次元に拡張します。正式には、範囲の有限サブセットが多変量ガウス分布に従うように、ガウスプロセスは何らかのドメイン全体に位置するデータを生成します。 Gaussian Processは、実世界の問題の包括的な確率モデルを構築するための強力なノンパラメトリック機械学習手法です。それらは、地球統計学、教師あり、教師なし、強化学習、主成分分析、システムの識別と制御、音楽パフォーマンスのレンダリング、最適化、および他の多くのタスクに適用できます。
入力
- トレーニングセット (IOObject)この入力ポートには、ExampleSetが必要です。この演算子はノミナル属性を処理できません。数値属性を持つデータセットに適用できます。したがって、多くの場合、この演算子を適用する前に、Nominal to Numerical演算子を使用する必要があります。
出力
- モデル (モデル)ガウス過程が適用され、結果のモデルがこの出力ポートから配信されます。これで、このモデルを非表示のデータセットに適用できます。
- サンプルセット (IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
パラメーター
- kernel_typeカーネル関数のタイプは、このパラメーターを介して選択されます。次のカーネルタイプがサポートされています: rbf、cauchy、laplace、poly、sigmoid、Epanechnikov、gaussian combination、multiquadric。 範囲:選択
- kernel_lengthscaleこのパラメータは、すべてのカーネルで使用される長さスケールを指定します。 範囲:実数
- kernel_degreeこれは、カーネルパラメータの次数です。これは、 カーネルタイプパラメーターがPolynomialまたはepachnenikovに設定されている場合にのみ使用できます。 範囲:実数
- kernel_biasこのパラメーターは、polyカーネルで使用されるバイアスを指定します。 範囲:実数
- kernel_sigma1これはカーネルパラメーターsigma1です。これは、 カーネルタイプパラメーターがepachnenikov 、 ガウスの組み合わせまたはmultiquadricに設定されている場合にのみ使用可能です。 範囲:実数
- kernel_sigma2これはカーネルパラメーターsigma2です。これは、 カーネルタイプパラメータがガウスの組み合わせに設定されている場合にのみ使用できます。 範囲:実数
- kernel_sigma3これはカーネルパラメーターsigma3です。これは、 カーネルタイプパラメータがガウスの組み合わせに設定されている場合にのみ使用できます。 範囲:実数
- kernel_shiftこれはカーネルパラメーターシフトです。これは、 カーネルタイプパラメーターがmultiquadricに設定されている場合にのみ使用できます。 範囲:実数
- kernel_aこれはカーネルパラメータaです。これは、 カーネルタイプパラメーターがsigmoid Range:realに設定されている場合にのみ使用可能です。
- kernel_bこれはカーネルパラメーターbです。これは、 カーネルタイプパラメーターがsigmoid Range:realに設定されている場合にのみ使用可能です。
- max_basis_vectorsこのパラメーターは、使用する基底ベクトルの最大数を指定します。 範囲:整数
- epsilon_tolこのパラメーターは、ガンマ誘導投影の許容値を指定します。 範囲:実数
- geometrical_tolこのパラメーターは、ジオメトリに起因する投影の許容値を指定します。 範囲:実数
チュートリアルプロセス
Gaussian Processオペレーターの概要
「多項式」データセットは、Retrieve演算子を使用してロードされます。 Split Validationオペレーターは、回帰モデルのトレーニングとテストのために適用されます。 Gaussian Processオペレーターは、Split Validationオペレーターのトレーニングサブプロセスに適用されます。すべてのパラメーターはデフォルト値で使用されます。ガウス過程演算子は、回帰モデルを生成します。モデルの適用演算子は、テストサブプロセスで使用され、このモデルをテストデータセットに適用します。結果のラベルが付いたExampleSetは、モデルのパフォーマンスを測定するためにパフォーマンスオペレーターによって使用されます。回帰モデルとそのパフォーマンスベクトルは出力に接続され、結果ワークスペースで確認できます。