Relevance Vector Machine
概要
この演算子は、関連性ベクトルマシン(RVM)の実装であり、分類と回帰の両方の確率論的な方法です。
詳細
Relevance Vector Machineオペレーターは、分類と回帰の両方の確率論的な方法です。関連性ベクトルマシンの実装は、「Tipping / 2001」で説明されている元のアルゴリズムに基づいています。 rvm typeパラメーターが ‘Constructive-Regression-RVM’に設定されている場合、周辺尤度最大化の高速バージョン( ‘Tipping / Faul / 2003’)も利用できます。
Relevance Vector Machine(RVM)は、ベイジアン推論を使用して回帰と分類の節約的なソリューションを取得する機械学習手法です。 RVMの機能形式はサポートベクターマシンと同じですが、確率的な分類を提供します。実際には、特定の共分散関数を持つガウスプロセスモデルと同等です。サポートベクターマシン(SVM)と比較して、RVMのベイジアン定式化により、SVMの一連の自由なパラメーター(通常、相互検証ベースの最適化が必要)が回避されます。ただし、RVMは期待値最大化(EM)に似た学習方法を使用するため、極小値のリスクがあります。これは、SVMで採用されている標準的な順次最小最適化(SMO)ベースのアルゴリズムとは異なり、グローバル最適を見つけることが保証されています。
入力
- トレーニングセット (IOObject)この入力ポートには、ExampleSetが必要です。この演算子はノミナル属性を処理できません。数値属性を持つデータセットに適用できます。したがって、多くの場合、この演算子を適用する前に、Nominal to Numerical演算子を使用する必要があります。
出力
- モデル(モデル)RVMが適用され、結果のモデルがこの出力ポートから配信されます。これで、このモデルを非表示のデータセットに適用できます。
- サンプルセット(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
パラメーター
- rvm_typeこのパラメーターは、RVM回帰のタイプを指定します。次のオプションを使用できます:Regression-RVM、Classification-RVM、Constructive-Regression-RVM。 範囲:選択
- kernel_typeカーネル関数のタイプは、このパラメーターを介して選択されます。次のカーネルタイプがサポートされています: rbf、cauchy、laplace、poly、sigmoid、Epanechnikov、gaussian combination、multiquadric Range:selection
- kernel_lengthscaleこのパラメータは、すべてのカーネルで使用される長さスケールを指定します。 範囲:実数
- kernel_degreeこれは、カーネルパラメータの次数です。これは、 カーネルタイプパラメーターがPolynomialまたはepachnenikovに設定されている場合にのみ使用できます。 範囲:実数
- kernel_biasこのパラメーターは、polyカーネルで使用されるバイアスを指定します。 範囲:実数
- kernel_sigma1これはカーネルパラメーターsigma1です。これは、 カーネルタイプパラメーターがepachnenikov 、 ガウスの組み合わせまたはmultiquadricに設定されている場合にのみ使用可能です。 範囲:実数
- kernel_sigma2これはカーネルパラメーターsigma2です。これは、 カーネルタイプパラメータがガウスの組み合わせに設定されている場合にのみ使用できます。 範囲:実数
- kernel_sigma3これはカーネルパラメーターsigma3です。これは、 カーネルタイプパラメータがガウスの組み合わせに設定されている場合にのみ使用できます。 範囲:実数
- kernel_shiftこれはカーネルパラメーターシフトです。これは、 カーネルタイプパラメーターがmultiquadricに設定されている場合にのみ使用できます。 範囲:実数
- kernel_aこれはカーネルパラメータaです。これは、 カーネルタイプパラメーターがsigmoid Range:realに設定されている場合にのみ使用可能です。
- kernel_bこれはカーネルパラメーターbです。これは、 カーネルタイプパラメーターがsigmoid Range:realに設定されている場合にのみ使用可能です。
- max_iterationこのパラメーターは、使用される反復の最大数を指定します。 範囲:整数
- min_delta_log_alpha最大のログアルファ変化が最小のデルタログアルファより小さい場合、反復は中止されます 。 範囲:実数
- alpha_max基底関数は、アルファがアルファmaxよりも大きい場合に枝刈りされます。 範囲:実数
- use_local_random_seedこのパラメーターは、ランダム化にローカルランダムシードを使用する必要があるかどうかを示します。同じ値のローカルランダムシードを使用すると、同じランダム化が生成されます。 範囲:ブール
- local_random_seedこのパラメータは、 ローカルランダムシードを指定します。このパラメーターは、 ローカルシードの使用パラメーターがtrueに設定されている場合にのみ使用できます。 範囲:整数
チュートリアルプロセス
RVMオペレーターの概要
「多項式」データセットは、Retrieve演算子を使用してロードされます。 Split Validationオペレーターは、回帰モデルのトレーニングとテストのために適用されます。 Relevance Vector Machineオペレーターは、Split Validationオペレーターのトレーニングサブプロセスで適用されます。すべてのパラメーターはデフォルト値で使用されます。 Relevance Vector Machineオペレーターは、回帰モデルを生成します。モデルの適用演算子は、テストサブプロセスで使用され、このモデルをテストデータセットに適用します。結果のラベルが付いたExampleSetは、モデルのパフォーマンスを測定するためにパフォーマンスオペレーターによって使用されます。回帰モデルとそのパフォーマンスベクトルは出力に接続され、結果ワークスペースで確認できます。