RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Loop Parameters

概要

このオペレーターは、定義されたすべてのパラメーターの組み合わせについて、そのサブプロセスを反復処理します。パラメーターの組み合わせは、パラメーターで提供されるウィザードで設定できます。

詳細

ループパラメーターオペレーターは、ネストされたオペレーターです。パラメーターの選択値のすべての組み合わせに対してサブプロセスを実行します。これは、プロットまたはログ記録の目的や、場合によっては一種のメタステップとして内部オペレーターのパラメーターを単純に構成するのに非常に役立ちます。サブプロセスの結果はすべて、 出力ポートを介して配信されます。このオペレーターは並行して実行できます。

このオペレーターの構成全体は、 パラメーター設定パラメーターの編集によって行われます。このパラメーターの詳細な説明は、パラメーターのセクションに記載されています。

内部パフォーマンスポートを使用して、内部サブプロセスのパフォーマンスをログに記録できます。接続すると、ログが自動的に作成され、パラメーターログのすべての基準に応じて、実行回数、パラメーター設定、および配信されたパフォーマンスベクトルのすべての基準が取得されます 。プロセスの終了時に結果が配信されない場合、ログテーブルは自動的に表示されない場合でも結果ビューに表示されることに注意してください。

このオペレーターには、同期モードと非同期モードの2つのモードがあることに注意してください。これらは、 同期パラメーターの設定に依存します。後者では、すべてのパラメータの組み合わせが生成され、サブプロセスが各組み合わせに対して実行されます。同期モードでは、組み合わせは作成されませんが、パラメーター値は組み合わせのリストとして扱われます。単一のパラメーターに対する反復では、両方のモードに違いはありません。パラメーターの可能性の数は、同期モードのすべてのパラメーターで同じでなければならないことに注意してください。例として、2つのブール型パラメーターAおよびB(両方とも可能なパラメーター設定としてtrue(t)/ false(f)を持つ)は、非同期モードで4つの組み合わせ(t / t、f / t、t / f、 f / f)および同期モードの2つの組み合わせ(t / t、f / f)。

同期パラメーターがtrueに設定されていない場合、多数のパラメーターおよび/または多数のステップ(またはパラメーターの可能な値)を選択すると、膨大な数の組み合わせになります。たとえば、3つのパラメーターと各パラメーターに25ステップを選択した場合、組み合わせの合計数は17576を超えます(つまり、26 x 26 x 26)。サブプロセスは、考えられるすべての組み合わせに対して実行されます。このような膨大な数の反復のためにサブプロセスを実行するには、多くの時間がかかります。そのため、パラメータとその手順は常に慎重に制限してください。

分化

Optimize Parameters (Grid)

パラメーターの最適化(グリッド)オペレーターは、パラメーターの選択値のすべての組み合わせに対してサブプロセスを実行し、最適なパラメーター値を提供します。ループパラメーターオペレーターは、最適化オペレーターとは異なり、すべてのパラメーターの組み合わせを単純に繰り返します。これは、プロットの目的に特に役立ちます。

チュートリアルプロセス

SVMオペレーターのパラメーターを反復処理

「重み付け」データセットは、検索演算子を使用してロードされます。ループパラメーターオペレーターが適用されます。ループパラメーターオペレーターのパラメーター設定の編集パラメーターをご覧ください。 [選択されたパラメータ]ウィンドウで、SVMオペレータのCおよびガンマパラメータが選択されていることがわかります。 Selected ParametersウィンドウでSVM.Cパラメータをクリックすると、Cパラメータの範囲が0.001〜100000に設定されていることがわかります。11の値が(10段階で)対数的に選択されます。ここで、Selected ParametersウィンドウでSVM.gammaパラメーターをクリックすると、gammaパラメーターの範囲が0.001〜1.5に設定されていることがわかります。 11の値が(10段階で)対数的に選択されます。 2つのパラメーターには11の可能な値があるため、121(つまり11 x 11)の組み合わせがあります。同期パラメーターがfalseに設定されているため、サブプロセスはこれらの値のすべての組み合わせに対して実行され、したがって121回反復されます。すべての反復で、SVM(LibSVM)オペレーターのCおよび/またはガンマパラメーターの値が変更されます。 Cパラメーターの値は、最初の反復では0.001です。値は、最後の反復で100000に達するまで対数的に増加します。同様に、ガンマパラメーターの値は、最初の反復で0.001です。値は、最後の反復で1.5に達するまで対数的に増加します。

ループパラメーターオペレーターのサブプロセスをご覧ください。最初に、Split Data Operatorを使用して、データを2つの等しいパーティションに分割します。 SVM(LibSVM)オペレーターは1つのパーティションに適用されます。結果の分類モデルは、他のパーティションでモデルの適用演算子を使用して適用されます。テストパーティション上のSVMモデルの統計的パフォーマンスは、パフォーマンス(分類)演算子を使用して測定されます。最後に、ループパラメーターオペレーターはパラメーター設定とパフォーマンスを自動的に記録します。

ログには、次の4つのことが含まれます。ループパラメーターオペレーターの反復回数がカウントされます。これは「Iteration」という名前の列に保存されます。テストパーティションのパフォーマンスの分類エラーは、「分類エラー」という名前の列に記録されます。 SVM(LibSVM)オペレーターのCパラメーターの値は、「SVM.C」という名前の列に格納されます。 SVM(LibSVM)オペレーターのガンマパラメーターの値は、「SVM.gamma」という名前の列に格納されます。

プロセスを実行し、結果ビューを表示します。次に、Loop Parameters Operatorによって記録された値を見てみましょう。

パラメーター

  • edit_parameter_settingsパラメーターは、 パラメーター設定編集メニューから選択します。このメニューからパラメータとその可能な値を選択できます。このメニューには、この演算子のサブプロセス内のすべての演算子をリストする演算子ウィンドウがあります。あなたは演算子ウィンドウ内の任意のオペレータをクリックすると、そのオペレータのすべてのパラメータは、 パラメータのウィンドウに表示されます。メニューの矢印キーを使用して、任意のパラメーターを選択できます。選択したパラメーターは、 「選択したパラメーター」ウィンドウにリストされます。サブプロセスを反復するパラメーターのみを選択する必要があります。この演算子は、指定された範囲のパラメーター値を反復処理します。選択したすべてのパラメーターの範囲を指定する必要があります。選択したパラメーター([選択したパラメーター]ウィンドウのパラメーター )をクリックすると、[ グリッド/範囲値リスト ]オプションが有効になります。これらのオプションを使用すると、選択したパラメーターの値の範囲を指定できます。 MinおよびMaxフィールドは、それぞれ範囲の下限と上限を指定するためのものです。この範囲内のすべての値はチェックできないため、 stepsフィールドでは、指定された範囲からチェックする値の数を指定できます。最後に、 スケールオプションを使用すると、これらの値のパターンを選択できます。リストの形式で値を指定することもできます。 範囲:メニュー
  • error_handlingこのパラメーターを使用すると、内部プロセスの実行中に発生したエラーを処理する方法を選択できます。次のオプションがあります。
    • fail_on_error:エラーが発生した場合、プロセスの実行はエラーメッセージで失敗します。
    • ignore_error:エラーが発生した場合、エラーは無視され、プロセスの実行は次の反復で続行されます。

    範囲:選択

  • log_performanceこのパラメーターは、内部パフォーマンスポートが接続されている場合にのみ表示されます。接続されている場合、このパラメーターがtrueに設定されている場合、パラメーターセットを使用してパフォーマンスベクトルの主な基準が自動的に記録されます。 範囲:ブール
  • log_all_criteriaこのパラメーターにより、より多くのロギングが可能になります。 trueに設定すると、すべてのパフォーマンス基準がログに記録されます。 範囲:ブール
  • synchronizeこのオペレーターには、同期モードと非同期モードの2つのモードがあります。これらは、このパラメーターの設定に依存します。 falseに設定されている場合、すべてのパラメーターの組み合わせが生成され、それぞれの組み合わせに内側の演算子が適用されます。 trueに設定されている場合、組み合わせは作成されませんが、パラメーター値は組み合わせのリストとして扱われます。単一のパラメーターの反復では、両方のモードに違いはありません。パラメーターの可能性の数は、同期モードのすべてのパラメーターで同じでなければならないことに注意してください。 範囲:ブール
  • enable_parallel_executionこのパラメーターは、サブプロセスの並列実行を有効にします。メモリの問題が発生した場合は、並列実行を無効にしてください。 範囲:ブール

入力

  • 入力 (IOObject)この演算子は複数の入力を持つことができます。 1つの入力が接続されると、別の入力ポート(使用可能な場合)を受け入れる準備ができた別の入力ポートが使用可能になります。入力の順序は同じままです。このOperatorの最初の入力ポートで提供されるオブジェクトは、ネストされたチェーンの最初の入力ポート(サブプロセス内)で利用可能です。すべての入力を正しい順序で接続することを忘れないでください。サブプロセスレベルで適切な数のポートが接続されていることを確認してください。

出力

  • 出力(コレクション)サブプロセスの結果は、出力ポートを介して配信されます。このオペレーターは複数の出力を持つことができます。 1つの出力ポートが接続されると、別の出力ポートが使用可能になり、別の出力(ある場合)を配信する準備が整います。出力の順序は同じままです。サブプロセスの最初の出力ポートで配信されるオブジェクトは、オペレーターの最初の出力ポートで配信されます。すべての出力を正しい順序で接続することを忘れないでください。適切な数のポートが接続されていることを確認してください。
API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル