Loop Data Sets
概要
この演算子は、入力ポートで指定されたすべてのExampleSetのサブプロセスを反復処理します。
詳細
Loop Data Setsオペレーターのサブプロセスは、 n回実行されます。nは、このオペレーターへの入力として提供されるExampleSetの数です。この演算子を理解するには、サブプロセスの基本的な理解が必要です。サブプロセスに関する詳細については、サブプロセス演算子をご覧ください。各入力ExampleSetに対して、ループデータセット演算子は、演算子チェーンのようにサブプロセスの内部演算子を実行します。この演算子を使用して、多数の異なるデータセットでプロセスを連続して実行できます。 唯一の最適なパラメーターがtrueに設定されている場合、最適なパフォーマンスで反復中に生成された結果のみが出力として配信されます。このオプションでは、この演算子のサブプロセスのパフォーマンスポートにパフォーマンスベクトルをアタッチすることが必須です。ループデータセットオペレーターは、このパフォーマンスベクトルを使用して、最高のパフォーマンスの反復を選択します。
入力
- サンプルセット (IOObject)この演算子は複数の入力を持つことができます。 1つの入力が接続されると、別のExampleSet(存在する場合)を受け入れる準備ができた別の入力ポートが使用可能になります。入力の順序は同じままです。この演算子の最初の入力ポートで提供されるExampleSetは、ネストされたチェーンの最初の入力ポート(サブプロセス内)で使用できます。すべての入力を正しい順序で接続することを忘れないでください。サブプロセスレベルで適切な数のポートが接続されていることを確認してください。
出力
- 出力(IOObject)ループデータセットオペレーターは、複数の出力ポートを持つことができます。 1つの出力が接続されると、別の出力(ある場合)を配信する準備ができた別の出力ポートが使用可能になります。出力の順序は同じままです。サブプロセスの最初の出力ポートで配信されるオブジェクトは、外部プロセスの最初の出力で配信されます。すべての出力を正しい順序で接続することを忘れないでください。チェーンのすべてのレベルで適切な数のポートが接続されていることを確認してください。
パラメーター
- only_best 唯一の最適なパラメーターがtrueに設定されている場合、反復中に最高のパフォーマンスで生成された結果のみが出力として配信されます。このオプションでは、この演算子のサブプロセスのパフォーマンスポートにパフォーマンスベクトルをアタッチすることが必須です。ループデータセットオペレーターは、このパフォーマンスベクトルを使用して、最高のパフォーマンスの反復を選択します。 範囲:ブール
チュートリアルプロセス
最高のパフォーマンスを備えたExampleSetの選択
このプロセス例では、ループデータセットオペレーターの唯一の最適なパラメーターの使用方法について説明します。 「Golf」、「Golf-Testset」、および「Iris」データセットは、Retrieve演算子を使用してロードされます。これらのすべてのExampleSetは、Loop Data Setsオペレーターへの入力として提供されます。 Loop Data Setsオペレーターのサブプロセスをご覧ください。 Split Validationオペレーターは、指定されたExampleSetでK-NNモデルのトレーニングとテストに使用されます。検証の分割演算子は、モデルのパフォーマンスベクトルを返します。このパフォーマンスベクトルは、ループデータセットオペレーターが最高のパフォーマンスの反復を見つけるために使用します。唯一の最適なパラメーターがtrueに設定されているため、最高のパフォーマンスでの反復の結果が提供されます。
このプロセスが実行されると、「Iris」データセットが結果として配信されます。これは、「Iris」データセットでの反復のパフォーマンスベクトルが最高だったためです。 Split Validation演算子の後にブレークポイントを挿入してプロセスを再度実行すると、「Golf」、「Golf-Testset」、および「Iris」データセットの精度がそれぞれ25%、50%、93.33%であることがわかります。 ‘Iris’データセットの反復が最高のパフォーマンスを発揮したため、この演算子によって結果が返されます(最高のパラメーターのみがtrueに設定されていることを思い出してください)。この演算子は、モデルなどの他のオブジェクトを返すこともできます。