RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Loop Collection

概要

この演算子は、オブジェクトのコレクションを繰り返し処理します。これはネストされた演算子であり、そのサブプロセスは指定されたコレクションの各オブジェクトに対して1回実行されます。

詳細

オブジェクトは、収集演算子を使用してコレクションにグループ化できます。プロセスビューでは、コレクションは二重線で示されます。ループコレクションオペレーターは、入力コレクション内のすべてのオブジェクトに対してサブプロセスを1回ループします。この演算子の出力もコレクションです。サブプロセスの追加の結果は、出力ポートを介して(コレクションとして)配信することもできます。 unfoldパラメーターがtrueに設定されている場合、出力は入力コレクションのすべての要素の和集合になります。

コレクションは、多くのオブジェクトに同じ操作を適用する場合に役立ちます。 Collectオペレーターを使用すると、必要なオブジェクトを単一のコレクションに収集できます。LoopCollectionオペレーターを使用すると、すべてのコレクションを反復処理できます。最後に、Selectオペレーターを使用して必要な要素を個別に選択することで、入力オブジェクトをコレクションから分離できます。

入力

  • コレクション (コレクション)この入力ポートにはコレクションが必要です。これは、添付のプロセス例のCollectオペレーターの出力です。

出力

  • 出力(コレクション)この演算子は複数の出力を持つことができます。 1つの出力が接続されると、別の出力(ある場合)を配信する準備ができた別の出力ポートが使用可能になります。出力の順序は同じままです。 Loop Collectionオペレーターのサブプロセスの最初の出力ポートで提供されるオブジェクトは、このオペレーターの最初の出力ポートを介して配信されます。オブジェクトはコレクションとして配信されます。

パラメーター

  • set_iteration_macroこのパラメーターは、ループにマクロを定義する必要があるかどうかを指定します。マクロ値は、反復ごとに増加します。マクロの名前と開始値は、それぞれマクロ名マクロ開始値パラメーターで指定できます。 範囲:ブール
  • macro_nameこのパラメーターは、 反復マクロ設定パラメーターがtrueに設定されている場合にのみ使用可能です。このパラメーターは、マクロの名前を指定します。 範囲:文字列
  • macro_start_valueこのパラメーターは、 反復マクロ設定パラメーターがtrueに設定されている場合にのみ使用可能です。このパラメーターは、マクロの開始値を指定します。マクロの値は、ループが繰り返されるたびに増加します。 範囲:整数
  • unfoldこのパラメーターは、入力ポートで受信したコレクションを展開するかどうかを指定します。 unfoldパラメーターがtrueに設定されている場合、出力は入力コレクションのすべての要素の和集合になります。 範囲:ブール

チュートリアルプロセス

コレクションの紹介

このプロセス例では、コレクションに関連するいくつかの重要なアイデアを説明しています。このサンプルプロセスでは、オブジェクトをコレクションに収集し、コレクションにいくつかの前処理を適用し、最後に必要に応じてコレクションの個々の要素を分離する方法を示します。

「Golf」および「Golf-Testset」データセットは、Retrieveオペレーターを使用してロードされます。両方のExampleSetsは、サブプロセス演算子への入力として提供されます。サブプロセスは、ExampleSetでいくつかの前処理を実行し、出力ポートを介してそれらを返します。最初の出力ポートは、前処理された「ゴルフ」データセットを返します。これは、ディシジョンツリーオペレーターのトレーニングセットとして使用されます。 2番目の出力ポートは、事前処理された「Golf-Testset」データセットを提供します。これは、デシジョンツリーモデルを適用するモデルの適用演算子のテストセットとして使用されます。このモデルのパフォーマンスが測定され、結果ポートに接続されます。 ExampleSetsのトレーニングとテストは、結果ワークスペースでも確認できます。

次に、サブプロセス演算子のサブプロセスを見てみましょう。まず、Collectオペレーターは2つのExampleSetを単一のコレクションに結合します。結果がコレクションであることを示すCollectオペレーターの2行の出力に注意してください。次に、ループコレクション演算子がコレクションに適用されます。ループコレクション演算子は、コレクションの要素を反復処理し、それらの要素に対していくつかの前処理(この場合は属性の名前を変更)を実行します。ループ収集演算子のサブプロセスで、温度属性の名前を「新しい温度」に変更するために名前変更演算子が使用されていることがわかります。この名前の変更は、コレクションの両方のExampleSetで実行されることに注意することが重要です。結果のコレクションは、コレクションの2つのコピーを生成する乗算演算子に提供されます。最初のコピーは、選択演算子(インデックスパラメーター= 1)によって使用され、コレクションの最初の要素、つまり前処理された「ゴルフ」データセットを選択します。 2番目のコピーは、2番目の選択演算子(インデックスパラメーター= 2)によって使用され、コレクションの2番目の要素、つまり前処理された「Golf-Testset」データセットを選択します。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル