RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Collect

概要

この演算子は、複数の入力オブジェクトを単一のコレクションに結合します。

詳細

Collectオペレーターは、可変数の入力オブジェクトを単一のコレクションに結合します。すべての入力オブジェクトは同じIOObjectクラスである必要があることを知っておくことが重要です。プロセスビューでは、コレクションは二重線で示されます。入力オブジェクト自体がコレクションである場合、この演算子の出力はコレクションのコレクションになります。ただし、 展開パラメータがtrueに設定されている場合、出力は入力コレクションのすべての要素の和集合になります。オブジェクトをコレクションに結合した後、ループコレクション演算子を使用してこのコレクションを反復処理できます。 Select演算子を使用して、コレクションの必要な要素を取得できます。

コレクションは、多くのオブジェクトに同じ操作を適用する場合に役立ちます。 Collectオペレーターを使用すると、必要なオブジェクトを単一のコレクションに収集できます。LoopCollectionオペレーターを使用すると、すべてのコレクションを反復処理できます。最後に、Selectオペレーターを使用して必要な要素を個別に選択することで、入力オブジェクトをコレクションから分離できます。

入力

  • 入力 (IOObject)この演算子は複数の入力を持つことができます。 1つの入力が接続されると、別の入力ポート(使用可能な場合)を受け入れる準備ができた状態になります。入力の順序は同じままです。 Collectオペレーターの最初の入力ポートで提供されるオブジェクトは、結果のコレクションの最初の要素になります。すべての入力オブジェクトは同じIOObjectクラスでなければならないことに注意することが重要です。

出力

  • コレクション(コレクション)すべての入力オブジェクトは単一のコレクションに結合され、結果のコレクションはこのポートを介して配信されます。

パラメーター

  • unfoldこのパラメーターは、入力オブジェクトがコレクションである場合にのみ適用可能です。このパラメーターは、入力ポートで受信したコレクションを展開するかどうかを指定します。入力オブジェクト自体がコレクションであり、 展開パラメータがfalseに設定されている場合、この演算子の出力はコレクションのコレクションになります。ただし、 展開パラメータがtrueに設定されている場合、出力は入力コレクションのすべての要素の和集合になります。 範囲:ブール

チュートリアルプロセス

コレクションの紹介

このプロセス例では、コレクションに関連するいくつかの重要なアイデアを説明しています。このサンプルプロセスでは、オブジェクトをコレクションに収集し、コレクションにいくつかの前処理を適用し、最後に必要に応じてコレクションの個々の要素を分離する方法を示します。

「Golf」および「Golf-Testset」データセットは、Retrieveオペレーターを使用してロードされます。両方のExampleSetsは、サブプロセス演算子への入力として提供されます。サブプロセスは、ExampleSetでいくつかの前処理を実行し、出力ポートを介してそれらを返します。最初の出力ポートは、前処理された「ゴルフ」データセットを返します。このデータセットは、ディシジョンツリーオペレーターのトレーニングセットとして使用されます。 2番目の出力ポートは、事前処理された「Golf-Testset」データセットを提供します。これは、デシジョンツリーモデルを適用するモデルの適用演算子のテストセットとして使用されます。このモデルのパフォーマンスが測定され、結果ポートに接続されます。 ExampleSetsのトレーニングとテストは、結果ワークスペースでも確認できます。

次に、サブプロセス演算子のサブプロセスを見てみましょう。まず、Collectオペレーターは2つのExampleSetを単一のコレクションに結合します。結果がコレクションであることを示すCollectオペレーターの2行の出力に注意してください。次に、ループコレクション演算子がコレクションに適用されます。ループコレクション演算子は、コレクションの要素を反復処理し、それらの要素に対していくつかの前処理(この場合は属性の名前を変更)を実行します。ループ収集演算子のサブプロセスで、温度属性の名前を「新しい温度」に変更するために名前変更演算子が使用されていることがわかります。この名前の変更は、コレクションの両方のExampleSetで実行されることに注意することが重要です。結果のコレクションは、コレクションの2つのコピーを生成する乗算演算子に提供されます。最初のコピーは、選択演算子(インデックスパラメーター= 1)によって使用され、コレクションの最初の要素、つまり前処理された「ゴルフ」データセットを選択します。 2番目のコピーは、2番目の選択演算子(インデックスパラメーター= 2)によって使用され、コレクションの2番目の要素、つまり前処理された ‘Golf-Testset’データセットを選択します。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル