RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Select

概要

この演算子は、指定されたオブジェクトのコレクションから指定された単一のオブジェクトを返します。

詳細

Collectオペレーターのようなオペレーターは、可変数の入力オブジェクトを単一のコレクションに結合します。プロセスビューでは、コレクションは二重線で示されます。 Select演算子は、このコレクションから個々のオブジェクトを選択するために使用できます。 indexパラメーターは、必要なオブジェクトのインデックスを指定します。指定されたコレクションのオブジェクトがコレクション自体である場合、この演算子の出力は指定されたインデックスのコレクションになります。ただし、 展開パラメータがtrueに設定されている場合、インデックスは、フラット化されたリスト、つまり、ネストされたすべてのコレクションを要素で置き換えることにより入力リストから取得されたリストのインデックスを参照します。

コレクションは、多くのオブジェクトに同じ操作を適用する場合に役立ちます。 Collectオペレーターを使用すると、必要なオブジェクトを単一のコレクションに収集できます。LoopCollectionオペレーターを使用すると、すべてのコレクションを反復処理できます。最後に、Selectオペレーターを使用して必要な要素を個別に選択することで、コレクションから入力オブジェクトを分離できます。

入力

  • コレクション (コレクション)このポートは、入力としてオブジェクトのコレクションを想定しています。 Collectオペレーターのようなオペレーターは、可変数の入力オブジェクトを単一のコレクションに結合します。

出力

  • 選択済み(IOObject)インデックスパラメータで指定されたインデックスのオブジェクトは、このポートを介して返されます。

パラメーター

  • indexこのパラメーターは、オブジェクトのコレクション内で必要なオブジェクトのインデックスを指定します。 範囲:整数
  • unfoldこのパラメーターは、指定されたコレクションのオブジェクトがコレクション自体である場合にのみ適用できます。このパラメーターは、入力ポートで受信したコレクションを選択のために展開する必要があるかどうかを指定します。入力オブジェクト自体がコレクションであり、 unfoldパラメーターがfalseに設定されている場合、 indexパラメーターは指定されたインデックスのコレクションを参照します。ただし、 展開パラメータがtrueに設定されている場合、インデックスは、フラット化されたリスト、つまりネストされたすべてのコレクションを要素で置き換えることにより入力リストから取得されたリストのインデックスを参照します。 範囲:ブール

チュートリアルプロセス

コレクションの紹介

このプロセス例では、コレクションに関連するいくつかの重要なアイデアを説明しています。オブジェクトをコレクションに収集する方法を示し、その後、いくつかの前処理がコレクションに適用され、最終的にコレクションの個々の要素が必要に応じて分離されます。

「Golf」および「Golf-Testset」データセットは、Retrieveオペレーターを使用してロードされます。両方のExampleSetsは、サブプロセス演算子への入力として提供されます。サブプロセスは、ExampleSetでいくつかの前処理を実行し、出力ポートを介してそれらを返します。最初の出力ポートは、前処理された「ゴルフ」データセットを返します。このデータセットは、ディシジョンツリーオペレーターのトレーニングセットとして使用されます。 2番目の出力ポートは、事前処理された「Golf-Testset」データセットを提供します。これは、デシジョンツリーモデルを適用するモデルの適用演算子のテストセットとして使用されます。このモデルのパフォーマンスが測定され、結果ポートに接続されます。 ExampleSetsのトレーニングとテストは、結果ワークスペースでも確認できます。

次に、サブプロセス演算子のサブプロセスを見てみましょう。まず、Collectオペレーターは2つのExampleSetを単一のコレクションに結合します。結果がコレクションであることを示すCollectオペレーターの2行の出力に注意してください。次に、ループコレクション演算子がコレクションに適用されます。ループコレクション演算子は、コレクションの要素を反復処理し、それらの要素に対していくつかの前処理(この場合は属性の名前を変更)を実行します。ループ収集演算子のサブプロセスで、温度属性の名前を「新しい温度」に変更するために名前変更演算子が使用されていることがわかります。この名前の変更は、コレクションの両方のExampleSetで実行されることに注意することが重要です。結果のコレクションは、コレクションの2つのコピーを生成する乗算演算子に提供されます。最初のコピーは、選択演算子(インデックスパラメーター= 1)によって使用され、コレクションの最初の要素、つまり前処理された「ゴルフ」データセットを選択します。 2番目のコピーは、2番目の選択演算子(インデックスパラメーター= 2)によって使用され、コレクションの2番目の要素、つまり前処理された ‘Golf-Testset’データセットを選択します。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル