RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Intersect

概要

この演算子は、IDが他のExampleSet( 2番目のポートで指定)に含まれている最初のExampleSet( サンプルセットの入力ポートで指定)の例を返します。両方のExampleSetsにID属性が必要です。両方のExampleSetのID属性は同じタイプである必要があります。

詳細

得ExampleSetすなわち、ID属性に基づいて2 ExampleSetsにこのオペレータ行う積集合は、IDの第二のポートに与えられた(第2 ExampleSetに表示される( 例えば、セット入力ポートに与えられた)第ExampleSetのすべての例が含まれています)。 ExampleSetsが同じ列数または同じデータ型を持つ必要はないことに注意することが重要です。操作は、ExampleSetsのID属性のみに依存します。両方のExampleSetsのID属性が同じタイプ(つまり、両方が名義または両方が数値)であることを確認する必要があります。

分化

Set Minus

Set MinusおよびIntersect演算子は、互いに反対であると見なすことができます。 Set Minus演算子は、ID属性に基づいて2つのExampleSetに対してセットマイナスを実行します。つまり、結果のExampleSetには、2番目のExampleSetにIDが表示されない最初のExampleSetのすべての例が含まれます。

入力

  • サンプル入力 (IOObject)この入力ポートには、ExampleSetが必要です。この演算子は、ExampleSetにID属性がある場合にのみ機能するため、添付のプロセス例のID生成演算子の出力です。
  • 2番目 (IOObject)この入力ポートには、ExampleSetが必要です。この演算子は、ExampleSetにID属性がある場合にのみ機能するため、添付のプロセス例のID生成演算子の出力です。

出力

  • 設定出力の例(IOObject)最初のExampleSetの残りの例(つまり、積集合の後に残っている例)を持つExampleSetは、このポートの出力です。
  • オリジナル(IOObject)入力として与えられたExampleSet(例の入力ポートで)は、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。

チュートリアルプロセス

2つのExampleSetの交差

「ゴルフ」データセットは、検索演算子を使用してロードされます。生成されたID演算子は、オフセットパラメータを0に設定して適用されます。したがって、「ゴルフ」データセットのIDは1〜14です。ここにブレークポイントが挿入され、「ゴルフ」データセットを確認できます。 。 「多項式」データセットは、Retrieve演算子を使用してロードされます。 Generate ID演算子は、offsetパラメーターを10に設定して適用されます。したがって、「Polynomial」データセットのIDは11〜210です。ブレークポイントがここに挿入され、「Polynomial」データセットを確認できます。 。

次に、交差演算子が適用されます。 「ゴルフ」データセットは、セットの入力ポート例で提供され、「多項式」データセットは、2番目のポートで提供されます。 ExampleSetsの順序は非常に重要です。 Intersect演算子は、「Golf」データセットのIDと「Polynomial」データセットのIDを比較し、IDが「Polynomial」データセットに存在する「Golf」データセットの例のみを返します。 「ゴルフ」データセットIDは1〜14で、「多項式」データセットIDは11〜210です。したがって、IDが11〜14の「ゴルフ」データセットの例は、Intersect演算子によって返されます。両方のExampleSetsのメタデータは非常に異なることに注意することが重要ですが、Intersect演算子はID属性のみに依存するため、問題ではありません。

Intersectオペレーターの入力ポートでExampleSetが切り替えられた場合、結果は大きく異なります。この場合、Intersect演算子は、「Golf」データセットにidが存在する「Polynomial」データセットの例のみを返します。 「ゴルフ」データセットIDは1〜14で、「多項式」データセットIDは11〜210です。したがって、ID 11〜14の「多項式」データセットの例は、Intersect演算子によって返されます。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル