RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Set Minus

概要

この演算子は、IDS( 減数ポートで指定された)他のExampleSet内に含まれていないExampleSet( 例えば、セット入力ポートに与えられる)のこれらの例を返します。両方のExampleSetsにID属性が必要です。両方のExampleSetのID属性は同じタイプである必要があります。

詳細

得ExampleSetすなわち、ID属性に基づいて2 ExampleSetsにこのオペレータが実行セットマイナスは、IDS減数ExampleSetに表示されない(で与えられる( 例えば、セット入力ポートに与えられる)被減数ExampleSetのすべての例が含まれています減数ポート)。 ExampleSetsが同じ列数または同じデータ型を持つ必要はないことに注意することが重要です。操作は、ExampleSetsのID属性のみに依存します。両方のExampleSetsのID属性が同じタイプ(つまり、両方が名義または両方が数値)であることを確認する必要があります。

分化

Intersect

Set MinusおよびIntersect演算子は、互いに反対であると見なすことができます。 Intersect演算子は、ID属性に基づいて2つのExampleSetでセットの交差を実行します。つまり、結果のExampleSetには、2番目のExampleSetにIDが現れる最初のExampleSetのすべての例が含まれます。

入力

  • サンプル入力 (IOObject)この入力ポートには、ExampleSetが必要です。この演算子は、ExampleSetにID属性がある場合にのみ機能するため、添付のプロセス例のID生成演算子の出力です。
  • 減数 (IOObject)この入力ポートには、ExampleSetが必要です。この演算子は、ExampleSetにID属性がある場合にのみ機能するため、添付のプロセス例のID生成演算子の出力です。

出力

  • 設定出力の例(IOObject)被減数ExampleSetの残りのサンプル(つまり、セットマイナスの後に残っているサンプル)を持つExampleSetは、このポートの出力です。
  • オリジナル(IOObject)入力として与えられたExampleSet(例の入力ポートで)は、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。

チュートリアルプロセス

Set Minusオペレーターの概要

「ゴルフ」データセットは、検索演算子を使用してロードされます。生成されたID演算子は、オフセットパラメータを0に設定して適用されます。したがって、「ゴルフ」データセットのIDは1〜14です。ここにブレークポイントが挿入され、「ゴルフ」データセットを確認できます。 。 「多項式」データセットは、Retrieve演算子を使用してロードされます。 Generate ID演算子は、offsetパラメーターを10に設定して適用されます。したがって、「Polynomial」データセットのIDは11〜210です。ブレークポイントがここに挿入され、「Polynomial」データセットを確認できます。 。

次に、マイナスの設定演算子が適用されます。 「ゴルフ」データセットはサンプル入力ポートで提供され、「多項式」データセットは減数ポートで提供されます。 ExampleSetsの順序は非常に重要です。 Set Minus演算子は、「Golf」データセットのIDと「Polynomial」データセットのIDを比較し、IDが「Polynomial」データセットに存在しない「Golf」データセットの例のみを返します。 「ゴルフ」データセットIDは1〜14で、「多項式」データセットIDは11〜210です。したがって、IDが1〜10の「ゴルフ」データセットの例は、セットマイナス演算子によって返されます。両方のExampleSetsのメタデータは非常に異なっていますが、Set Minus演算子はID属性のみに依存するため、問題ではないことに注意することが重要です。

Example SetがSet Minus演算子の入力ポートで切り替えられた場合、結果は大きく異なります。この場合、セットマイナス演算子は、「ゴルフ」データセットにIDが存在しない「多項式」データセットの例のみを返します。 「ゴルフ」データセットIDは1〜14で、「多項式」データセットIDは11〜210です。したがって、IDが15〜210の「多項式」データセットの例は、セットマイナス演算子によって返されます。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル