RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Union

概要

この演算子は、入力ExampleSetの和集合を構築します。入力ExampleSetは、両方の入力ExampleSetの属性と例が結果のユニオンExampleSetの一部になるように結合されます。

詳細

Union演算子は、両方のExampleSetのすべての通常の属性がスーパーセットの一部になるように、両方の入力ExampleSetの機能のスーパーセットを構築します。両方のExampleSetに共通の属性はスーパーセットで2回繰り返されず、両方のExampleSetのデータを保持する単一の属性が作成されます。両方の入力ExampleSetの特殊属性が相互に互換性がある場合、両方の入力ExampleSetの例を含むスーパーセットには、1つの特殊属性のみが作成されます。 ExampleSetsの特殊属性に互換性がない場合、最初のExampleSetの特殊属性は保持されます。両方のExampleSetに同じ名前の属性がある場合、それらは相互に互換性があるはずです。そうしないと、エラーメッセージが表示されます。これは、添付のサンプルプロセスを調べることで理解できます。

入力

  • 例セット1 (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。メタデータで属性が指定されているため、入力用のデータにメタデータを添付する必要があります。
  • サンプルセット2 (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。メタデータで属性が指定されているため、入力用のデータにメタデータを添付する必要があります。

出力

  • ユニオン(IOObject)入力ExampleSetの和集合は、このポートを介して配信されます。

チュートリアルプロセス

Union of the GolfおよびGolf-Testsetデータセット

このプロセスでは、「Golf」データセットと「Golf-Testset」データセットがRetrieve演算子を使用してロードされます。入力ExampleSetsを見ることができるように、ブレークポイントがRetrieve演算子の後に挿入されます。プロセスを実行すると、最初に「ゴルフ」データセットが表示されます。ご覧のとおり、14の例があります。プロセスを続行すると、「Golf-Testset」データセットが表示されます。また、14の例があります。両方のExampleSetのメタデータはほぼ同じであることに注意してください。 Union演算子は、これら2つのExampleSetを単一のExampleSetに結合するために適用されます。結合されたExampleSetには、入力ExampleSetsからのすべての属性と例があるため、28の例があります。両方の入力ExampleSetには、同じ数の属性、同じ名前、および属性の役割があることがわかります。 Union ExampleSetにも同じ名前と役割を持つ同じ数の属性があるのはこのためです。ここで、Union演算子はAppend演算子と同じように動作します。つまり、2つのExampleSetの例を単純に互換性のあるメタデータと組み合わせます。

Union of the GolfおよびIrisデータセット

このプロセスでは、「Golf」データセットと「Iris」データセットがRetrieve演算子を使用してロードされます。入力ExampleSetsを見ることができるように、ブレークポイントがRetrieve演算子の後に挿入されます。プロセスを実行すると、最初に「ゴルフ」データセットが表示されます。ご覧のとおり、14の例があります。プロセスを続行すると、「アイリス」データセットが表示されます。 150個のサンプルを含む4つの通常属性と2つの特殊属性があります。両方のExampleSetのメタデータは非常に異なることに注意してください。 Union演算子は、これら2つのExampleSetを単一のExampleSetに結合するために適用されます。結合されたExampleSetには、入力ExampleSetsからのすべての属性と例があるため、164(14 + 150)の例があります。 「ゴルフ」データセットには、ラベルの役割を持つ属性「プレイ」属性があることに注意してください。 「Iris」データセットには、ラベルの役割を持つ属性「label」属性もあります。これら2つのラベル属性には互換性がないため、最初のExampleSetのラベル属性のみが保持されます。 ‘Iris’データセットの例では、結果のUnion ExampleSetのこの属性にnull値が含まれています。

Union of the Golf(with id attribute)and Iris data sets

このプロセスでは、「Golf」データセットと「Iris」データセットがRetrieve演算子を使用してロードされます。 Generate IDオペレーターは、ゴルフデータセットに適用され、id_1から始まる名目IDを生成します。ユニオン演算子の前にブレークポイントが挿入されるため、入力ExampleSetを確認できます。プロセスを実行すると、最初に「ゴルフ」データセットが表示されます。ご覧のとおり、14の例があります。 2つの特別な属性があります。プロセスを続行すると、「アイリス」データセットが表示されます。 150個のサンプルを含む4つの通常属性と2つの特殊属性があります。両方のExampleSetのメタデータは非常に異なることに注意してください。 Union演算子は、これら2つのExampleSetを単一のExampleSetに結合するために適用されます。結合されたExampleSetには、入力ExampleSetsからのすべての属性と例があるため、164(14 + 150)の例があります。 「ゴルフ」データセットには、ラベルの役割を持つ属性「プレイ」属性があることに注意してください。 「Iris」データセットには、ラベルの役割を持つ属性「label」属性もあります。これら2つのラベル属性には互換性がないため、最初のExampleSetのラベル属性のみが保持されます。 ‘Iris’データセットの例では、共用体ExampleSetのこの属性にnull値が含まれています。また、両方の入力ExampleSetにはid属性があることに注意してください。これらの属性の名前は同じで、両方とも名目上の値を持っているため、これら2つの属性は相互に互換性があります。したがって、結果のUnion ExampleSetに単一のid属性が作成されます。また、結果のExampleSetではidの値が一意ではないことに注意してください。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル