Superset
概要
この演算子は、2つのExampleSetを入力として受け取り、最初のExampleSetの新しい機能を2番目のExampleSetに追加し、その逆の場合も2つのスーパーセットを生成します。結果のスーパーセットは同じ属性セットを持ちますが、例は異なる場合があります。
詳細
Supersetオペレーターは、あるExampleSetの新しい機能を他のExampleSetに追加することにより、指定されたExampleSetsのスーパーセットを生成します。新しい機能の値は、スーパーセットの欠損値に設定されます。この演算子は、2つのスーパーセットを出力として提供します。1つ目は、最初のExampleSetのすべての属性と例+ 2つ目のExampleSetのすべての属性(値が欠落)2つ目は、2つ目のExampleSetのすべての属性と例両方のスーパーセットには同じ属性セットがありますが、例は異なる場合があります。スーパーセットには、1つの種類の特別な属性が1つしか含まれないことに注意することが重要です。デフォルトでは、この演算子はスーパーセットを生成するために、他のExampleSetに新しい「通常の」属性のみを追加します。たとえば、両方の入力ExampleSetにラベル属性がある場合、最初のスーパーセットには、最初のExampleSetのすべての属性(ラベルを含む)+ 2番目のExampleSetのすべての通常の属性が含まれます。 2番目のスーパーセットはそれに応じて動作します。 include特殊属性パラメーターを使用して、この動作を変更できます。ただし、このパラメーターがtrueに設定されている場合でも、結果のスーパーセットには種類の特別な属性が1つしか含まれないため、慎重に使用する必要があります。理解を深めるために、添付のプロセス例をご覧ください。
入力
- 例セット1 (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。メタデータで属性が指定されているため、入力用のデータにメタデータを添付する必要があります。
- サンプルセット2 (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。メタデータで属性が指定されているため、入力用のデータにメタデータを添付する必要があります。
出力
- スーパーセット1(IOObject)入力ExampleSetsの最初のスーパーセットは、このポートを介して配信されます。
- スーパーセット2(IOObject)入力ExampleSetsの2番目のスーパーセットは、このポートを介して配信されます。
パラメーター
- include_special_attributesこのパラメーターは、スーパーセットの生成に特別な属性を含める必要があるかどうかを示します 。この演算子は、結果のスーパーセットが特定の種類の特別な属性を1つしか持つことができないため、両方のExampleSetが同じ特別な属性を持っている場合は特に注意して使用する必要があります。 範囲:ブール
チュートリアルプロセス
GolfおよびIrisデータセットのスーパーセットの生成
このプロセスでは、Retrieve演算子を使用して「ゴルフ」および「虹彩」データセットがロードされます。入力ExampleSetsを見ることができるように、ブレークポイントがRetrieve演算子の後に挿入されます。プロセスを実行すると、最初に「ゴルフ」データセットが表示されます。これには4つの標準属性と1つの特殊属性があり、それぞれ14の例があります。プロセスを続行すると、「アイリス」データセットが表示されます。これには、4つの標準属性と2つの特殊属性があり、それぞれ150の例があります。両方のExampleSetのメタデータは非常に異なることに注意してください。 Superset演算子は、これら2つのExampleSetのスーパーセットを生成するために適用されます。結果のスーパーセットは、結果ワークスペースに表示されます。 1つのスーパーセットには、すべての属性と「Iris」データセットの例と「Golf」データセットの4つの通常の属性(欠損値)が含まれていることがわかります。もう1つのスーパーセットには、「ゴルフ」データセットのすべての属性と例+「アイリス」データセットの4つの通常の属性(欠損値あり)があります。