Transpose
概要
この演算子は、入力ExampleSetを転置します。つまり、現在の行は出力ExampleSetの列になり、現在の列は出力ExampleSetの行になります。この演算子は、よく知られている行列の転置演算と非常によく似ています。
詳細
この演算子は、入力ExampleSetを転置します。つまり、現在の行は出力ExampleSetの列になり、現在の列は出力ExampleSetの行になります。つまり、すべての例または行が属性値を持つ列になり、各属性列が例の行になります。この演算子は、よく知られている行列の転置演算と非常によく似ています。行列の転置の転置は元の行列と同じですが、元のExampleSetのタイプとExampleSetの転置の転置は異なる可能性があるため、ここでは同じルールを適用できません。
id属性は、入力ExampleSetの一部である場合、IDSは、新しい属性の名前になります。古い属性の名前は、新しいid属性のid値に変換されます。他のすべての新しい属性は、変換後に通常の役割を持ちます。 transpose演算子の後にSet Role演算子を使用して、新しい属性に役割を割り当てることができます。
すべての古い属性が同じ値タイプを持つ場合、すべての新しい属性は同じ値タイプを持ちます。少なくとも1つの名義属性が入力ExampleSetの一部である場合、すべての新しい属性のタイプは名義になります。古い属性値がすべて混合数値である場合、すべての新しい属性のタイプは実数になります。この演算子は、メインメモリにデータのコピーを作成します。したがって、非常に大きなデータセットでは使用しないでください。
入力
- サンプル入力 (IOObject)この入力ポートには、ExampleSetが必要です。添付のプロセス例のRetrieveオペレーターの出力です。
出力
- 設定出力の例(IOObject)入力ExampleSetの転置は、このポートの出力です。
- オリジナル(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
チュートリアルプロセス
トランスポーズのさまざまなシナリオ
このサンプルプロセスには4つの異なるケースがあります。
ケース1:「ゴルフ」データセットは、Retrieveオペレーターを使用してロードされます。ここにブレークポイントが挿入されるため、Transpose演算子を適用する前にExampleSetを確認できます。 「ゴルフ」データセットにはid属性がないことがわかります。属性のタイプは、名義タイプの属性を含めて異なります。 [実行]ボタンを押して続行します。これで、Transpose演算子が ‘Golf’データセットに適用されます。ここにブレークポイントが挿入されるので、Transpose演算子の適用後にExampleSetを見ることができます。ここで、idロールを持つ新しい属性が作成されたことがわかります。新しいid属性の値は、古い属性の名前です。入力ExampleSetにはid属性がなかったため、新しい属性には「att_1」、「att_2」などの一般的な形式で名前が付けられます。入力ExampleSetに少なくとも1つの名義属性を含むさまざまなタイプの属性があったため、すべての新しい属性のタイプは名義です。
ケース2:「Iris」データセットは、Retrieve演算子を使用してロードされます。ここにブレークポイントが挿入されるため、Transpose演算子を適用する前にExampleSetを確認できます。 「Iris」データセットにid属性があることがわかります。属性のタイプは、名義タイプの属性を含めて異なります。 [実行]ボタンを押して続行します。これで、Transpose演算子が「Iris」データセットに適用されます。ここにブレークポイントが挿入されるので、Transpose演算子の適用後にExampleSetを見ることができます。ここで、idロールを持つ新しい属性が作成されたことがわかります。新しいid属性の値は、古い属性の名前です。古いExampleSetのIDは、新しい属性の名前になります。入力ExampleSetに少なくとも1つの名義属性を含む異なるタイプの属性があったため、すべての新しい属性のタイプは名義です。
ケース3:「Market-Data」データセットは、Retrieve演算子を使用してロードされます。ここにブレークポイントが挿入されるため、Transpose演算子を適用する前にExampleSetを確認できます。 「Market-Data」データセットには特別な属性がないことがわかります。すべての属性のタイプは整数です。 [実行]ボタンを押して続行します。ここで、Transpose演算子が ‘Market-Data’データセットに適用されます。ここにブレークポイントが挿入されるので、Transpose演算子の適用後にExampleSetを見ることができます。ここで、idロールを持つ新しい属性が作成されたことがわかります。新しいid属性の値は、古い属性の名前です。入力ExampleSetにはid属性がなかったため、新しい属性には「att_1」、「att_2」などの一般的な形式で名前が付けられます。入力ExampleSetに数字が混在するタイプの属性があったため、すべての新しい属性のタイプは本物です。
ケース4:「Golf-Testset」データセットは、Retrieveオペレーターを使用してロードされます。ここにブレークポイントが挿入されるため、Transpose演算子を適用する前にExampleSetを確認できます。転置演算子は、「Golf-Testset」データセットに適用されます。次に、Transpose演算子が最初のTranspose演算子の出力に適用されます。元のExampleSetの属性のタイプと、元のデータセットの転置の転置は異なることに注意してください。