Loop Clusters
概要
この演算子は、入力ExampleSetの各クラスターのサブプロセスを反復処理します。各反復で、サブプロセスはその反復のクラスターに属する例を受け取ります。
詳細
ループクラスター演算子は、ネストされた演算子です。つまり、サブプロセスがあります。ループクラスタオペレータが実行nは所与ExampleSet内のクラスタの数が倍の数のサブプロセス。指定されたExampleSetにはクラスター属性が必要です。 RapidMinerでは、クラスター属性を生成する多数のクラスタリング演算子(K-Means演算子など)を使用できます。サブプロセスは、反復の1つのクラスターの例、次の反復の次のクラスターの例などで実行されます。理解を深めるために、添付のプロセス例をご覧ください。
入力
- サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。 ExampleSetにはクラスターロールの属性が必要です。これは、添付のプロセス例のK-Means演算子の出力です。
- in (IOObject)このオペレーターは、複数の入力ポートを持つことができます。 1つの入力が接続されると、入力ポートの別の入力が使用可能になり、別の入力(ある場合)を受け入れる準備が整います。入力の順序は同じままです。オペレーターのポートで最初に配信されたオブジェクトは、サブプロセスのポートで最初に利用可能です。すべての出力を正しい順序で接続することを忘れないでください。チェーンのすべてのレベルで適切な数のポートが接続されていることを確認してください。
出力
- out(IOObject)このオペレーターは、複数の出力ポートを持つことができます。 1つの出力が接続されると、別の出力(ある場合)を配信する準備ができた別の出力ポートが使用可能になります。出力の順序は同じままです。サブプロセスの先出しポートで配信されるオブジェクトは、外部プロセスの先出し出力ポートで配信されます。すべての出力を正しい順序で接続することを忘れないでください。チェーンのすべてのレベルで適切な数のポートが接続されていることを確認してください。
チュートリアルプロセス
ループクラスターオペレーターの概要
「Ripley-Set」データセットは、Retrieve演算子を使用してロードされます。 K-Means演算子は、クラスター属性を生成するために適用されます。ここにブレークポイントが挿入され、クラスター化されたExampleSetを見ることができます。クラスタの役割を持つ属性があることがわかります。 cluster_0とcluster_1の2つの値があります。これは、ExampleSetに2つのクラスターがあることを意味します。次に、ループクラスター演算子が適用されます。ループクラスターオペレーターのサブプロセスは2回実行されます。各クラスターに1回。 Loop Clustersオペレーターのサブプロセスをご覧ください。 Log演算子はサブプロセスで適用されます。 Log演算子の前にブレークポイントが挿入されるため、各反復の例を見ることができます。最初の反復では、すべての例がcluster_1に属し、2番目の反復ではすべての例がcluster_0に属していることがわかります。