RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Map Clustering on Labels

概要

この演算子は、クラスター属性を予測属性に変換します。

詳細

ラベルのクラスタリングの演算子では、入力としてクラスター化されたExampleSetとクラスターモデルが必要です。これらの入力を使用して、特定のクラスタリングと予測の間のマッピングを推定します。指定されたラベルで指定されたクラスターを調整し、最適なペアを推定します。結果のExampleSetには、クラスター属性から派生した予測属性があります。

入力

  • サンプルセット (IOObject)この入力ポートには、クラスター化されたExampleSetが必要です。これは、添付のプロセス例のK-Means演算子の出力です。
  • クラスターモデル (セントロイドクラスターモデル)この入力ポートにはクラスターモデルが必要です。これは、添付のプロセス例のK-Means演算子の出力です。

出力

  • サンプルセット(IOObject)予測属性はクラスター属性から派生し、結果のExampleSetはこのポートを介して配信されます。
  • クラスターモデル(セントロイドクラスターモデル)入力として与えられたクラスターモデルは、このポートを介して出力を変更することなく渡されます。これは通常、他のオペレーターで同じクラスターモデルを再利用したり、結果ワークスペースでクラスターモデルを表示したりするために使用されます。

チュートリアルプロセス

ラベル上のマップクラスタリングオペレーターの概要

「Ripley-Set」データセットは、Retrieve演算子を使用してロードされます。ラベルもロードされますが、視覚化と比較にのみ使用され、クラスターの構築には使用されないことに注意してください。ラベル属性の他に、「Ripley-Set」には2つの実際の属性があります。 「att1」および「att2」。 K-Means演算子は、すべてのパラメーターのデフォルト値を使用してこのデータセットに適用されます。プロセスを実行すると、K-Means演算子によって2つの新しい属性が作成されていることがわかります。 id属性は、例を明確に区別するために作成されます。クラスター属性は、サンプルが属するクラスターを示すために作成されます。パラメーターkが2に設定されたため、2つのクラスターのみが可能です。これが、各例が「cluster_0」または「cluster_1」のいずれかに割り当てられている理由です

このクラスター化されたExampleSetとクラスターモデルは、ラベルのクラスター化演算子への入力として提供されます。結果のExampleSetは、結果ワークスペースで見ることができます。 ExampleSetに予測属性があることがわかります。この属性の値がクラスター属性から派生していることも確認できます。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル