K-Medoids
概要
この演算子は、 k-medoidsアルゴリズムを使用してクラスタリングを実行します。クラスタリングは、互いに類似しており、他のクラスターに属するオブジェクトとは異なるオブジェクトをグループ化することに関係しています。クラスタリングは、ラベルのないデータから情報を抽出するための手法です。 k-medoidsクラスタリングは排他的なクラスタリングアルゴリズムです。つまり、各オブジェクトはクラスターのセットの1つに正確に割り当てられます。
詳細
この演算子は、k-medoidsアルゴリズムを使用してクラスタリングを実行します。 K-medoidクラスタリングは、排他的なクラスタリングアルゴリズムです。つまり、各オブジェクトはクラスターのセットの1つに正確に割り当てられます。 1つのクラスター内のオブジェクトは互いに似ています。オブジェクト間の類似性は、オブジェクト間の距離の尺度に基づいています。
クラスタリングは、互いに類似しており、他のクラスターに属するオブジェクトとは異なるオブジェクトをグループ化することに関係しています。これは、ラベルのないデータから情報を抽出するための手法であり、多くのさまざまなシナリオで非常に役立ちます。たとえば、同様の購入行動を持つ顧客のクラスターを見つけることに関心があるマーケティングアプリケーションなどです。
以下に、k-medoidsアルゴリズムの仕組みを簡単に説明します。まず最初に、一般にその重心と呼ばれるクラスターの中心の概念を導入する必要があります。ユークリッド距離または類似のものを尺度として使用すると仮定すると、クラスターの重心を、各属性値がクラスター内のすべてのポイントの対応する属性の値の平均となるポイントとして定義できます。クラスターの重心は、常にクラスター内のポイントの1つになります。これは、k-meansアルゴリズムとk-medoidsアルゴリズムの主な違いです。 k-meansアルゴリズムでは、クラスターの重心は多くの場合、クラスター自体の一部ではなく、その中心をマークするために使用できる想像上の点になります。 k-meansアルゴリズムの詳細については、k-means演算子をご覧ください。