Mutual Information Matrix
概要
この演算子は、入力ExampleSetのすべての属性間の相互情報を計算し、相互情報マトリックスを返します。 2つの属性の相互情報量は、2つの属性の相互依存性を測定する量です。
詳細
相互情報量は、1つの属性が別の属性をどの程度伝えるかを測定する多くの量の1つです。これは無次元の量であり、別の属性の知識が与えられると、ある属性に関する不確実性の減少と考えることができます。高い相互情報は、不確実性の大幅な減少を示しています。低い相互情報は、わずかな減少を示します。 2つの属性間の相互情報がゼロの場合、変数は独立しています。
この演算子は、入力ExampleSetのすべての属性間の相互情報マトリックスを計算します。この単純な実装では、属性の組み合わせごとにデータスキャンが実行されるため、メモリ以外のテーブルでは時間がかかる場合があることに注意してください。
入力
- サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。
出力
- サンプルセット(IOObject)入力として指定されたExampleSetは、このポートを介して出力にいくつかの変更を加えた後に渡されます。このExampleSetは、入力ExampleSetとまったく同じではないことに注意してください。
- マトリックス(IOObject)入力ExampleSetのすべての属性の相互情報が計算され、結果のマトリックスがこのポートから返されます。
パラメーター
- number_of_binsこのパラメーターは、数値属性に使用されるビンの数を指定します。 範囲:整数
チュートリアルプロセス
多項式データセットの相互情報マトリックス
「多項式」データセットは、Retrieve演算子を使用してロードされます。 ExampleSetを表示できるように、ブレークポイントがここに挿入されます。 ExampleSetには5つの実際の属性があることがわかります。相互情報マトリックス演算子は、このExampleSetに適用されます。結果のマトリックスは、結果ワークスペースで表示できます。