RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Mutual Information Matrix

概要

この演算子は、入力ExampleSetのすべての属性間の相互情報を計算し、相互情報マトリックスを返します。 2つの属性の相互情報量は、2つの属性の相互依存性を測定する量です。

詳細

相互情報量は、1つの属性が別の属性をどの程度伝えるかを測定する多くの量の1つです。これは無次元の量であり、別の属性の知識が与えられると、ある属性に関する不確実性の減少と考えることができます。高い相互情報は、不確実性の大幅な減少を示しています。低い相互情報は、わずかな減少を示します。 2つの属性間の相互情報がゼロの場合、変数は独立しています。

この演算子は、入力ExampleSetのすべての属性間の相互情報マトリックスを計算します。この単純な実装では、属性の組み合わせごとにデータスキャンが実行されるため、メモリ以外のテーブルでは時間がかかる場合があることに注意してください。

入力

  • サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。

出力

  • サンプルセット(IOObject)入力として指定されたExampleSetは、このポートを介して出力にいくつかの変更を加えた後に渡されます。このExampleSetは、入力ExampleSetとまったく同じではないことに注意してください。
  • マトリックス(IOObject)入力ExampleSetのすべての属性の相互情報が計算され、結果のマトリックスがこのポートから返されます。

パラメーター

  • number_of_binsこのパラメーターは、数値属性に使用されるビンの数を指定します。 範囲:整数

チュートリアルプロセス

多項式データセットの相互情報マトリックス

「多項式」データセットは、Retrieve演算子を使用してロードされます。 ExampleSetを表示できるように、ブレークポイントがここに挿入されます。 ExampleSetには5つの実際の属性があることがわかります。相互情報マトリックス演算子は、このExampleSetに適用されます。結果のマトリックスは、結果ワークスペースで表示できます。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル