RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Scale by Weights

概要

この演算子は、指定された重みに従って入力ExampleSetをスケーリングします。この演算子は、重み0の属性を選択解除し、指定された重みに従って数値属性の新しい値を計算します。

詳細

重みによるスケール演算子は、重みがゼロでない属性を選択します。残りの数値属性の値は、ウェイト入力ポートで配信されたウェイトに基づいて再計算されます。数値属性の新しい値は、元の値にその属性の重みを掛けることによって計算されます。この演算子は、以前の重み付け方式で決定された重みに従って属性のサブセットを選択するために使用することはほとんどできません。この目的のために、指定された重み関係を満たす属性のみを選択する重みによる選択演算子を使用する必要があります。

入力

  • サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のサンプルプロセスのカイ二乗統計量による重みの出力です。他の演算子の出力も入力として使用できます。メタデータで属性が指定されているため、入力用のデータにメタデータを添付する必要があります。
  • 重りこのポートは属性の重みを想定しています。属性の重みを提供する演算子は多数あります。カイ二乗統計による重み演算子は、プロセス例で使用されます。

出力

  • サンプルセット(IOObject)重み0の属性は、入力ExampleSetから削除されます。残りの数値属性の値は、ウェイト入力ポートで提供されたウェイトに基づいて再計算されます。結果のExampleSetは、このポートを介して配信されます。

チュートリアルプロセス

ゴルフデータセットでの重量によるスケール演算子の適用

「ゴルフ」データセットは、検索演算子を使用してロードされます。カイ二乗統計による重み演算子が適用され、属性の重みが生成されます。ここにブレークポイントが挿入されます。ここで、属性とその重みを確認できます。 Wind、Humidity、Outlook、Temperatureの各属性の重みはそれぞれ0、0.438、0.450、1です。次に、重量によるスケール演算子が適用されます。 「ゴルフ」データセットは、サンプルセットの入力ポートで提供され、カイ二乗統計量による重み演算子によって計算された重みは、重み入力ポートで提供されます。ウェイトによるスケールオペレータは、ウェイトが0の属性、つまり風属性が削除されます。残りの数値属性(温度と湿度属性など)の値は、その重みに基づいて再計算されます。温度属性の重みは1であるため、その値は変更されません。湿度属性の重みは0.438であるため、元の値に0.438を乗算して、新しい値が計算されます。これは、結果ワークスペースで結果を表示することで確認できます。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル