RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

De-Pivot

概要

この演算子は、選択した属性(通常は同じ特性を測定する属性)の例を単一の属性の例に変換することにより、ExampleSetを変換します。

詳細

この演算子は、通常、ExampleSetに同じ特性を測定する複数の属性があり(異なる時間間隔で)、情報を失うことなくこれらの観測を単一の属性にマージする場合に使用されます。元のExampleSetに同じ特性を測定するn個の例とk個の属性がある場合、この演算子の適用後、ExampleSetにはk x n個の例があります。 k個の属性は1つの属性に結合されます。この属性には、 k個の属性それぞれのn個の例があります。これは、添付のサンプルプロセスを調べることで簡単に理解できます。

言い換えれば、この演算子は、(異なる時間に)複数の観測から成る例を複数の例に分割することによりExampleSetを変換します。各例は1つの時点をカバーします。インデックス属性がExampleSetに追加されます。これは、変換後の例が属する実際の時点を示します。

keep missingsパラメーターは、特定の時点ですべてのシリーズの欠損値がある場合でも、サンプルを保持するかどうかを指定します。 名義インデックス作成パラメータは、例ごとに時系列が1つだけ存在する場合にのみ適用できます。数値インデックスを使用する代わりに、単一の時点を表す属性の名前がインデックス属性値として使用されます。

入力

  • サンプル入力 (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のサブプロセス演算子の出力です。他の演算子の出力も入力として使用できます。

出力

  • 設定出力の例(IOObject)選択した属性が新しい属性の例に変換され、結果のExampleSetがこのポートの出力になります。
  • オリジナル(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。

パラメーター

  • attribute_nameこのパラメーターは、多数のソース属性を結果属性にマップします。属性名パラメーターは、結合する属性のグループと新しい属性の名前を指定するために使用されます。グループの属性は、正規表現を介して選択されます。各グループが複数の属性を持つ多数のグループが存在する場合があります。 範囲:リスト
  • index_attributeこのパラメーターは、新しく作成されたインデックス属性の名前を指定します。インデックス属性は、変換後のグループの異なる属性の例を区別するために使用されます。 範囲:文字列
  • create_nominal_index 名義インデックス作成パラメータは、例ごとに時系列が1つだけ存在する場合にのみ適用できます。数値インデックスを使用する代わりに、単一の時点を表す属性の名前がインデックス属性値として使用されます。 範囲:ブール
  • keep_missings keep missingsパラメーターは、特定の時点ですべての系列の欠損値がある場合でも、サンプルを保持するかどうかを指定します。 範囲:ブール

チュートリアルプロセス

同じ特性を測定する複数の属性を単一の属性にマージする

このプロセスは、ExampleSetを提供するSubprocessオペレーターで始まります。サブプロセスはサンプルExampleSetの作成に使用されるため、サブプロセス内で何が起こっているかを理解することは重要ではありません。 ExampleSetを見ることができるように、サブプロセスの後にブレークポイントが挿入されます。 ExampleSetには14の例があり、「朝」と「夕方」の2つの属性があることがわかります。これらの属性は、それぞれ朝と夕方の地域の温度を測定します。これらの属性を単一の属性に変換したいのですが、朝と夜の気温を区別できるようにします。

このタスクを実行するには、このExampleSetにDe-Pivot演算子を適用します。属性名パラメーターは、結合する属性のグループと新しい属性の名前を指定するために使用されます。グループの属性は、正規表現を介して選択されます。各グループが複数の属性を持つ多数のグループが存在する場合があります。この場合、ExampleSetのすべての属性(つまり、「朝」と「夕方」の両方の属性)を持つグループは1つだけです。新しい属性の名前は「Temperatures」で、ExampleSetのすべての属性を選択するために正規表現「。*」が使用されます。インデックス属性は、変換後のグループの異なる属性の例を区別するために使用されます。インデックス属性の名前は「時間」に設定されます。作成されたExampleSetがより自明であるように、名義インデックスの作成パラメーターもtrueに設定されます。

プロセスを実行し、結果のExampleSetを見てください。このExampleSetには28の例があることがわかります。元のExampleSetには14の例があり、2つの属性がグループ化されていたため、結果のExampleSetには28(つまり14 x 2)の例があります。 「Temperatures」属性には、Morning属性の14の例とEvening属性の14の例があります。 「時間」属性は、例が朝の温度を測定するか夕方の温度を測定するかを説明します。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル