RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Aggregateオペレータで複数属性の集計

投稿日: 2022年6月7日
OS: Windows 10
バージョン: RapidMiner 9.10

Aggregateオペレータで集計する際、取得する属性を一つ一つ選ぶのは大変です。2、3属性なら問題ありませんが、10属性ともなると、設定するだけで大変な作業になってしまいます。

複数の属性に対して集計を行いたい場合は、use default aggregationオプションを使用するのが便利です。

このオプションを有効にすると、複数の属性に対して一括で集計を設定することができます。

 

集計を行う属性は、attribute filter typeパラメータで設定します。ここでは正規表現を用いて、「No」から始まる属性を選択しています。

 

次に、default aggregation functionパラメータで、選択した属性に対して行う集計方法を設定します。ここでは平均を取得するようにします。

 

use default aggregationの設定とは別に、従来の方法のaggregation attributesgroup by attributesの設定は有効です。use default aggregationで複数の属性に対して行いつつ、一部の属性に対しては異なる集計を取得することができます。

これら二つの方法を組み合わせて、集計を設定するのが便利です。

ここでは、aggregation attributesで「Age」属性には中央値を取得するよう設定します。

 

またgroup by attributesで「Survived」属性を基に集計するように設定します。

 

結果を確認すると、「No」から始まる属性には平均が、「Age」属性には中央値が取得できているのが確認できます。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル