Aggregateオペレータで複数属性の集計
投稿日: 2022年6月7日
OS: Windows 10
バージョン: RapidMiner 9.10
Aggregateオペレータで集計する際、取得する属性を一つ一つ選ぶのは大変です。2、3属性なら問題ありませんが、10属性ともなると、設定するだけで大変な作業になってしまいます。
複数の属性に対して集計を行いたい場合は、use default aggregationオプションを使用するのが便利です。
このオプションを有効にすると、複数の属性に対して一括で集計を設定することができます。
集計を行う属性は、attribute filter typeパラメータで設定します。ここでは正規表現を用いて、「No」から始まる属性を選択しています。
次に、default aggregation functionパラメータで、選択した属性に対して行う集計方法を設定します。ここでは平均を取得するようにします。
use default aggregationの設定とは別に、従来の方法のaggregation attributesやgroup by attributesの設定は有効です。use default aggregationで複数の属性に対して行いつつ、一部の属性に対しては異なる集計を取得することができます。
これら二つの方法を組み合わせて、集計を設定するのが便利です。
ここでは、aggregation attributesで「Age」属性には中央値を取得するよう設定します。
またgroup by attributesで「Survived」属性を基に集計するように設定します。
結果を確認すると、「No」から始まる属性には平均が、「Age」属性には中央値が取得できているのが確認できます。