RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

コーディング方法 (coding type)

(回答)

Golfデータセットを用いてご説明いたします。

①Codeing type: effect codingについて。

Nominal to Numericalのcoding typeをeffect codingに変更してください。

また、comparison groupsのEdit listを開き、図のように入力してください。

このEdit listで設定しているものは、変換しないものを設定していると思っていただければと思います。

つまり、この例ではOutlookのsunny、Windのtrueは変換しない、ということです。

 

以下の実行した結果を見てみてください。

左: 変換前のGolfデータセット

右: 変換後のGolfデータセット

Outlook=rainにtrueなら1、異なるなら0、Outlook=overcastにtrueなら1、異なるなら0になります。

ここでポイントなのが、Outlook=sunnyがなく、sunnyの部分は全て-1になっていることです。

このOutlook=sunnyが除かれているのが、先ほど設定したComparison groupsの部分です。

また、Windに関しても同様です。

Wind=trueがなく、trueの部分は全て-1になり、Wind=falseにtrueなら1に変換されています。

 

②Coding type: Unique integersについて。

Nominal to Numericalのcoding typeをunique_integersにします。

これで実行すると、結果は以下の右の図ようになります。

左: 変換前のGolfデータセット

右: 変換後のGolfデータセット

 

Coding typeのunique_integersは、項目ごとに番号を与えて変換していくものです。

例では、Outlookのsunnyが2、overcastが1、rainが0に変換されています。

また、Windに関してはfalseが1、trueが0になっています。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル