コーディング方法 (coding type)
(回答)
Golfデータセットを用いてご説明いたします。
①Codeing type: effect codingについて。
Nominal to Numericalのcoding typeをeffect codingに変更してください。
また、comparison groupsのEdit listを開き、図のように入力してください。
このEdit listで設定しているものは、変換しないものを設定していると思っていただければと思います。
つまり、この例ではOutlookのsunny、Windのtrueは変換しない、ということです。
以下の実行した結果を見てみてください。
左: 変換前のGolfデータセット
右: 変換後のGolfデータセット
Outlook=rainにtrueなら1、異なるなら0、Outlook=overcastにtrueなら1、異なるなら0になります。
ここでポイントなのが、Outlook=sunnyがなく、sunnyの部分は全て-1になっていることです。
このOutlook=sunnyが除かれているのが、先ほど設定したComparison groupsの部分です。
また、Windに関しても同様です。
Wind=trueがなく、trueの部分は全て-1になり、Wind=falseにtrueなら1に変換されています。
②Coding type: Unique integersについて。
Nominal to Numericalのcoding typeをunique_integersにします。
これで実行すると、結果は以下の右の図ようになります。
左: 変換前のGolfデータセット
右: 変換後のGolfデータセット
Coding typeのunique_integersは、項目ごとに番号を与えて変換していくものです。
例では、Outlookのsunnyが2、overcastが1、rainが0に変換されています。
また、Windに関してはfalseが1、trueが0になっています。