RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Turbo prep を使用したデータ変換

投稿日: 2022年6月2日
OS: MacOS Monterey
バージョン: RapidMiner 9.10

ここではTurbo Prepを使用して、データが負の値の場合は全て0に変換する例で使用方法をご紹介しますが、こちらを利用することでさまざまなデータへの変換が簡単に実現できます。

Studioを起動してTurbo Prepの画面を表示し、Load Dataを選択します。使用するデータを選択して「IMPORT DATA」をクリックします。

データの場所は「マイコンピューター」を選択します。「データのロケーションを選択してください」で「次のページ」をクリックします。「インポートするセル範囲を選択」でデータを確認します。「属性1」のデータには負の値が含まれているのがわかります。「次のページ」をクリックします。

「列のフォーマット」が表示されますので、問題なければそのまま「次のページ」をクリックします。次に保存先を選択して「終了」をクリックすると以下のようにデータが取り込まれます。次に、このデータを元に新たな属性を作成するので「GENERATE」をクリックします。

ここでさまざまな関数や数式を用いてデータ変換が行えます。ここでは負の値を0に変換するため下記のようなif関数を使用しています。

Nameに新規の属性名を入力し、Formulaに以下を入力します。

if([属性1]<=0,0,[属性1])

最後に「UPDATE PREVIEW」をクリックして値をプレビューします。負の値のみ0になっていることが確認できれば「COMMIT GENERATE」をクリックして作成を完了します。

以下のように新たな属性が追加されました。元データと比べても想定通りの結果になっています。最後にこのデータを出力します。「data」を右クリックしてメニューから「Export」を選択します。

ここではdataをRepositoryに保存するので、「Repository」を選択して「Next」をクリックします。

最後に出力するリポジトリのサブフォルダを選択し、dataの名前を設定して「Next」をクリックすると対象のフォルダにデータを出力することができます。データを確認すると想定通りの結果になっています。

 

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル