RapidMinerへのデータの読み込み
投稿日: 2020年9月7日
OS: Windows 10
バージョン: RapidMiner 9.7
注意:ここでは、一般的なCSVファイル、もしくはExcelのファイルを読み込む場合を想定しています。
データをRapidMinerで読み込むには、以下の2つの方法があります。
1. リポジトリから直接読み込む
2. オペレータを使用して読み込む
1. リポジトリから直接読み込む
リポジトリから直接読み込む場合は、リポジトリの上にある「データのインポート」をクリックします。
パソコンに保存されている場合は、「マイコンピューター」を選択します。
データが保存されている場所を探し、データを選択して「次のページ」をクリックします。
ここでは、データのフォーマットを設定します。
もしヘッダー行や開始行を変更したい場合は、「ヘッダー行」、「開始行」より変更してください。文字コードが異なる場合は「ファイルエンコーディング」より使用されている文字コードを選択します。
設定できれば、「次のページ」をクリックします。
最後に、列のフォーマットを設定します。ここでは、列名の変更やデータ型の変更、ロールを設定することができます。
列名を変更する場合は、歯車のマークを押して「列名の変更」より変更することができます。
型を変更する場合は、同じく歯車のマークより「型を変更」をクリックし、変更したい型を選択します。
ロールを変更する場合は、同じく歯車のマークをクリックし「ロールを変更」を選択します。
すべての設定が完了したら、「次のページ」をクリックします。
最後に、データの保存場所を選択し、名前を入力して「終了」をクリックします。
これでRapidMinerにデータが取り込まれます。
リポジトリに保存され、ExampleSetになりました。
2. オペレータを使用して読み込む
CSVファイルを読み込む場合は、Read CSVオペレータを使用します。
「設定ウィザードインポート」をクリックします。
※「設定ウィザードインポート」の下にあるパラメータを設定しても読み込めますが、できる限り「設定ウィザードインポート」を利用することをお勧めします。ウィザードを利用すると、数ステップで簡単に読み込むことができます。
データを選択して「次のページ」をクリックします。
ヘッダー行や文字コードを設定します。
1.の場合と設定は同じなので、細かい部分は割愛します。
次に、属性名やデータ型、ロールを設定します。
ここも、1.と同様なので割愛します。
設定できれば、「終了」をクリックしましょう。
設定できれば、プロセス画面に戻ります。
画面左上にある 実行ボタンをクリックします。
実行すると、CSVデータを読み込むことができました。
ただし、この状態では、まだ元のCSVファイルを読み込んでいるだけです。
リポジトリに保存して、次からドラッグ&ドロップで呼び出せるようにするには、Storeオペレータを用いましょう。
Read CSVの後ろにStoreオペレータを繋ぎ、フォルダのマークをクリックします。
保存するリポジトリを選択し、OKをクリックします。
もう一度 実行すると、読み込んだCSVファイルがリポジトリに保存されます。