RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

RapidMinerへのデータの読み込み

投稿日: 2020年9月7日
OS: Windows 10
バージョン: RapidMiner 9.7

注意:ここでは、一般的なCSVファイル、もしくはExcelのファイルを読み込む場合を想定しています。

データをRapidMinerで読み込むには、以下の2つの方法があります。

1. リポジトリから直接読み込む
2. オペレータを使用して読み込む

1. リポジトリから直接読み込む

リポジトリから直接読み込む場合は、リポジトリの上にある「データのインポート」をクリックします。

パソコンに保存されている場合は、「マイコンピューター」を選択します。

データが保存されている場所を探し、データを選択して「次のページ」をクリックします。

ここでは、データのフォーマットを設定します。

もしヘッダー行や開始行を変更したい場合は、「ヘッダー行」、「開始行」より変更してください。文字コードが異なる場合は「ファイルエンコーディング」より使用されている文字コードを選択します。

設定できれば、「次のページ」をクリックします。

最後に、列のフォーマットを設定します。ここでは、列名の変更やデータ型の変更、ロールを設定することができます。

列名を変更する場合は、歯車のマークを押して「列名の変更」より変更することができます。

型を変更する場合は、同じく歯車のマークより「型を変更」をクリックし、変更したい型を選択します。

ロールを変更する場合は、同じく歯車のマークをクリックし「ロールを変更」を選択します。

すべての設定が完了したら、「次のページ」をクリックします。

最後に、データの保存場所を選択し、名前を入力して「終了」をクリックします。

これでRapidMinerにデータが取り込まれます。

リポジトリに保存され、ExampleSetになりました。

2. オペレータを使用して読み込む

CSVファイルを読み込む場合は、Read CSVオペレータを使用します。

「設定ウィザードインポート」をクリックします。

※「設定ウィザードインポート」の下にあるパラメータを設定しても読み込めますが、できる限り「設定ウィザードインポート」を利用することをお勧めします。ウィザードを利用すると、数ステップで簡単に読み込むことができます。

データを選択して「次のページ」をクリックします。

ヘッダー行や文字コードを設定します。

1.の場合と設定は同じなので、細かい部分は割愛します。

次に、属性名やデータ型、ロールを設定します。

ここも、1.と同様なので割愛します。

設定できれば、「終了」をクリックしましょう。

設定できれば、プロセス画面に戻ります。

画面左上にある Run Icon実行ボタンをクリックします。

実行すると、CSVデータを読み込むことができました。

ただし、この状態では、まだ元のCSVファイルを読み込んでいるだけです。

リポジトリに保存して、次からドラッグ&ドロップで呼び出せるようにするには、Storeオペレータを用いましょう。

Read CSVの後ろにStoreオペレータを繋ぎ、フォルダのマークをクリックします。

保存するリポジトリを選択し、OKをクリックします。

もう一度 Run Icon実行すると、読み込んだCSVファイルがリポジトリに保存されます。


API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル