RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

複数のCSVファイルの読み込み

投稿日: 2020年11月27日
OS: Windows 10
バージョン: RapidMiner 9.7

複数のCSVファイルを読み込むには、Loop Filesオペレータを用います。ここでは、Desktopに5つのCSVファイルがあると仮定して、オペレータを設定します。


まず、プロセスにLoop Filesオペレータを追加します。

追加できれば、ファイルのマークをクリックして、directoryパラメータにファイルがある場所を選択します。

次に、filter typeパラメータで読み込むファイルにフィルターをかけます。今回はすべてCSVファイルなので、末尾に”.csv”があるファイルのみを読み込むように設定しています。

次にLoop Filesオペレータの中にRead CSVオペレータを配置します。

このとき、左側のfilポートとRead CSVオペレータのfilポートを繋げてください。先ほどLoop Filesオペレータで設定したファイルが、ここから読み込まれます。

あとは、Read CSVで読み込む設定をすれば読み込むことができます。CSVファイルの場合は、column separatorsを”,(コンマ)”に変更すると良いでしょう。

この状態で実行します。

結果画面より、5つのファイルが読み込まれていることが確認できます。

この状態ではただCSVファイルを読み込んだだけなので、簡単にデータを利用できるようにリポジトリに保存しましょう。リポジトリへの保存には、Storeオペレータを接続します。

Storeオペレータを追加した後は、一度Loop Filesオペレータに戻ります。Enable macrosをクリックして、”file_name”をコピーしてください。

Storeオペレータのフォルダのマークをクリックして、保存場所を選択し、名前に先ほどコピーした”file_name”を貼り付け、%{}で囲みます。

OKをクリックして実行します。

実行後は、保存したファイルを右クリックして「フォルダの更新」をクリックします。

更新すると、読み込んだファイルが保存されます。


API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル