複数のCSVファイルの読み込み
投稿日: 2020年11月27日
OS: Windows 10
バージョン: RapidMiner 9.7
複数のCSVファイルを読み込むには、Loop Filesオペレータを用います。ここでは、Desktopに5つのCSVファイルがあると仮定して、オペレータを設定します。
まず、プロセスにLoop Filesオペレータを追加します。
追加できれば、ファイルのマークをクリックして、directoryパラメータにファイルがある場所を選択します。
次に、filter typeパラメータで読み込むファイルにフィルターをかけます。今回はすべてCSVファイルなので、末尾に”.csv”があるファイルのみを読み込むように設定しています。
次にLoop Filesオペレータの中にRead CSVオペレータを配置します。
このとき、左側のfilポートとRead CSVオペレータのfilポートを繋げてください。先ほどLoop Filesオペレータで設定したファイルが、ここから読み込まれます。
あとは、Read CSVで読み込む設定をすれば読み込むことができます。CSVファイルの場合は、column separatorsを”,(コンマ)”に変更すると良いでしょう。
この状態で実行します。
結果画面より、5つのファイルが読み込まれていることが確認できます。
この状態ではただCSVファイルを読み込んだだけなので、簡単にデータを利用できるようにリポジトリに保存しましょう。リポジトリへの保存には、Storeオペレータを接続します。
Storeオペレータを追加した後は、一度Loop Filesオペレータに戻ります。Enable macrosをクリックして、”file_name”をコピーしてください。
Storeオペレータのフォルダのマークをクリックして、保存場所を選択し、名前に先ほどコピーした”file_name”を貼り付け、%{}で囲みます。
OKをクリックして実行します。
実行後は、保存したファイルを右クリックして「フォルダの更新」をクリックします。
更新すると、読み込んだファイルが保存されます。