リポジトリから複数データの読み込み
投稿日: 2020年11月27日
OS: Windows 10
バージョン: RapidMiner 9.7
リポジトリから複数のデータを読み込むには、Loop Repositoryオペレータを用います。
フォルダマークをクリックして、repository folderパラメータに読み込むデータの場所を設定します。また、entry typeにIOObjectを選択します。
Loop Repositoryオペレータの内部では、左のrepポートから右のoutポートまで繋げます。これで、読み込んだデータは何の変更も加えられることなくオペレータから出力されます。
この状態で実行しましょう。上手く実行できれば、読み込んだデータが結果画面に表示されます。
処理を追加したい場合は、Loop Repositoryの内部にオペレータを加えます。
ここでは、例で取り込んだデータの名前を追加しています。
Loop Repositoryにある”entry name macro”をコピーします。
次に、Loop Repositoryの内部に入り、Generate Attributesオペレータを追加します。
Edit Listをクリックし、attribute nameに属性名を、右側には先ほどコピーしたentry_nameを貼り付け、%{}で囲み”%{entry_name}”と設定します。
この状態で実行し、結果を確認します。
データに、新しくfile name属性が作成され、取り込んだデータ名がわかるようになりました。
最後に、取り込んだデータを結合させます。Loop Repositoryの後ろにAppendオペレータを追加します。
実行すると、二つのデータが一つに結合されます。