RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

リポジトリから複数データの読み込み

投稿日: 2020年11月27日
OS: Windows 10
バージョン: RapidMiner 9.7

リポジトリから複数のデータを読み込むには、Loop Repositoryオペレータを用います。

フォルダマークをクリックして、repository folderパラメータに読み込むデータの場所を設定します。また、entry typeにIOObjectを選択します。

Loop Repositoryオペレータの内部では、左のrepポートから右のoutポートまで繋げます。これで、読み込んだデータは何の変更も加えられることなくオペレータから出力されます。

この状態で実行しましょう。上手く実行できれば、読み込んだデータが結果画面に表示されます。

処理を追加したい場合は、Loop Repositoryの内部にオペレータを加えます。

ここでは、例で取り込んだデータの名前を追加しています。

Loop Repositoryにある”entry name macro”をコピーします。

次に、Loop Repositoryの内部に入り、Generate Attributesオペレータを追加します。

Edit Listをクリックし、attribute nameに属性名を、右側には先ほどコピーしたentry_nameを貼り付け、%{}で囲み”%{entry_name}”と設定します。

この状態で実行し、結果を確認します。

データに、新しくfile name属性が作成され、取り込んだデータ名がわかるようになりました。

最後に、取り込んだデータを結合させます。Loop Repositoryの後ろにAppendオペレータを追加します。

実行すると、二つのデータが一つに結合されます。


API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル