Retrieve
(RapidMiner Studio Core)
概要
このオペレータは、リポジトリーに保管されている情報にアクセスし、それらをプロセスにロードできます。
詳細
Retrieve Operatorは、RapidMinerオブジェクトをプロセスにロードします。多くの場合、このオブジェクトはExampleSetですが、コレクションまたはモデルにすることもできます。この方法でデータを取得すると、RapidMinerオブジェクトのメタデータも提供されます。
他オペレータとの相違点
この演算子は、データアクセスグループのさまざまな読み取り<source>演算子に似ています。リポジトリ内にデータを保存すると、メタデータのプロパティも保存されるという利点があります。メタデータは、取得したRapidMinerオブジェクトに関する追加情報を提供します。 ExampleSetの場合、これは例えば属性の名前と種類、その範囲、欠損値の数。メタデータを使用すると、他のオペレーターのパラメータを簡単に構成できます。たとえば、使用可能な属性のリストから属性を選択できます。
リポジトリに保存されたデータは、RapidMinerプロセス内でのみ変更できます。ディスクまたはデータベース内に保存されているデータは、他の方法で変更できます。
出力
output (IOObject)
リポジトリエントリパラメータでパスが指定されたRapidMinerオブジェクトを返します。
パラメータ
repository_entry
ロードする必要があるRapidMinerオブジェクトへのパス。このパラメータは、このオペレータの出力として返されるリポジトリー内のエントリーを参照します。
リポジトリの場所は、現在のプロセスを含むリポジトリフォルダに関連して解決されます。リポジトリ内のフォルダーは、スラッシュ( ‘/’)で区切られます。 「..」は親フォルダーを参照します。先頭のスラッシュは、現在のプロセスを含むリポジトリのルートフォルダを参照します。先頭の二重スラッシュ( ‘//’)は、リポジトリの名前で始まる絶対パスとして解釈されます。以下のリストは、さまざまな方法を示しています。
o 「MyData」は、現在のプロセスと同じフォルダーでエントリ「MyData」を検索します。
o ’../Input/MyData’は、現在のプロセスを含むフォルダーの隣のフォルダー ‘Input’にあるエントリ ‘MyData’を検索します。
o 「/ data / Model」は、現在のプロセスを保持するリポジトリの最上位フォルダ「data」でエントリ「Model」を検索します。
o 「// Samples / data / Golf」は、「Samples」リポジトリでIrisデータセットを検索します。
「リポジトリの場所を選択」ボタンを使用する場合、パスを相対解決する必要があるかどうかを確認できます。これは、プロセスを他のユーザーと共有するときに役立ちます。
レンジ:
チュートリアルプロセス
Retrieveオペレータを使用したサンプルデータのロード
このプロセスは、リポジトリからゴルフデータセットをロードします。リポジトリエントリパラメータは、絶対パス「// Samples / data / Golf」として提供されます。したがって、Golfデータセットは、サンプルリポジトリおよびサブフォルダデータから返されます。