ライセンスの制限
RapidMiner Studioにはライセンスフレームワークが付属しています。この記事では、その制限と処理方法について説明します。Studioをインストールすると、RapidMiner Studioアプリケーション内の設定> ライセンスを管理メニューより、使用中のライセンスの制限を確認することができます。
論理プロセッサの制限
RapidMiner Studioのオペレータの中には、複雑なタスクの計算を並列で実行できるものがあります。並列実行ごとに、論理プロセッサで処理できる新しいスレッドが作成されます。論理プロセッサの数、すなわちスレッドの最大数は、ライセンスによって制限されており、RapidMiner Studioのプリファレンス(スレッド数)で指定することができます。
データの制限
RapidMiner StudioはExample Setの形式でデータを処理します。Example Setは属性(列)とサンプル(行)から作成されたテーブルです。データの制限によって、オペレータとビューはインストールされているライセンスに応じた行数しか処理することができません。
これらの制限がプロセスに与える影響
データ行の制限処理の振る舞いは、RapidMiner Studioの実行しているモードに依存します。
UIモード
RapidMiner StudioがUIモードで実行され、オペレータが許可されたデータ行のサイズを超えるExample Setを取得した場合、プロセスは一時停止され、対応する情報バブルが表示されます。このとき、データのダウンサンプリングを行うか、現在のライセンスをアップグレードするか選択することができます。詳細は、「制限値に達した場合の対処法」を参照してください。
結果ビューに表示される結果の量も、インストールされているライセンスによって異なります。表示する結果が許可されたデータ行よりも大きい場合は、対応する警告バナーが表示され、制限を超えたデータ行は処理されません。
コマンドラインモード
RapidMiner Studioがコマンドラインモードで実行され、オペレータが許可されているデータ行のサイズを超えたExample Setを取得した場合、以下のユーザーエラーでプロセスが停止します。
Your license only permits up to x rows of data in a process, however the input data contained y rows.
制限値に達した場合の対処法
データ行制限を遵守するいくつかの方法があります。
ライセンスのアップグレード
RapidMiner Studioをフルに活用したい場合は、ライセンスをアップグレードすることをお勧めします。製品比較ページを確認し、ニーズに合ったライセンスをお探しください。
データ制限バブルによるダウンサンプリング
RapidMiner StudioのUIモードでは、データのダウンサンプリングが可能な情報バブルが表示されます。
データをダウンサンプリングをクリックすると、最初のn行が次のオペレータに転送されます(nは使用中のライセンスに準拠したデータ行の最大量です)。この選択は現在のプロセス内で記憶されます。そのため、他のオペレータが制限にあたった場合やプロセスを再実行しても、ダウンサンプリングを行います。自動ダウンサンプリングが適用されている場合、プロセスパネルにも通知バナーが表示されます。
Studioのオペレータの使用
ライセンス制限に関して、Sample, Sample (Stratified), Sample (Kennard-Stone) , Filter Example Range オペレータをデータのダウンサンプリングに使用することもできます。ライセンス制限よりも多くのデータを生成または取得するすべてのオペレータの後に、上記のオペレータのいずれかを追加するだけです。この手順は、ダウンサンプリング方法を制御して持続させたい場合に特に便利です。