RapidMiner 20 Tips
公開日 : 2021年4月8日
OS: Windows 10
バージョン : 9.9
RapidMinerには作業を楽にする様々な機能がありますが、その多くはあまり知られていません。ここでは、便利なRapidMinerのTipsを20個紹介します。
目次
1. ポートをダブルクリックすると、結果ポートにつながる
2. alt + クリックで接続を切れる
3. Shift + ドラッグでポートの位置を変えられる
4. プロセス画面の左端のポートでデータを読み込める
5. オペレータを自動で繋ぐ機能がある
6. 離れている場所にもプロセスを繋ぐことができる
7. オペレータのリコメンド機能がある
8. オペレータにメモを残せる
9. オペレータの実行順を変更することができる
10. オペレータをきれいに配置してくれる機能がある
11. プロセスの余分な部分を消してくれる機能がある
12. オペレータをダブルクリックすると、ダイアログが開く
13. 各オペレータにチュートリアルがある
14. よく使う処理をBuilding Blockに保存し、右クリックで呼び出せる
15. バックグラウンド実行ができる(※Enterpriseライセンスのみ)
16. 検索に略語を使用して早く探せる
17. ワンクリックですべての結果を閉じることができる
18. 結果からプロセスを復元できる
19. 今のデータにどのアルゴリズムが向いているか、確認できるチートシートがある
20. Excelのようにデータを編集できる
1. ポートをダブルクリックすると、結果ポートにつながる
オペレータの出力ポートをダブルクリックすると、自動で結果ポートに繋がります。
オペレータが結果ポートから離れた場所であっても、結果ポートに繋がるので、作業の時短に繋がります。
2. alt + クリックで接続を切れる
オペレータの接続を切る際、バツ印以外の場所でもAlt + クリックで接続を切ることができます。バツ印をクリックする必要がなくなるため、プロセスを組み時間を短縮できます。
3. Shift + ドラッグでポートの位置を変えられる
ポートの位置を調整したいときは、Shift + ドラッグでポートの位置を調整することができます。これにより、見た目がすっきりしたプロセスを組むことができます。
4. プロセス画面の左端のポートでデータを読み込める
プロセスの左端にあるポートを右クリックすると、ポートをリポジトリへ接続することができます。ここからリポジトリのデータを選択してプロセス内で使用することができます(ドラッグ&ドロップで取得する場合と差はありません)。
取り出すデータを変更したい場合は、ビュー>パネルを表示>環境(Context)パネルより変更可能です。
5. オペレータを自動で繋ぐ機能がある
プロセスの右上にあるコンセントのマークをクリックして、オペレータを自動で接続することができます。単純な処理であれば、高い精度で望んだ場所へ繋がります。ただし複雑なものは難しく、修正が必要なことがあります。
6. 離れている場所にもプロセスを繋ぐことができる
RememberとRecallオペレータを用いると、離れている場所にもオペレータを接続することができます。Rememberオペレータに飛ばしたい内容を接続し、Recallオペレータで呼び出します。これを利用することで、遠く離れた場所にあるデータの内容を好きな場所で展開することができます。
7. オペレータのリコメンド機能がある
プロセスの下部にある”Wisdom of Crowds”を有効にすると、リコメンド機能を使用することができます。プロセスの下部に次に使用するだろうオペレータが表示され、パラメータ欄には他のユーザーがどれを使用したかが表示されます。
これらのリコメンドされたものを参考に、プロセスをより早く組むことができます。
8. オペレータにメモを残せる
プロセスの右上にある付箋のマークをクリックすると、オペレータやプロセスにメモを残すことができます。メモは色や大きさを自由に変更でき、オペレータの下やプロセスなど、好きな場所に配置できます。
これにより、プロセスを見返した際も、各オペレータがどのような処理を行っているか把握しやすくなります。
9. オペレータの実行順を変更することができる
プロセスの右上にある四角形のマークをクリックすると、プロセスの実行順を確認することができます。さらに、オペレータを右クリックし「オペレータを前の順序へ」を選択すると、オペレータの実行順を変更することが可能です。
プロセスの作成に戻るには、もう一度四角形のマークをクリックします。この機能を使用して、オペレータが適切な順で実行されるよう調整できます。
10. オペレータをきれいに配置してくれる機能がある
プロセスの空いている部分を右クリックして開いたダイアログから、レイアウト>オペレータ配置をクリックします。クリックすると、バラバラな場所にあったオペレータが自動できれいに配置されます。
11. プロセスの余分な部分を消してくれる機能がある
プロセスの右上にある四角形のマークをクリックすると、プロセスの余分な幅を消すことができます。プロセスが必要以上に広がってしまった際には、非常に便利です。
12. オペレータをダブルクリックすると、ダイアログが開く
一部のオペレータはダブルクリックすると、そのオペレータのダイアログを開くことができます。
13. 各オペレータにチュートリアルがある
多くのオペレータにはチュートリアルが付いており、オペレータを実際に動かしてどのように使うか学ぶことができます。チュートリアルプロセスは、ヘルプからリンクをたどって開きます。
14. よく使う処理をBuilding Blockに保存し、右クリックで呼び出せる。
よく使用する処理をSubprocessオペレータなどにまとめてBuilding Blockに保存しておくと、右クリックで呼び出すことができます。事前に組んでおけば今後組む必要がなくなり、プロセスをより早く組むことができます。
15. バックグラウンド実行ができる(※Enterpriseライセンスのみ)
通常、一度プロセスを実行すると処理が終わるまでプロセスを操作することはできません。一方、Enterpriseライセンスのみですが、Run Process in Backgroundでプロセスを実行すると、プロセスを実行しながらプロセスを操作することが可能です。
実行した結果は、ビュー>パネルを表示>Background Monitorより、結果をダブルクリックして開くことができます。これを活用することで、計算が終わるまでの時間を待つ必要がなくなり、時間をより有効に使用することができます。
16. 検索に略語を使用して早く探せる
オペレータの検索に略語(キャメルケース)を使用することで、より早く目当てのオペレータを取り出すことができます。
例えばCross Validationオペレータの場合、”CV”と入力しても検索することができます。他にもDecision Treeオペレータは”DT”、Generalized Linear Modelオペレータは”GLM”などのように検索することができます。
17. ワンクリックですべての結果を閉じることができる
RapidMinerで操作を続けていると、結果画面にいくつもタブが溜まることがあります。そのようなときは、タブを右クリックし「すべての結果を閉じる」を選択することで、全ての結果を一度に閉じることができます。
18. 結果からプロセスを復元できる
いくつかプロセスを実行し終えた際、もう一度過去のプロセスに戻りたいことがあります。そのようなときは、結果概要タブより、過去に実行したプロセスを復元することができます。
19. 今のデータにどのアルゴリズムが向いているか、確認できるチートシートがある
RapidMiner社のRESOURCES>ML Algorithm Reference Guideをクリックすると、アルゴリズムのチートシートを利用できます。左のFilterに現在のデータを入力すると、右にどのアルゴリズムが向いているか表示されます。
またアルゴリズムのリンクをクリックすると、ドキュメントのページやwikipediaに飛びます。
20. Excelのようにデータを編集できる
ビュー>パネルを表示>Data Editorを選択すると、データをExcelのように操作することができます。
この機能を使用することで、簡単なサンプルデータの作成や、データの値を手動で変更することが可能です。