RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Subprocess

概要

この演算子は、プロセス内にプロセスを導入します。プロセスの実行中にサブプロセス演算子に到達すると、サブプロセス全体が最初に実行されます。サブプロセスの実行が完了すると、フローはプロセス(親プロセス)に返されます。サブプロセスは、プロセス内のすべての演算子と演算子の組み合わせをサブプロセスに適用できるように、プロセスの小さな単位と見なすことができます。そのため、サブプロセスは、後で適用される演算子のチェーンとして定義することもできます。

詳細

サブプロセス演算子をダブルクリックして、サブプロセス内に移動します。サブプロセスは同じプロセスビューに表示されます。親プロセスに戻るには、プロセスビューツールバーの青色の上矢印ボタンをクリックします。これは、オペレーティングシステムで機能するファイルやフォルダーのように機能します。フォルダーにフォルダーを含めることができるように、サブプロセスにはサブプロセスを含めることができます。ネストされたサブプロセスの場合の実行順序は、ツリー構造による深さ優先検索と同じです。サブプロセス演算子に到達すると、その内部のすべての演算子が実行され、実行フローが親プロセスに戻り、サブプロセス演算子(親プロセス内)の実行後に配置された演算子が実行されます。この説明は、添付のプロセス例を調べることで簡単に理解できます。

サブプロセスは、任意の数の内部演算子を持つことができる単純な演算子チェーンと見なすことができます。その後、演算子が適用され、その出力が後続の演算子の入力として使用されます。サブプロセス演算子の入力は、サブプロセス演算子の最初の演算子の入力として使用され、サブプロセスの最後の演算子の出力はサブプロセス演算子の出力として使用されます。サブプロセスはプロセスをより管理しやすくしますが、すべての入力と出力を正しい順序で接続することを忘れないでください。また、チェーンのすべてのレベルで適切な数のポートが接続されていることを確認してください。

サブプロセスは多くの点で便利です。それらはプロセス全体に構造を与えます。プロセスの複雑さが軽減され、理解および変更が容易になります。多くの演算子には、不可欠な部分としてサブプロセスがあります。たとえば、X-Validation演算子は、添付のプロセス例にも示されています。サブプロセスの入力を出力に直接接続しても、間に演算子を適用したり、空のサブプロセスを使用したりしても結果は得られないことに注意してください。

入力

  • 入力 (IOObject)サブプロセス演算子には複数の入力を含めることができます。 1つの入力が接続されると、別の入力ポート(使用可能な場合)を受け入れる準備ができた別の入力ポートが使用可能になります。入力の順序は同じままです。サブプロセスの最初の入力ポートで提供されるオブジェクトは、ネストされたチェーンの最初の入力ポート(サブプロセス内)で利用できます。サブプロセスはプロセスを管理しやすくしますが、すべての入力を正しい順序で接続することを忘れないでください。チェーンのすべてのレベルで適切な数のポートが接続されていることを確認してください。

出力

  • 出力 (IOObject)Subprocessオペレーターには、複数の出力を含めることができます。 1つの出力が接続されると、別の出力(ある場合)を配信する準備ができた別の出力ポートが使用可能になります。出力の順序は同じままです。サブプロセスの最初の出力ポートで配信されるオブジェクトは、外部プロセスの最初の出力で配信されます。サブプロセスはプロセスを管理しやすくしますが、すべての出力を正しい順序で接続することを忘れないでください。チェーンのすべてのレベルで適切な数のポートが接続されていることを確認してください。

チュートリアルプロセス

サブプロセスを使用してプロセスを構築

「ゴルフ」データセットは、検索演算子を使用してロードされます。これは、サブプロセス演算子の最初の入力に添付されます。サブプロセス演算子をダブルクリックして、このサブプロセスの内容を確認します。サブプロセスの最初の入力には、ディシジョンツリー演算子が添付されます。決定木演算子の出力は、最初の出力ポートに与えられます。ここで、メインプロセスに戻ります。 Subprocessオペレーターの最初の出力ポートが最初の結果ポートに接続されていることがわかります。これは、結果ワークスペースの結果 ‘Tree(decision tree(golf))’を説明しています。これがどのように機能するかです:ゴルフデータセットは最初の入力ポートからサブプロセスに入り、サブツリーで決定木演算子が適用され、結果のモデルはサブプロセスの最初の出力ポートを介して結果に配信されます。

メインプロセス中に、Retrieveオペレーターを使用してPurchasesデータセットがロードされます。サブプロセス演算子の2番目の入力ポートに接続されます。サブプロセス演算子をダブルクリックして、このサブプロセスの内容を確認します。サブプロセスの2番目の入力ポートは、演算子を適用せずに2番目の出力ポートに直接接続されます。ここで、メインプロセスに戻ります。 Subprocessオペレーターの2番目の出力ポートが2番目の結果ポートに接続されていることがわかります。ただし、サブプロセスのPurchasesデータセットに演算子が適用されていないため、結果の生成に失敗します(Retrieve演算子の結果でさえ結果ワークスペースに表示されません)。これにより、メインプロセスの結果ポートに4つの出力がアタッチされているにもかかわらず、結果ワークスペースに3つの結果がある理由がわかります。

サブプロセスでは、Retrieve演算子を使用してIrisデータセットがロードされます。これはデシジョンツリー演算子に接続され、結果のモデルはサブプロセスの3番目の出力ポートに接続され、サブプロセスはメインプロセスの3番目の結果ポートに接続されます。これは、結果ワークスペースの結果「ツリー(決定木(アイリス))」を説明しています。

サブプロセスでは、Retrieve演算子を使用して重み付けデータセットがロードされます。これはX-Validationオペレーターに接続され、結果のパフォーマンスベクトルはサブプロセスの4番目の出力ポートに接続され、サブプロセスはメインプロセスの4番目の結果ポートに接続されます。これは、結果ワークスペースの結果「performanceVector(パフォーマンス)」を説明しています。 X-Validation演算子自体はサブプロセスで構成されています。 X-Validation演算子をダブルクリックすると、この演算子内にサブプロセスが表示されます。 X-Validationの内部で何が行われているのかの説明は、ここで流用になります。この演算子は、さまざまな演算子をサブプロセスで構成する方法を示すためだけにここに追加されました。 X-Validation演算子の詳細については、その説明をご覧ください。

注:このサンプルプロセスは、サブプロセスオペレーターのさまざまな観点を強調するためのものです。実際のシナリオではあまり役に立ちません。パフォーマンスのプロセス例演算子も、サブプロセス演算子の使用の良い例です。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル