RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

プロジェクトを介したコラボレーション

プロジェクトという概念はRapidMiner 9.7で導入されました。

プロジェクトとは、Gitが提供するバージョン管理機能を備えた共有リポジトリのことです。

共通の目標に向けて取り組むチームのワークフローを管理するために、最新のソフトウェアのほとんどが何らかのバージョン管理機能を備えています。RapidMinerではプロジェクトを提供しており、以下のような利点があります。

  • 行った作業の履歴をステップごとに取得
  • 履歴の各ステップはスナップショットとして記録
  • 各スナップショットは特定の時点で存在していたプロジェクトの正確なコピーを提供
  • スナップショットはProjectサーバーを介してチームメンバーと共有
  • Projectサーバーからアップデートを取得することで、チームメンバーとの同期を保持
  • いつでも以前のスナップショットにロールバック可能
  • 内部の仕組みはバージョン管理の標準ツールであるGitに基づく
  • 内部の仕組みはGitに基づくが、Gitの知識は不要

以下のセクションでは、プロジェクトの使用方法の概要を説明します。

プロジェクトへの接続

プロジェクトに接続する前に、まずRapidMiner AI Hubのwebインターフェース内でプロジェクトを作成しておく必要があります。

リポジトリパネルで、 データのインポートの隣のドロップダウンメニューから、 Connect to a Projectを選択します。

表示されたダイアログの入力欄に必要事項を入力します。

Check connection settingsをクリックして接続を確認します。設定が正しい場合は、 OKをクリックします。プロジェクトの完全なコンテンツがダウンロードされ、保存場所にローカルに保存されます。

スナップショットの作成

プロジェクトは一連のスナップショットと考えることができます。各スナップショットは特定の時点におけるプロジェクトの全状態を表し、プロジェクトの記録はSnapshot Historyと一致します。

スナップショットを作成すると、2つのことが行われます。

  1. その時点でのプロジェクトのバージョンの記録を作成します。スナップショットはSnapshot Historyの一部として保存されます。
  2. スナップショットは自動的に Projectサーバーと共有されるため、Get updatesでチームメンバーが利用できるようになります。

プロジェクト内では、プロセスやモデルを変更しローカルに保存することができますが、スナップショットを作成するまでは、作業内容は共有されず、Snapshot Historyにも保存されません。

スナップショットを作成するには、リポジトリパネルでプロジェクトを右クリックし、 Create Snapshot and add it to Serverを選択します。

Snapshot Descriptionに変更内容をまとめ、 Create Snapshotをクリックします。スナップショットはProjectサーバーに保存され、プロジェクトにアクセスできる他のユーザーはGet updatesを使用して利用できます。

アップデートの取得

Projectサーバーからプロジェクトのコピーを更新するには、 Get updatesを選択します。ここでは、自分とチームメンバーの両方のプロジェクトの既存のスナップショットがすべて収集されます。 Get updatesを行うと、自分とチームメンバーの作業内容が同期されます。

Projectサーバーに新しいスナップショットがあるかを確認するには、以下を行います。

  • リポジトリパネルのプロジェクト名の横に通知があるかどうかを確認します(Project: 2 behind)
  • 履歴パネルGet updates (2)ボタンの横にある数字を確認します。

ローカルで変更を行った場合は、まず、以下2つのアクションのいずれかを行う必要があります。

競合の解決

競合は、自分とチームメンバーの両方が同じファイルを変更した場合に発生します。RapidMiner Studioには、競合するファイルごとに以下のオプションがあります。

  • use my version
  • use my colleague’s version

すべての関連情報は、3つの異なるスナップショット(自分のスナップショット、チームメンバーのスナップショット、競合の解決策を含むスナップショット)として、Snapshot Historyに保存されるため、この時データの損失は発生しません。

ローカルの変更を破棄

ローカルの変更をスナップショットに含めたくない場合は、ローカルの変更を破棄することができます。

この操作は元に戻せないため、ご注意ください!

リポジトリパネルで、プロジェクトを右クリックし、コンテキストメニューから Discard local changesを選択します。

その後、プロジェクトは最新のローカルスナップショットに復元されます。チームメンバーの最新のスナップショットを取得するには、 Get updatesを選択します。

履歴パネル

Snapshot Historyパネルでは、 Create Snapshot と  Get updatesにすぐにアクセスでき、ローカルのすべてのスナップショットのリストになっています。履歴パネルを開くには、2つの方法があります。

  • メインメニューから、ビュー >  パネルを表示 >  Snapshot Historyを選択するか、または
  • リポジトリパネルで、プロジェクトを右クリックし、 Open Snapshot Historyを選択します。

Snapshot Historyの各スナップショットには、説明と右端にある3つのドットから表示される2つのオプションがあります。

  • View Snapshotは、どのファイルが変更されたかなど、スナップショットの詳細を表示します。そこから、それらのファイルを個別に表示したり、復元することができます。
  • Restore Snapshotは、プロジェクトのローカルコピー内のすべてのファイルを、このスナップショットの内容に置き換えます。スナップショットを確認するだけで、それを永続的に保存しない場合は、 Discard local changesを使用して、確認後ローカルの変更を破棄することができます。一方、古いスナップショットを保持したい場合は、新しいスナップショットを作成して最新のスナップショットにする必要があります。

スナップショットの説明を1回クリックするだけで、View Snapshotと同じ効果が得られることに注意してください。

スナップショットの表示

スナップショットを表示する際、そのスナップショットで変更された個々のファイルを表示 または 復元するオプションがあります。

View this file

スナップショット内からファイルを表示する動作は、リポジトリ内でファイルを開く際と同じです。

  • 結果画面にデータセットが表示され、
  • プロセスパネルにプロセスが表示され、
  • その他のファイルはそのファイルタイプのデフォルトのプログラムによって開かれます。

Restore file

ファイルの名前と場所を選択し、 OKをクリックします。

スナップショットを復元するときと同じルールが適用されます。ファイルを確認するだけで、それを永続的に保存しない場合は、 Discard local changesを使用して、確認後ローカルの変更を破棄することができます。一方、古いファイルを保持したい場合は、新しいスナップショットを作成して最新のスナップショットにする必要があります。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル