イメージアーキテクチャ
RapidMiner ServerのクラウドイメージはDockerイメージで実装されています。インストールされているDockerレイヤにはCentOSイメージを基にしており、以下の追加コンポーネントを含んでいます。
- PostgreSQLデータベース
- RapidMiner Server、また
- Job Agent
これら三つに分割されるDockerコンテナは、RapidMiner Server Dockerイメージに提供されているサンプルのdocker-compose.ymlに似たDocker Compose定義体を使用しています。
PostgreSQL Dockerコンテナは、これらのイメージのデータベースバックエンドとして機能しています。データベースのユーザー名とパスワードは/rapidminer/docker/docker-compose.ymlの中に載っています。
SSHを使用したインスタンスへの接続
認証
Amazon AWSとMicrosoft AzureのクラウドプラットフォームはサーバーインスタンスへSSHアクセスを提供しています。
- Amazon AWSでは、使用するSSHのキーペアを指定でき、SSHのユーザー名はイメージ(centos)で固定されます。
- Microsoft Azureでは、インスタンスの作成ウィザード内でsshのユーザー名とパスワード、またはSSHキーを指定できます。
ファイルシステムレイアウト
イメージに接続した後は、/rapidminerサブフォルダ内にRapidMiner Serverがあります。
- docker/docker-compose.ymlはDockerコンテナ、ネットワーク接続、ボリュームと必要な環境変数を定義します。
- docker/rapidminer-homeにはRapidMiner Serverホームディレクトリ内の永続データを保持するボリュームが含まれます。
- docker/pgsqlにはPostgreSQLデータベース内の永続データを保持するボリュームが含まれます。
RapidMiner Serverの設定
RapidMiner Serverを設定するには、二つのうち一つの方法に従います。
- 一般的な方法:RapidMiner Serverホームディレクトリページでエクステンション、JDBC ドライバ、ライセンスのロケーションについて述べています。
- Dockerを使用した方法:docker-compose.yml設定ファイル内で、事前に定義された環境変数の値を変更できます。
- rapidminer-serverサービス内のデータベースに関連する環境変数を設定して、外部データベース(例、AWS内でRDSインスタンスを使用する場合など)を定義します。
- job-agentサービス内の環境変数を設定して、ジョブエージェントへのリソースの割り当てを再定義します。
Dockerインスタンスの再起動
設定を変更した後は、以下のコマンドを使用して(最も簡単なケースです)、Dockerコンテナを再起動して、RapidMiner Serverまたはジョブエージェントを再起動する必要があります。
sudo docker-compose -f /rapidminer/docker/docker-compose.yml down
sudo docker-compose -f /rapidminer/docker/docker-compose.yml up -d
ログの確認
RapidMiner Server、ジョブエージェント、またはPostgreSQLデータベースのログはDockerコンテナのコンソールに書き込まれます。またRapidMiner Serverのログはrapidminer-home/log/server.logにも書き込まれています。Dockerコンテナのコンソールの出力を確認するには、以下のコマンドの一つを実行します(そして、Ctrl+Cを入力して終了します)。
sudo docker-compose -f /rapidminer/docker/docker-compose.yml logs -f rapidminer-server
sudo docker-compose -f /rapidminer/docker/docker-compose.yml logs -f job-agent
sudo docker-compose -f /rapidminer/docker/docker-compose.yml logs -f database