RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Google Cloud Servicesコネクタの使用

このガイドでは、RapidMiner Studio 9.3で導入された新しい接続管理を対象としています。

古いレガシーGoogle Cloud Storage接続については9.2のドキュメントを参照してください。

Google Cloud Servicesコネクタを使用すると、RapidMiner Studioから直接Google Cloud Storageにアクセスできたり、Google BigQueryに保存されているデータをクエリすることができます(後者の場合は、マーケットプレイスからダウンロードできる In-Database Processing Icon In-Database Processingエクステンションが必要です)。

Google Cloud Storageでは、読み込みと書き込みの両方の操作がサポートされています。また、 Google Storage IconLoop Google Storageオペレータを使用して、Google Cloud Storageディレクトリ内の一連のファイルを読み込むこともできます。このドキュメントでは、以下の方法について説明します。

Google Cloud Storageアカウントの接続

Google Cloud Storageコネクタを使用する前に、新しいGoogle Cloud Storage接続を設定する必要があります。接続の設定には、Google Cloud Storageアカウントの接続詳細が必要です。これには、プロジェクトIDとアクセストークン、またはサービスアカウントの秘密鍵が含まれます。

  1. RapidMiner StudioでGoogle Cloud Services接続を保存するリポジトリを右クリックして、 New Connection IconCreate Connectionを選択します。

または、Connections >New Connection IconCreate Connectionをクリックし、以下のダイアログのドロップダウンからリポジトリを選択することも可能です。

  1. 新しい接続の名前を入力し、Connection TypeGoogle iconGoogle Cloud Servicesに設定し、Create IconCreateボタンをクリックします。

  1. SetupタブでGoogle Cloudアカウントの接続詳細を入力します。これには2つの代替オプションがあり、詳細は次の2つのステップを参照してください。
  2. 同意画面でRapidMinerにGoogle Cloudアカウントへのアクセスを許可した後に取得したアクセストークンを使用することができます。これはデフォルトのオプションです。Use Service Accountのチェックを外したままにして、以下の手順に従います。
    1. Access Tokenフィールドの右側にある Id Icon ボタンをクリックして、アクセストークンで使用するサービス、通称アクセススコープを選択します。
    2. この接続で使用するサービスを選択します。 In-Database Processing IconIn-Database Processingエクステンションをインストールしている場合は、Google BigQueryがオプションとしてここに表示されます。

    1. Website IconRequest access tokenをクリックすると、ブラウザでGoogleのウェブサイトが開きます。Google Cloudアカウントにログインしていない場合は、ここでログインする必要があります。Show URL insteadをクリックして、URLを手動でコピーできます。

    1. ALLOWボタンをクリックして、RapidMinerにGoogle Cloudアカウントへのアクセスを許可し、トークンを生成します。これでアクセストークンを確認できるページが表示されます。画面に表示されているコードをコピーします。

    1. RapidMiner Studioに戻り、アクセストークンを入力し、 Complete IconCompleteをクリックします。

    1. 接続のProject IDも指定します。
  1. または、プロジェクトにサービスアカウントを設定することもできます。この場合は、Use Service Accountフラグにチェックを入れ、以下の手順に従います。
    1. サービスアカウントを設定したら、サービスアカウントのJSONキーを作成してダウンロードします。Private Key File Contentフィールドの横にある file chooser iconファイル選択ボタンを使用して、キーを含むJSONファイルを選択します。または、JSONファイルの内容全体を(テキストエディタやクリップボードを使用して) Private Key File Contentフィールドに貼り付けることもできます。

    1. file chooser iconEdit Access Scopes…ボタンをクリックして、この接続で使用するサービスを選択します。 In-Database Processing IconIn-Database Processingエクステンションをインストールしている場合は、Google BigQueryがオプションとしてここに表示されます。

    1. 接続のProject IDも指定します。
  1. 必須ではありませんが、 Connection Test IconTest connectionボタンをクリックして、新しいGoogle Cloud Services接続をテストすることをお勧めします。テストに失敗した場合は、接続詳細が正しいかどうかを確認してください。この接続に複数のGoogle Cloud Servicesを選択している場合、選択したサービスのうち少なくとも1つに正常に接続できればテストは成功しますのでご注意ください。
  2. Save IconSaveをクリックして接続を保存し、Edit connectionダイアログを閉じます。これで、Google Cloud Storageオペレータを使用することができます!

Google Cloud Storageからの読み込み

Google Storage IconRead Google StorageオペレータはGoogle Cloud Storageアカウントからデータを読み込みます。このオペレータはファイルをダウンロードするのみでファイルを処理できないので、任意のファイル形式をロードするのに使用されます。ファイルを処理するためには、Read CSV、Read Excel、Read XMLなどの追加のオペレータを使用する必要があります。

まずは、Google Cloud Storageから簡単なcsvファイルを読み込むことから始めてみましょう。

  1. Read Google Storageオペレータをプロセスにドラッグします。connection entryパラメータの横にある repository chooser icon ボタンをクリックして、保存先のリポジトリのConnectionsフォルダからGoogle Cloud Services接続を選択します。

または、リポジトリからプロセスにGoogle Cloud Services接続をドラッグして、オペレータの出力をRead Google Storageオペレータに接続することもできます。

  1. ファイル選択 ボタンをクリックして、Google Cloud Storageアカウントのファイルを表示します。ロードするファイルを選択し、 File Chooser Icon開くをクリックします。バケットをリスト表示してファイル選択を使用するには、プロジェクト上で storage.buckets.list権限が必要であることに注意してください。その権限を持っていない場合は、パラメータフィールドに直接読み込みたいパスを入力します。

前述のように、 Google Storage IconRead Google Storageオペレータは指定したファイルの内容を処理しません。この例では、csvファイル(カンマ区切り値ファイル)を選択しています。このファイルタイプはRead CSVオペレータで処理することができます。

  1. Google Storage IconRead Google Storageオペレータと結果ポートの間にRead CSVオペレータを追加します。csvファイルの形式に応じて、列の区切り文字などのRead CSVオペレータのパラメータを設定することができます。

  1. Run Process をクリックしてプロセスを実行します。結果画面には、選択したcsvファイルの行と列を含むテーブルが表示されます。

これで、さらにオペレータを使用し、特定のイベントの共通性を判断するなど、このドキュメントを操作できるようになりました。結果をGoogle Cloud Storageに書き戻すには、 Google Storage IconWrite Google Storageオペレータを使用できます。このオペレータは Google Storage IconRead Google Storageオペレータと同じ接続タイプを使用し、同様のインタフェースを備えています。また、 Google Storage IconLoop Google Storageオペレータを使用して、Google Cloud Storageディレクトリ内の一連のファイルを読み込むこともできます。これを行うには、connection entryと処理するフォルダ、および入れ子内にオペレータを追加して、ループ処理のステップを設定する必要があります。詳細については、 Google Storage IconLoop Google Storageオペレータのヘルプをご覧ください。

 

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル