RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Cassandraコネクタの使用

Cassandraコネクタを使用すると、Altair AI Studioから直接NoSQLデータベースのCassandraのクラスタに接続することができます。これはすべてのCRUD操作(Create、Read、Update、Delete)をサポートし、より洗練されたデータベースコマンドを実行します。このドキュメントでは、以下の方法について説明します。

NoSQLコネクタエクステンションのインストール

まず、NoSQLエクステンションをインストールする必要があります。

NoSQL ExtensionInstall NoSQL Extension in Studio

RapidMinerマーケットプレイスで確認

エクステンションのインストール方法

Cassandraクラスタの接続

Cassandraコネクタを使用する前に、新しいCassandra接続を設定する必要があります。接続の設定には、データベースの接続詳細(ホスト名、ポート、キースペース名)が必要です。Cassandraのインストールで認証が必要な場合は、有効な認証情報も必要です。

  1. Altair AI StudioでCassandra接続を保存するリポジトリを右クリックして、New Connection IconCreate Connectionを選択します。

    または、Connections >New Connection IconCreate  Connectionをクリックし、以下のダイアログのドロップダウンからリポジトリを選択することも可能です。
  2. 新しい接続の名前を入力し、Connection TypeCassandra IconCassandraに設定します。
  3. Create IconCreateをクリックし、Edit connectionダイアログのSetupタブに切り替えます。
  4. Cassandraクラスタの接続詳細を入力します。

    事前に設定されたポートは、Cassandraによって使用されるデフォルトのポートです。Cassandraはデフォルトではユーザー認証を必要としないことに注意してください。
    必須ではありませんが、Connection Test IconTest connectionボタンをクリックして、新しいCassandra接続をテストすることをお勧めします。テストに失敗した場合は、接続詳細が正しいかどうかを確認してください。
  5. Save IconSaveをクリックして接続を保存し、Edit connectionダイアログを閉じます。

これで、新しく作成した接続をすべてのCassandraオペレータで使用することができます!

Cassandraからの読み込み

Read Cassandraオペレータを使用すると、Cassandraテーブルからデータを読み込むことができます。

  1. Altair AI StudioでNew Process Icon空のプロセスを作成し、Read Cassandraオペレータをプロセスパネルにドラッグし、その出力ポートをプロセスの結果ポートに接続します。connection entryパラメータの横にあるrepository chooser iconボタンをクリックして、保存先のリポジトリのConnectionsフォルダからCassandra接続を選択します。
    または、リポジトリからプロセスパネルにCassandra接続をドラッグして、オペレータの出力をRead Cassandraオペレータに接続することもできます。
  2. クエリの一貫性レベルを定義します。ノード数が3つ以下のクラスタでは、ONEに設定することをお勧めします。それ以外の場合は、デフォルト値のQUORUMを使用します。
  3. クエリタイプ(クエリクエリファイル、またはテーブル)を定義します。テーブルを選択した場合は、別のパラメータに利用可能なテーブルが表示されます。
  4. Run Processをクリックしてプロセスを実行します。結果画面には、CassandraからロードされたExample Setが表示されます。この例では、Example SetにはAltair AI StudioのDealsサンプルデータセットが含まれています。

Cassandraへの書き込み

Write Cassandraオペレータを使用すると、Cassandraテーブルにデータを書き込むことができます。Cassandraデータストレージシステムの要件として、各データ行は(1列以上で構成される)ユニークなIDで識別される必要があります。以下の例は、Altair AI Studioのサンプルデータセットの1つを新しいCassandraテーブルに書き込む方法を示しています。

  1. Altair AI StudioでNew Process Iconから空のプロセスを開きます。
  2. IrisサンプルデータセットとWrite Cassandraオペレータをプロセスパネルにドラッグし、以下のスクリーンショットのようにオペレータを接続します。Cassandra接続を選択し、table nameに新しいテーブルの名前を入力します。

    既存のテーブルを選択することもできます。
    Cassandraは新しいデータでテーブルを更新します(新しいデータのスキーマが選択したCassandraテーブルスキーマと一致する場合)。これは、Cassandraにデータを書き込む際、新しいデータと同じユニークなIDを持つデータが上書きされるため、注意が必要であることを意味します。
  3. Write Cassandraオペレータを結果ポートに接続し、Run Processをクリックしてプロセスを実行します。

 

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル