RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Write Cassandra

概要

この演算子は、サンプルセットをCassandraデータベースに書き込みます。

詳細

「Cassandraの書き込み」演算子は、Cassandraデータベースにサンプルセットを書き込みます。入力サンプルセットには、選択したCassandraテーブルのプライマリキーとして使用されるID属性が必要です。テーブルに複合プライマリキーがある場合、パラメータ「プライマリキー属性」を使用して、キー属性としてさらに属性を追加します。

入力

  • 入力 (IOObject)適切なオペレーターが読み取るサンプルセットが必要です。サンプルセットにはID属性が含まれている必要があります。したがって、ID属性を指定するには、ルールの設定演算子をプロセスに追加する必要があります。
  • 接続 (接続)この入力ポートは、Connectionオブジェクトがあればそれを想定しています。詳細については、パラメータ接続エントリを参照してください。

出力

  • 出力(IOObject)Cassandraデータベースに書き込まれるパススルーサンプルセット。
  • 接続(接続)この出力ポートは、入力ポートから接続オブジェクトを配信します。入力ポートが接続されていない場合、ポートは何も配信しません。

パラメーター

  • connection_sourceこのパラメーターは、接続の指定方法を示します。事前定義とリポジトリの2つのオプションがあります。 接続入力ポートが接続されている場合、パラメーターは表示されません。 範囲:選択
  • connection_entryこのパラメーターは、 接続ソースパラメーターがrepositoryに設定されている場合にのみ使用できます 。このパラメータは、接続エントリを表すリポジトリの場所を指定するために使用されます。接続は、 接続入力ポートを使用して提供することもできます。 範囲:文字列
  • connectionこのパラメーターは、 接続ソースパラメーターが事前定義済みに設定されている場合にのみ使用できます。 Cassandra接続の接続の詳細は、ここで指定できます。 Cassandra接続をすでに設定している場合は、ドロップダウンリストから選択できます。 Cassandra接続をまだ構成していない場合は、ドロップダウンリストの右側にあるCassandraアイコンを選択します。 [接続の管理]ボックスで新しいCassandra接続を作成します。連絡先とキースペース名は必須です。 範囲:設定可能
  • consistency_levelCassandraクエリの一貫性レベル。整合性レベルは、成功するためにクエリに応答する必要があるCassandraノードの数を定義します。可能なレベル:ONE、TWO、THREE、QUORUM、ALL、ANY
    • ONE:書き込みは少なくとも1つのノードに書き込まれる必要があります。
    • TWO:書き込みは少なくとも2つのノードに書き込まれる必要があります。
    • THREE:書き込みは少なくとも3つのノードに書き込まれる必要があります。
    • QUORUM:書き込みは、少なくともノードのクォーラムに書き込まれる必要があります。クォーラムは(整数に切り捨て):(replication_factor / 2)+ 1として計算されます。たとえば、複製係数が3の場合、クォーラムは2(1ノードのダウンを許容できます)です。レプリケーション係数が6の場合、クォーラムは4です(2ノードのダウンを許容できます)。
    • ALL:その行キーのクラスター内のすべてのノードに書き込みを書き込む必要があります。
    • ANY:書き込みは少なくとも1つのノードに書き込む必要があります

    範囲:選択

  • table_nameサンプルセットが書き込まれるテーブルの名前。同じ名前のテーブルが既に存在する場合、サンプルセットに互換性があると仮定して、テーブルが更新されます。つまり、属性名とタイプが一致します。テーブルがまだ存在しない場合は、この名前の新しいテーブルが作成され、サンプルセットがこのテーブルに書き込まれます。サンプルセットのID属性は、主キーとして使用されます。新しく作成されたテーブルにインデックス列を定義する必要がある場合は、パラメーター ‘index columns’を使用します。 範囲:文字列
  • batch_sizeこのパラメーターは、1つの要求で書き込まれる行の最大数を定義します。デフォルト値は1000 です。範囲:整数
  • primary_key_attributes Cassandraテーブルが既に存在し、複合プライマリキーがある場合、サンプルセットの保存に使用されるプライマリキーにさらに属性を追加できます。 Cassandraテーブルがまだ存在しない場合は、[パラメーターの編集]リストに主キー属性を追加できます。主キー属性は、複合主キーを作成します。この主キーは、ID属性と選択された属性で構成されます。 範囲:列挙
  • index_columnsこのオプションは、Cassandraテーブルがまだ存在しない場合にのみ必要です。 [パラメーターの編集]リストで新しく作成されたテーブルのインデックス列として列を定義できます:インデックス列。 範囲:列挙
  • use_ttlチェックボックスが有効になっている場合、追加のパラメーター「ttl」(Time To Live)が表示されます。このパラメーターを使用すると、書き込まれたデータの時間間隔値を秒単位で指定できます。設定されている場合、挿入された値は、指定された時間間隔後にデータベースから自動的に削除されます。注:この削除アクションは、列自体ではなく、挿入された値にのみ影響します。これは、その後の列の更新が「ttl」値をリセットすることを意味します。デフォルトでは、値は削除されません。 範囲:ブール
  • ttl 「use_ttl」チェックボックスが有効になっている場合、値を秒単位で指定できます。デフォルトでは、この値は120秒です。 1以上の任意の正数を入力できます。 範囲:整数
API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル