RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Search Solr (Documents)

概要

この演算子は、Solrエントリを検索し、各結果のドキュメントを生成します。

詳細

Solrサーバーに接続するには、Solr接続を指定する必要があります。これは、SolrサーバーのURLと、認証用のオプションのユーザー/パスワードの組み合わせで構成されます。通常、SolrサーバーのURLはストリング「/ solr」で終わります。

次のステップは、サーバー上のコレクションを選択することです。コレクションはテーブルとして想像できます。これは、Solrフィールドと呼ばれるいくつかの列で構成されています。 Solrフィールドには、タイプ(例:数値)とキー(列の名前)があります。 Solrの各エントリーは行として想像でき、それぞれのフィールドの値を含んでいます。

RapidMinerドキュメントには、キーと関連する値で構成されるメタデータレコードのセットがあります。メタデータキーはSolr属性にマップされます。 RapidMinerドキュメントには追加の本文があります。したがって、Solrフィールドを選択できます。Solrフィールドの内容は、RapidMinerドキュメント本文に保存されます。

Solrを検索するには、クエリ文字列を指定する必要があります。フィルターを追加して、クエリを絞り込むことができます。たとえば、属性キーが「popularity」で値が「6」のアイテムを受け取らない場合は、「!popularity:6」を使用します。受信するエントリの範囲は、属性オフセットと行によって設定できます。受信したエントリの並べ替えに使用するフィールドを指定できます。ファセットを有効にすることもできます。ファセット検索は、検索結果を複数のカテゴリに分割します。 「ファセットフィールド」と「日付ファセット」を使用して、ファセット用のSolrフィールドを指定します。

Solrフィールドが複数の要素をサポートする場合、関連する値はJSON配列として提供されます。

入力

  • 接続 (接続)この入力ポートは、Connectionオブジェクトがあればそれを想定しています。詳細については、パラメータ接続エントリを参照してください。

出力

  • 出力(コレクション)このポートは、メインの検索結果を提供します。ドキュメントのコレクションで構成されています。
  • ファセット(IOObject)このポートは、ファセット検索の結果を提供するために使用されます。サンプルセットが提供され、フィールド名、見つかった値、および出現回数が含まれています。
  • 接続(接続)この出力ポートは、入力ポートから接続オブジェクトを配信します。入力ポートが接続されていない場合、ポートは何も配信しません。

パラメーター

  • connection_sourceこのパラメーターは、接続の指定方法を示します。事前定義とリポジトリの2つのオプションがあります。 接続入力ポートが接続されている場合、パラメーターは表示されません。 範囲:選択
  • connection_entryこのパラメーターは、 接続ソースパラメーターがrepositoryに設定されている場合にのみ使用できます 。このパラメータは、接続エントリを表すリポジトリの場所を指定するために使用されます。接続は、 接続入力ポートを使用して提供することもできます。 範囲:文字列
  • connectionこのパラメーターは、 接続ソースパラメーターが事前定義済みに設定されている場合にのみ使用できます。 Solr接続の接続の詳細を指定する必要があります。すでにSolr接続を構成している場合は、ドロップダウンリストから選択できます。 Solr接続をまだ構成していない場合は、ドロップダウンリストの右側にあるアイコンを選択します。 「接続の管理」ダイアログで新しいSolr接続を作成します。 SolrサーバーのURLは必須です。さらに、認証用のユーザー名/パスワードの組み合わせを指定できます。 範囲:設定可能
  • collectionデータにアクセスするために使用する必要があるSolrコレクションの名前を指定します。 範囲:文字列
  • query検索する用語。 範囲:文字列
  • document_body_field RapidMinerドキュメント本文として使用されるSolrフィールド。 範囲:文字列
  • filter_queryデフォルトのソート順である関連性スコアに影響しないフィルター。このフィールドを使用すると、クエリを絞り込むことができます。たとえば、フィールド名にJohnを含める必要があるが、Doeを含めることはできない場合、「name:John -name:Doe」を使用できます。 範囲:文字列
  • offset取得する最初のドキュメントインデックス。 範囲:整数
  • limit結果の最大数。 範囲:整数
  • sort検索結果をソートするかどうかを指定します。 範囲:ブール
  • sort_fieldソートに使用されるSolrフィールド。 範囲:文字列
  • sort_order結果のソート順。 範囲:選択
  • faceted_searchファセット検索を使用するかどうかを指定します。 範囲:ブール
  • categorical_facetsファセット検索に使用するファセット。 範囲:列挙
  • date_facetsファセット検索に使用する日付ファセット。単一の日付ファセットは、フィールド名、開始日、終了日、およびギャップで構成されます。 範囲:列挙
  • include_generated_fields自動生成フィールドが検索結果に含まれるかどうかを指定します。これらのフィールドは、SolrCloudフィールドで構成することも、動的Solrフィールドに基づくこともできます。 範囲:ブール
API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル