Generate Multi-Label Data
概要
この演算子は、数値属性に基づいてマルチラベルExampleSetを生成します。例の数、属性の下限と上限はユーザーが指定できます。
詳細
マルチラベルデータの生成演算子は、5つの数値属性と3つのラベル属性を持つExampleSetを生成します。 回帰パラメータがfalseに設定されている場合、ラベルには2つの可能な値、つまり正または負の値があります。それ以外の場合、ラベルには実際の値があります。生成されるサンプルの数は、 number examplesパラメーターで指定できます。数値の上限と下限は、 属性の上限パラメーターと属性の下限パラメーターで指定できます。この演算子は、テスト目的でランダムなExampleSetを生成するために使用されます。
出力
- 出力(IOObject)Generate Multi-Label Dataオペレーターは、このポートを介して配信される数値属性に基づいてマルチラベルExampleSetを生成します。メタデータもデータとともに配信されます。この出力は、Retrieveオペレーターの出力と同じです。
パラメーター
- number_examplesこのパラメーターは、生成されるサンプルの数を指定します。 範囲:整数
- regressionこのパラメーターは、回帰タスクの複数のラベルを生成するかどうかを指定します。このパラメーターがfalseに設定されている場合、ラベルには2つの可能な値、つまり正または負の値があります。それ以外の場合、ラベルには実際の値があります。 範囲:ブール
- attributes_lower_boundこのパラメーターは、生成される属性の最小値を指定します。つまり、このパラメーターは、通常の属性の可能な値の範囲の下限を指定します。 範囲:実数
- attributes_upper_boundこのパラメーターは、生成される属性の可能な最大値を指定します。つまり、このパラメーターは、通常の属性の可能な値の範囲の上限を指定します。 範囲:実数
- use_local_random_seedこのパラメーターは、ランダム化にローカルランダムシードを使用する必要があるかどうかを示します。同じ値のローカルランダムシードを使用すると、同じExampleSetが生成されます。このパラメーターの値を変更すると、例のランダム化方法が変更されるため、ExampleSetには異なる値のセットが含まれます。 範囲:ブール
- local_random_seedこのパラメータは、 ローカルランダムシードを指定します。このパラメーターは、 ローカルシードの使用パラメーターがtrueに設定されている場合にのみ使用できます。 範囲:整数
チュートリアルプロセス
マルチラベルデータの生成演算子の概要
ExampleSetの生成には、マルチラベルデータの生成演算子が適用されます。 number examplesパラメータは100に設定されているため、ExampleSetには100個のサンプルが含まれます。属性の下限パラメーターと属性の上限パラメーターはそれぞれ-10と10に設定されているため、通常の属性の値はこの範囲内になります。回帰パラメータはfalseに設定されているため、ExampleSetには名義ラベルがあります。これを確認するには、結果ワークスペースで結果を表示します。この例のプロセスでは、use local random seedパラメータがfalseに設定されています。ローカルシードを使用するパラメータをtrueに設定し、ローカルランダムシードの異なる値でプロセスを実行します。ローカルランダムシードの値を変更すると、ランダム化が変更されることがわかります。