TorchSharpCatalog.SentenceSimilarity 方法
定义
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
重载
| SentenceSimilarity(RegressionCatalog+RegressionTrainers, SentenceSimilarityTrainer+SentenceSimilarityOptions) |
针对 NLP 句子相似性微调 NAS-BERT 模型。 任何句子的限制为 512 个标记。 每个单词通常映射到单个标记,我们自动添加 2 个特定标记 (开始标记和分隔符标记) 因此,对于所有句子,此限制通常为 510 个单词。 |
| SentenceSimilarity(RegressionCatalog+RegressionTrainers, String, String, String, String, Int32, Int32, BertArchitecture, IDataView) |
针对 NLP 句子相似性微调 NAS-BERT 模型。 任何句子的限制为 512 个标记。 每个单词通常映射到单个标记,我们自动添加 2 个特定标记 (开始标记和分隔符标记) 因此,对于所有句子,此限制通常为 510 个单词。 |
SentenceSimilarity(RegressionCatalog+RegressionTrainers, SentenceSimilarityTrainer+SentenceSimilarityOptions)
- Source:
- TorchSharpCatalog.cs
- Source:
- TorchSharpCatalog.cs
- Source:
- TorchSharpCatalog.cs
针对 NLP 句子相似性微调 NAS-BERT 模型。 任何句子的限制为 512 个标记。 每个单词通常映射到单个标记,我们自动添加 2 个特定标记 (开始标记和分隔符标记) 因此,对于所有句子,此限制通常为 510 个单词。
public static Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer SentenceSimilarity(this Microsoft.ML.RegressionCatalog.RegressionTrainers catalog, Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer.SentenceSimilarityOptions options);
static member SentenceSimilarity : Microsoft.ML.RegressionCatalog.RegressionTrainers * Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer.SentenceSimilarityOptions -> Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer
<Extension()>
Public Function SentenceSimilarity (catalog As RegressionCatalog.RegressionTrainers, options As SentenceSimilarityTrainer.SentenceSimilarityOptions) As SentenceSimilarityTrainer
参数
转换的目录。
高级选项
返回
适用于
SentenceSimilarity(RegressionCatalog+RegressionTrainers, String, String, String, String, Int32, Int32, BertArchitecture, IDataView)
- Source:
- TorchSharpCatalog.cs
- Source:
- TorchSharpCatalog.cs
- Source:
- TorchSharpCatalog.cs
针对 NLP 句子相似性微调 NAS-BERT 模型。 任何句子的限制为 512 个标记。 每个单词通常映射到单个标记,我们自动添加 2 个特定标记 (开始标记和分隔符标记) 因此,对于所有句子,此限制通常为 510 个单词。
public static Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer SentenceSimilarity(this Microsoft.ML.RegressionCatalog.RegressionTrainers catalog, string labelColumnName = "Label", string scoreColumnName = "Score", string sentence1ColumnName = "Sentence1", string sentence2ColumnName = "Sentence2", int batchSize = 32, int maxEpochs = 10, Microsoft.ML.TorchSharp.NasBert.BertArchitecture architecture = Microsoft.ML.TorchSharp.NasBert.BertArchitecture.Roberta, Microsoft.ML.IDataView validationSet = default);
static member SentenceSimilarity : Microsoft.ML.RegressionCatalog.RegressionTrainers * string * string * string * string * int * int * Microsoft.ML.TorchSharp.NasBert.BertArchitecture * Microsoft.ML.IDataView -> Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer
<Extension()>
Public Function SentenceSimilarity (catalog As RegressionCatalog.RegressionTrainers, Optional labelColumnName As String = "Label", Optional scoreColumnName As String = "Score", Optional sentence1ColumnName As String = "Sentence1", Optional sentence2ColumnName As String = "Sentence2", Optional batchSize As Integer = 32, Optional maxEpochs As Integer = 10, Optional architecture As BertArchitecture = Microsoft.ML.TorchSharp.NasBert.BertArchitecture.Roberta, Optional validationSet As IDataView = Nothing) As SentenceSimilarityTrainer
参数
转换的目录。
- labelColumnName
- String
标签列的名称。 列应为浮点类型。
- scoreColumnName
- String
分数列的名称。
- sentence1ColumnName
- String
第一个句子的列的名称。
- sentence2ColumnName
- String
第二个句子的列的名称。 仅当 NLP 分类需要句子对时才需要。
- batchSize
- Int32
批处理中的行数。
- maxEpochs
- Int32
遍历训练集的最大次数。
- architecture
- BertArchitecture
模型的体系结构。 默认为 Roberta。
- validationSet
- IDataView
训练时使用的验证集以提高模型质量。