TorchSharpCatalog.SentenceSimilarity 方法

定义

重载

SentenceSimilarity(RegressionCatalog+RegressionTrainers, SentenceSimilarityTrainer+SentenceSimilarityOptions)

针对 NLP 句子相似性微调 NAS-BERT 模型。 任何句子的限制为 512 个标记。 每个单词通常映射到单个标记,我们自动添加 2 个特定标记 (开始标记和分隔符标记) 因此,对于所有句子,此限制通常为 510 个单词。

SentenceSimilarity(RegressionCatalog+RegressionTrainers, String, String, String, String, Int32, Int32, BertArchitecture, IDataView)

针对 NLP 句子相似性微调 NAS-BERT 模型。 任何句子的限制为 512 个标记。 每个单词通常映射到单个标记,我们自动添加 2 个特定标记 (开始标记和分隔符标记) 因此,对于所有句子,此限制通常为 510 个单词。

SentenceSimilarity(RegressionCatalog+RegressionTrainers, SentenceSimilarityTrainer+SentenceSimilarityOptions)

Source:
TorchSharpCatalog.cs
Source:
TorchSharpCatalog.cs
Source:
TorchSharpCatalog.cs

针对 NLP 句子相似性微调 NAS-BERT 模型。 任何句子的限制为 512 个标记。 每个单词通常映射到单个标记,我们自动添加 2 个特定标记 (开始标记和分隔符标记) 因此,对于所有句子,此限制通常为 510 个单词。

public static Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer SentenceSimilarity(this Microsoft.ML.RegressionCatalog.RegressionTrainers catalog, Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer.SentenceSimilarityOptions options);
static member SentenceSimilarity : Microsoft.ML.RegressionCatalog.RegressionTrainers * Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer.SentenceSimilarityOptions -> Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer
<Extension()>
Public Function SentenceSimilarity (catalog As RegressionCatalog.RegressionTrainers, options As SentenceSimilarityTrainer.SentenceSimilarityOptions) As SentenceSimilarityTrainer

参数

catalog
RegressionCatalog.RegressionTrainers

转换的目录。

返回

适用于

SentenceSimilarity(RegressionCatalog+RegressionTrainers, String, String, String, String, Int32, Int32, BertArchitecture, IDataView)

Source:
TorchSharpCatalog.cs
Source:
TorchSharpCatalog.cs
Source:
TorchSharpCatalog.cs

针对 NLP 句子相似性微调 NAS-BERT 模型。 任何句子的限制为 512 个标记。 每个单词通常映射到单个标记,我们自动添加 2 个特定标记 (开始标记和分隔符标记) 因此,对于所有句子,此限制通常为 510 个单词。

public static Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer SentenceSimilarity(this Microsoft.ML.RegressionCatalog.RegressionTrainers catalog, string labelColumnName = "Label", string scoreColumnName = "Score", string sentence1ColumnName = "Sentence1", string sentence2ColumnName = "Sentence2", int batchSize = 32, int maxEpochs = 10, Microsoft.ML.TorchSharp.NasBert.BertArchitecture architecture = Microsoft.ML.TorchSharp.NasBert.BertArchitecture.Roberta, Microsoft.ML.IDataView validationSet = default);
static member SentenceSimilarity : Microsoft.ML.RegressionCatalog.RegressionTrainers * string * string * string * string * int * int * Microsoft.ML.TorchSharp.NasBert.BertArchitecture * Microsoft.ML.IDataView -> Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer
<Extension()>
Public Function SentenceSimilarity (catalog As RegressionCatalog.RegressionTrainers, Optional labelColumnName As String = "Label", Optional scoreColumnName As String = "Score", Optional sentence1ColumnName As String = "Sentence1", Optional sentence2ColumnName As String = "Sentence2", Optional batchSize As Integer = 32, Optional maxEpochs As Integer = 10, Optional architecture As BertArchitecture = Microsoft.ML.TorchSharp.NasBert.BertArchitecture.Roberta, Optional validationSet As IDataView = Nothing) As SentenceSimilarityTrainer

参数

catalog
RegressionCatalog.RegressionTrainers

转换的目录。

labelColumnName
String

标签列的名称。 列应为浮点类型。

scoreColumnName
String

分数列的名称。

sentence1ColumnName
String

第一个句子的列的名称。

sentence2ColumnName
String

第二个句子的列的名称。 仅当 NLP 分类需要句子对时才需要。

batchSize
Int32

批处理中的行数。

maxEpochs
Int32

遍历训练集的最大次数。

architecture
BertArchitecture

模型的体系结构。 默认为 Roberta。

validationSet
IDataView

训练时使用的验证集以提高模型质量。

返回

适用于