了解何时微调基础模型
通过使用开源预先训练 的基础 模型,可以节省资源。 有时,可能需要微调基础模型以满足特定需求。
浏览模型目录中的基础模型
基础模型是经过训练的大型机器学习模型,它们作为各种应用场景的基础平台。
在 Azure 机器学习中,可以通过搜索 模型目录来浏览开源基础模型。 所需的基础模型类型取决于要使用模型的类型。
一般情况下,基础模型基于大量数据进行训练,擅长执行一般任务,例如理解语言、生成文本和预测上下文。 但是,如果需要针对特定任务或域定制的模型,则它们可能不是最佳选择。 在这种情况下,微调任务特定数据的基础模型有助于满足特定要求并取得更好的结果。
为特定任务微调基础模型
虽然基础模型可能已经满足你的要求,但可能需要微调基础模型。
基础模型经过预训练,学习互联网中的多样文本,使其在一般语言理解方面变得非常精通。 但是,微调使你可以根据特定任务或域定制模型的知识,优化其性能并确保它在该特定上下文中表现良好。
你可能想要微调基础模型的一些常见任务包括:
- 文本分类:根据给定文本的内容或上下文将给定文本分类为预定义类或类别。
- 标记分类:将特定标签或标记分配给文本中的单个标记或单词,通常用于命名实体识别等任务。
- 问答:提供用自然语言提出的问题的准确相关答案。
- 摘要:创建较长文本的简洁且连贯的摘要,捕获基本信息。
- 翻译:将文本从一种语言转换为另一种语言,同时保留含义和上下文。
由于基础模型已预先训练,因此需要一个较小的特定于任务的数据集来微调基础模型。 微调模型时,可能需要比从头开始训练模型所需的数据和计算更少。
可以从 Azure 机器学习中的模型目录中微调基础模型。 只需使用小型数据集和 GPU 群集即可微调模型。