定义问题

首先，你需要通过了解以下内容来定义模型应解决的问题：

根据拥有的数据和模型的预期输出，可以识别机器学习任务。该任务确定可用于训练模型的算法类型。

一些常见的机器学习任务包括：

五个常见机器学习任务的概述示意图。

若要训练模型，可以使用一组算法，具体取决于要执行的任务。若要评估模型，可以计算性能指标，例如准确性或精度。可用的指标还取决于模型需要执行的任务，并有助于确定模型是否成功执行其任务。

探索示例

考虑这样一个场景，你想要确定患者是否患有糖尿病。尝试解决的问题以及可用的数据类型决定了选择的机器学习任务。在这种情况下，可用数据是患者的其他健康数据点。我们可以将我们想要的输出表示为患者患有糖尿病或未患糖尿病的分类信息。因此，机器学习任务是“分类”。

在开始之前，先了解整个过程，让你有机会制定出设计成功的机器学习解决方案所需的决策。下面是一个示意图，显示了一种识别患者糖尿病的方式。在关系图中，使用特定的算法对数据进行准备、拆分和训练。之后，评估模型的质量。

展示模型训练的七个步骤的示意图。

训练机器学习模型通常是一个迭代过程，在这个过程中，你要多次执行这些步骤，以找到性能最佳的模型。接下来，让我们检查用于开发机器学习解决方案的数据准备过程。

此页面是否有帮助？