数据分析概述

已完成

在数据可用于讲述故事之前,必须通过使其在故事中可用的流程来运行数据。 数据分析是标识、清除、转换和建模数据的流程,用于发现有意义和有用的信息。 然后,通过报表将数据制作成故事进行分析,以支持关键的决策流程。

随着数据对世界发展的推动作用日益增加,通过数据分析讲述故事正在成为各种规模的企业非常重要的一部分。 这也是组织继续雇用数据分析师的原因。

数据驱动型企业根据数据讲述的故事做出决策,而在当今数据驱动的世界中,数据的潜力未完全发挥,这是大多数企业面临的挑战。 数据分析是并且也应该是所有组织的重要部分,用于帮助确定业务的影响(包括评估客户情绪、进行市场和产品研究,以及确定趋势或其他数据见解)。

尽管数据分析流程侧重于清理、建模和可视化数据的任务,但数据分析的概念及其对企业的重要性不容小觑。 若要分析数据,分析的核心部分划分为以下类别:

  • 描述性
  • 诊断性
  • 预测性
  • 规范性
  • 人工智能 (AI)

描述性分析

描述性分析有助于根据历史数据回答有关发生了什么的问题。 描述性分析技术汇总大型语义模型,以向利益干系人描述结果。

通过开发关键绩效指标 (KPI),这些策略有助于跟踪关键目标的成功或失败情况。 许多行业都使用投资回报率 (ROI) 等指标,某些行业还开发了专门用于跟踪性能的指标。

描述性分析的示例包括生成报表来提供组织销售和财务数据的视图。

诊断性分析

诊断性分析有助于回答有关为什么发生事件的问题。 诊断分析技术是对基本描述性分析的补充,通过使用描述性分析的结果来发现这些事件发生的原因。 然后,进一步调查绩效指标,以发现这些事件变得更好或更糟的原因。 此流程通常分为三个步骤:

  1. 确定数据中的异常。 这些异常可能是指标或特定市场中发生的意外变化。

  2. 收集与这些异常相关的数据。

  3. 使用统计技术来发现可解释这些异常的关系和趋势。

预测性分析

预测性分析有助于回答有关将来会发生什么的问题。 预测性分析技术使用历史数据来确定趋势并确定它们是否有可能重复出现。 预测性分析工具提供将来可能发生什么的有价值见解。 技术包括各种统计和机器学习技术,例如神经网络、决策树和回归。

规范性分析

规范性分析有助于回答有关应采取哪些措施来实现目标的问题。 通过使用来自规范性分析的见解,组织可以做出数据驱动型决策。 此方法允许企业在面临不确定性时做出明智的决策。 规范性分析技术依赖于机器学习作为在大型语义模型中查找模式的策略之一。 通过分析过去的决策和事件,组织可以估计不同结果的可能性。

人工智能

人工智能 (AI) 有助于回答有关数据的问题。 AI 是指在经过编程后可以思考、学习和适应的机器中模拟人类智能。 在分析环境中,AI 使系统能够处理大量数据、识别模式,并在极少的人工干预下提供见解。 它支持广泛的应用,从自然语言处理和图像识别到代码生成和智能可视化建议。

示例

通过启用报告和数据可视化,零售企业使用描述性分析来查看前几年的购买模式,以确定下一年可能会受欢迎的产品。 企业还可以查看支持性数据,了解特定产品为何受欢迎,以及该趋势是否会持续下去,这将有助于确定是否要继续储备该产品。

企业可能确定某个产品在特定时间段内很受欢迎。 然后,可以利用此分析来确定某些市场营销工作或在线社交活动是否有助于增加销售额。

数据分析的一个基础就是企业需要信任其数据。 数据分析流程的一个实践方案是捕获来自可信来源的数据并将其转化为可使用、有意义且易于理解的内容,用于帮助执行决策流程。 通过数据分析,企业可以借助数据驱动的流程和决策来充分了解其数据,使企业能够放心地做出决策。

随着数据量的增加,对数据分析师的需求也会增加。 数据分析师知道如何组织信息,并对信息进行“萃取和提炼”,最后得到可理解的有意义的内容。 数据分析师知道如何收集适当的数据以及如何使用它们,即在数据重载中理解数据。