缓存端模式
将数据按需从数据存储加载到缓存中。 这可提升性能,并且有助于在缓存中保存的数据与基础数据存储中的数据之间保持一致性。
上下文和问题
应用程序使用缓存来改善对数据存储中保存的信息的重复访问。 但是,期望缓存的数据始终与数据存储保持一致是不切实际的。 应用程序应实施一种策略,以帮助确保缓存中的数据尽可能 up-to日期。 该策略还应能够检测缓存数据何时过时并适当地处理它。
解决方案
许多商业缓存系统提供直读和直写/后写操作。 在这些系统中,应用程序通过引用缓存来检索数据。 如果数据不在缓存中,应用程序将从数据存储中检索数据并将其添加到缓存中。 对缓存中保存的数据进行的任何修改还会自动写回到数据存储。
对于不提供此功能的缓存,使用缓存的应用程序将负责保存数据。
通过实施缓存端策略,应用程序可以模拟直读缓存的功能。 此策略可按需将数据加载到缓存。 下图演示使用缓存端模式在缓存中存储数据。
              
              
            
- 应用程序通过尝试从缓存中读取来确定该项当前是否保存在缓存中。
- 如果该项不在缓存中(缓存未命中),应用程序将从数据存储中检索该项。
- 应用程序将项添加到缓存,然后将其返回到调用方。
如果应用程序更新了信息,则可按照直写策略操作,方法是修改数据存储和使缓存中的相应项无效。
当再次需要该项时,缓存端策略将从数据存储中检索更新的数据,并将其添加到缓存中。
问题和注意事项
在决定如何实现此模式时,请考虑以下几点:
已缓存数据的生存期。 许多缓存使用过期策略使数据失效,并在设置期间未访问数据时将其从缓存中删除。 若要使缓存端有效,请确保过期策略与使用数据的应用程序的访问模式相匹配。 不要使过期期限过短,因为过早过期可能会导致应用程序不断从数据存储中检索数据并将其添加到缓存中。 同样,过期期限不宜太长,否则缓存数据可能会过期。 请记住,缓存最适用于相对静态的数据或经常读取的数据。
逐出数据。 与数据源自的数据存储相比,大多数缓存的大小有限。 如果缓存超出其大小限制,则会逐出数据。 大多数缓存采用最近使用最少的策略来选择要逐出的项目,但它可能是可自定义的。
配置。 缓存配置可以全局和每个缓存项进行设置。 单个全局逐出策略可能不适合所有项目。 如果某个项检索成本高昂,则缓存项上的配置可能合适。 在这种情况下,将项保留在缓存中是有意义的,即使访问频率低于更便宜的项目也是如此。
填充缓存。 很多解决方案使用可能用作应用程序启动处理一部分的数据来预填充缓存。 如果一些数据已过期或已逐出,则缓存端模式仍然十分有用。
一致性。 实现缓存端模式并不能保证数据存储与缓存之间的一致性。 例如,外部进程可以随时更改数据存储中的项。 在项再次加载之前,此更改不会显示在缓存中。 在跨数据存储复制数据的系统中,如果同步频繁发生,一致性可能会很困难。
本地(内存中)缓存。 缓存可能是应用程序实例的本地缓存,并且存储在内存中。 如果应用程序反复访问相同的数据,则缓存端在此环境中很有用。 但是,因为本地缓存是专用的,因此不同的应用程序实例可各自拥有相同缓存数据的副本。 缓存之间的此数据可快速变得不一致,因此有必要使专用缓存中保存的数据过期并更加频繁地刷新该数据。 在这些情况下,请考虑研究共享或分布式缓存机制的使用。
语义缓存。 某些工作负荷可以从基于语义含义而不是确切键执行缓存检索中获益。 这减少了发送到语言模型的请求和令牌数。 请确保缓存的数据受益于语义等效性,并且不会有返回不相关的响应或包含私有和敏感数据的风险。 例如,“我的每年带回家工资是多少?”在语义上类似于“我的每年带回家工资是什么?”,但如果两个不同的用户问及答案不应该相同,也不想在缓存中包含此敏感数据。
何时使用此模式
在以下情况下使用此模式:
- 缓存不提供本机直读和直写操作。
- 资源需求不可预知。 此模式可使应用程序按需加载数据。 它不假设应用程序提前需要哪些数据。
此模式可能不适用:
- 如果数据与敏感数据或安全性相关。 在缓存中存储缓存可能不合适,尤其是在多个应用程序或用户之间共享缓存时。 始终转到数据的主要源。
- 缓存的数据集为静态。 如果数据适合可用的缓存空间,请为缓存提供启动时的数据,并应用一个策略来防止数据过期。
- 当大多数请求不会遇到缓存命中时。 在这种情况下,检查缓存并将数据加载到缓存中的开销可能超过缓存的好处。
- 在 Web 场中托管的 Web 应用程序中缓存会话状态信息时。 在此环境中,应避免引入基于客户端服务器相关性的依赖关系。
工作负荷设计
架构师应评估设计中如何使用 Cache-Aside 模式来解决 Azure Well-Architected Framework 支柱中涵盖的目标和原则。 例如:
| 支柱 | 此模式如何支持支柱目标 | 
|---|---|
| 可靠性设计决策有助于工作负荷在发生故障后复原,并确保它在发生故障后恢复到正常运行状态。 | 缓存可以创建数据复制,并且在源数据存储暂时不可用的情况下,可以以有限的方式用于保留频繁访问的数据的可用性。 此外,如果缓存中出现故障,工作负荷可以回退到原始数据存储。 - RE:05 冗余 | 
| 性能效率通过在缩放、数据和代码方面进行优化, 帮助工作负荷高效地满足需求。 | 使用缓存 cab 可提高读取密集型数据的性能,这些数据不经常更改,并且可以容忍一些过时。 - PE:08 数据性能 - PE:12 持续性能优化 | 
与任何设计决策一样,请考虑对可能采用此模式引入的其他支柱的目标进行权衡。
示例
请考虑使用 Azure 托管 Redis 创建多个应用程序实例可以共享的分布式缓存。
以下代码示例使用 StackExchange.Redis 客户端,这是针对 .NET 编写的 Redis 客户端库。 若要连接到 Azure 托管 Redis 实例,请调用静态 ConnectionMultiplexer.Connect 方法并传入连接字符串。 该方法返回表示连接的 ConnectionMultiplexer。 共享应用程序中的 ConnectionMultiplexer 实例的一个方法是,拥有返回连接示例的静态属性(与下列示例类似)。 此方法是一种线程安全方法,仅初始化连接的一个实例。
private static ConnectionMultiplexer Connection;
// Redis connection string information
private static Lazy<ConnectionMultiplexer> lazyConnection = new Lazy<ConnectionMultiplexer>(() =>
{
    string cacheConnection = ConfigurationManager.AppSettings["CacheConnection"].ToString();
    return ConnectionMultiplexer.Connect(cacheConnection);
});
public static ConnectionMultiplexer Connection => lazyConnection.Value;
以下代码示例中的 GetMyEntityAsync 方法演示如何实现缓存端模式。 此方法使用直读方法从缓存检索对象。
通过将整数 ID 用作密钥来识别对象。 
              GetMyEntityAsync 方法尝试使用此密钥从缓存检索项。 如果找到匹配项,缓存将返回它。 如果缓存中没有匹配项,GetMyEntityAsync 方法将从数据存储检索对象、将其添加到缓存中,然后将其返回。 此处不显示从数据存储读取数据的代码,因为它依赖于数据存储。 缓存项配置为过期,以防止当其他服务或进程更新它时它变得过时。
// Set five minute expiration as a default
private const double DefaultExpirationTimeInMinutes = 5.0;
public async Task<MyEntity> GetMyEntityAsync(int id)
{
  // Define a unique key for this method and its parameters.
  var key = $"MyEntity:{id}";
  var cache = Connection.GetDatabase();
  // Try to get the entity from the cache.
  var json = await cache.StringGetAsync(key).ConfigureAwait(false);
  var value = string.IsNullOrWhiteSpace(json)
                ? default(MyEntity)
                : JsonConvert.DeserializeObject<MyEntity>(json);
  if (value == null) // Cache miss
  {
    // If there's a cache miss, get the entity from the original store and cache it.
    // Code has been omitted because it is data store dependent.
    value = ...;
    // Avoid caching a null value.
    if (value != null)
    {
      // Put the item in the cache with a custom expiration time that
      // depends on how critical it is to have stale data.
      await cache.StringSetAsync(key, JsonConvert.SerializeObject(value)).ConfigureAwait(false);
      await cache.KeyExpireAsync(key, TimeSpan.FromMinutes(DefaultExpirationTimeInMinutes)).ConfigureAwait(false);
    }
  }
  return value;
}
这些示例使用 Azure 托管 Redis 访问存储和从缓存中检索信息。 有关详细信息,请参阅在 .NET Core 中创建 Azure 托管 Redis并使用 Azure Redis。
              UpdateEntityAsync下面显示的方法演示如何在应用程序更改值时使缓存中的对象失效。 代码更新原始数据存储,然后从缓存中删除缓存的项。
public async Task UpdateEntityAsync(MyEntity entity)
{
    // Update the object in the original data store.
    await this.store.UpdateEntityAsync(entity).ConfigureAwait(false);
    // Invalidate the current cache object.
    var cache = Connection.GetDatabase();
    var id = entity.Id;
    var key = $"MyEntity:{id}"; // The key for the cached object.
    await cache.KeyDeleteAsync(key).ConfigureAwait(false); // Delete this key from the cache.
}
注意
该步骤的顺序非常重要。 请先更新数据存储,然后再从缓存中删除项。 如果首先删除缓存的项,则客户端可能会在更新数据存储之前提取项的时间很小。 在这种情况下,提取会导致缓存未命中(因为该项已从缓存中删除)。 缓存未命中会导致从数据存储中提取项的早期版本,并将其添加回缓存中。 结果是过时的缓存数据。
相关资源
实现此模式时,以下信息可能相关:
- 可靠 Web 应用模式演示了如何将旁路缓存模式应用于云上聚合的 Web 应用程序。 
- Caching Guidance(缓存指南)。 提供有关如何在云解决方案中缓存数据的其他信息,以及实现缓存时应考虑的问题。 
- Data Consistency Primer(数据一致性入门)。 云应用程序通常跨多个数据存储和位置存储数据。 在此环境中管理和维护数据一致性是系统的关键方面,尤其是可能出现的并发性和可用性问题。 此入门介绍了有关跨分布式数据的一致性问题,并总结了应用程序实现最终一致性以维持数据的可用性的方法。 
- 使用 Azure 托管 Redis 作为语义缓存。 本教程介绍如何使用 Azure 托管 Redis 实现语义缓存。