问题 是否可以检查缓存的正则表达式的数量?


Regex.CacheSize属性   获取或设置已编译正则表达式的当前静态高速缓存中的最大条目数。

Regex类维护>静态方法调用中使用的已编译正则表达式的内部缓存。如果set操作中指定的值小于当前>高速缓存大小,则会丢弃高速缓存条目,直到高速缓存大小等于指定的>值。

默认情况下,缓存包含15个编译的静态正则表达式。您的应用程序>通常不必修改缓存的大小。如果要关闭缓存或具有异常大的缓存,请仅使用CacheSize属性。

所以我想深入了解缓存中当前的表达式数量。任何人都知道这是否可行?

想法是我现在重复使用<15个,所以不想乱动 CacheSize,但是我希望能够在某个时刻检查实际的缓存使用情况,如果我达到最大值(正如正则表达式使用扩展)或动态调整,请记录 CacheSize

或者,任何关于简单地增加的开销的评论 CacheSize 到一些任意大的数字?


3605
2017-10-18 14:56


起源

AFAIK没有暴露的方式,但是你可以使用反射来拉取值。我相信缓存是 LinkedListNode<CachedCodeEntry> livecode。 - Lloyd
为什么不创建编译的Regex实例并自己管理它们而不是缓存的黑盒方法?如果您预计您的代码库会以意想不到的方向增长/被用作库,那么没有最大缓存大小值是合适的。 - spender


答案:


反编译( mscorlib 4.0)显示缓存是一个 internal 链表 CachedCodeEntry所以如果没有反思你就不会得到它。

增加最大缓存大小的开销是:

  1. 存储缓存条目的内存成本;最大值的使用就像这样的逻辑 Regex 创建:

    • 我们一般都在缓存吗?
      • 如果是这样,请缓存此正则表达式
      • 我们现在超过了最大缓存大小吗?
        • 如果是,请删除最后一个缓存条目


2.遍历缓存寻找匹配的成本增加

只要你的数字不荒谬,你就应该好好开始吧。

这是您需要检索当前缓存大小的反射代码:

    public static int RegexCacheSize()
    {
        var fi = typeof(Regex).GetField("livecode", BindingFlags.Static 
                                                  | BindingFlags.NonPublic);
        var coll = (ICollection)(fi.GetValue(null));

        return coll.Count;
    }

我们使用演员来 ICollection 避免必须转换为内部类型的通用列表的复杂性。


14
2017-10-18 15:11