问题 精确测量线程中代码的执行时间(C#)


我正在尝试在多个线程上尽可能准确地测量某些代码位的执行时间,同时考虑上下文切换和线程停机时间。该应用程序在C#(VS 2008)中实现。例:

public void ThreadFunc ()
{
    // Some code here

    // Critical block #1 begins here
    long lTimestamp1 = Stopwatch.GetTimestamp ();

    CallComplex3rdPartyFunc (); // A

    long lTimestamp2 = Stopwatch.GetTimestamp ();
    // Critical block #1 ends here

    // Some code here

    // Critical block #2 begins here
    long lTimestamp3 = Stopwatch.GetTimestamp ();

    CallOtherComplex3rdPartyFunc (); // B

    long lTimestamp4 = Stopwatch.GetTimestamp ();
    // Critical block #2 ends here

    // Save timestamps for future analysis.
}

public int Main ( string[] sArgs )
{
    // Some code here

    int nCount = SomeFunc ();

    for ( int i = 0; i < nCount; i++ )
    {
        Thread oThread = new Thread ( ThreadFunc );
        oThread.Start ();
    }

    // Some code here

    return ( 0 );
}

我想尽可能准确地测量上述两个关键代码块的执行时间。这两个电话标记为 一个 和  可能是长函数调用,有时可能需要几秒钟才能执行,但在某些情况下,它们可能会在几毫秒内完成。

我在许多线程上运行上面的代码 - 介于1到200个线程之间,具体取决于用户输入。运行此代码的计算机具有2-16个核心 - 用户在较弱的计算机上使用较低的线程数。

问题是 一个 和  两者都是潜在的长函数,因此很可能在执行期间至少会发生一次上下文切换 - 可能不止一次。所以代码获取lTimestamp1,然后另一个线程开始执行(当前线程等待)。最终当前线程返回控制并检索lTimestamp2。

这意味着之间的持续时间 lTimestamp1 和 lTimestamp2 包括线程实际上没有运行的时间 - 它正在等待在执行其他线程时再次调度。但是,滴答计数无论如何都会增加,所以持续时间现在确实如此

代码块时间= A + B + 花在其他线程上的时间

虽然我希望它只是

代码块时间= A + B.

这对于大量线程来说尤其是一个问题,因为它们都有机会运行,因此上述时间将更高,而所有其他线程在相关线程运行之前运行。

所以我的问题是:是否有可能以某种方式计算线程的时间  运行然后相应调整上述时间?我想完全或至少尽可能地消除(减去)第三个词。代码运行数百万次,因此最终时间是从大量样本计算出来的,然后进行平均。

我不是在寻找探查器产品等 - 应用程序需要尽可能准确地计算这些标记的部件。功能 一个 和  是第三方功能,我不能以任何方式改变它们。我也知道在测量纳秒级精度的时间和第三方功能内部可能的开销时可能出现的波动,但我仍然需要进行这种测量。

任何建议都将非常感激--C ++或x86汇编代码也可以。

编辑: 似乎无法实现这一点。斯科特的想法如下(使用GetThreadTimes)是好的,但不幸的是GetThreadTimes()是一个有缺陷的API,它几乎永远不会返回正确的数据。感谢所有的答复!


10952
2017-09-29 14:25


起源

你不能这样做,除了修改.NET运行时并在那里收集时间(即使这样也不准确!) - Yahia
有关: stackoverflow.com/questions/3853993/... - Henk Holterman
我不知道这是一个评论还是解决方案,但为什么你不只是简单地编写代码并按照它应该测量它,我的意思是独自一人?将始终有线程开关(即使是操作系统!).. - gbianchi
如果没有分析器,我认为没有办法做到这一点。还值得一提的是,对于cpu绑定任务,在16核机器上创建200个线程是适得其反的。 - Yaur
如果有其他线程可以安排,线程将只花时间等待安排。为什么不降低系统中每个其他线程的优先级,使其永远不会运行?然后你只测量你的线程花费的时间,因为它是系统中实际运行的唯一线程。 - Eric Lippert


答案:


这可以使用Native API调用完成 GetThreadTimes。这是一篇文章 在CodeProject上 使用它。

第二种选择是使用 QueryThreadCycleTime。这不会给你时间,但它会给你当前线程执行的周期数。

请注意,您不能直接转换 cycles->seconds 由于许多处理器(特别是移动处理器)不以固定速度运行,因此没有常数,您可以乘以以秒为单位获取经过的时间。但是,如果您使用的处理器不会改变其速度,那么从周期中获取挂钟时间将是一个简单的数学问题。


10
2017-09-29 15:12



他应该结合使用它 Thread.BeginThreadAffinity 确保代码在执行期间保持在同一物理线程上。 - user7116
Scott和sixlettervarariables - 谢谢你,这看起来很有希望。我将不得不阅读整篇CodeProject文章,但这似乎是一个很好的领导。 - xxbbcc
对不起,我必须带走“正确答案”标记,即使你的答案是最好的也是最接近的。不幸的是,GetThreadTimes()是一个无用的API - 它具有15ms的分辨率,当线程产生或进入等待状态时,它经常报告0作为内核时间和/或用户时间。看起来我正在尝试做的测量是不可能的,至少在Windows上是这样。 - xxbbcc
@xxbbcc我知道这是一个较旧的问题,你可能不再需要这个,但看看我发布的更新。 - Scott Chamberlain
@ScottChamberlain感谢您的更新 - 我知道变速CPU(这也是虚拟机中的一个问题)。我一直在寻找一种方法来收集频率信息和时间,但即使信息可用(很少),它几乎是不可靠的。我放弃了尝试这样做,因为大多数硬件根本不报告有用的性能数字。 - xxbbcc


您可以使用 Stopwatch.Start() 和 Stopwatch.Stop() 暂停/继续时间测量的方法,它不会重置 过去/ElapsedMilliseconds 价值所以也许你可以利用这个。

关于线程上下文切换 - 我相信没有办法在托管代码中处理它,所以这不可能排除线程被挂起时的时间

编辑:

一篇有趣的文章与基准: 上下文切换需要多长时间?


2
2017-09-29 14:37



这不是问的问题。 - Yaur
@Yaur:我理解问题的关键点,我相信我们没有处理上下文切换的技术工具 - sll
sll:遗憾的是我不能只用秒表来做,因为我不知道OS何时停止当前线程切换到另一个。所以我的问题是,即使我的当前线程没有运行,但是等待再次安排,底层的CPU滴答仍然过去了。对于我的应用程序的“当前”线程来说,这显然不是问题 - 它适用于我创建的所有线程,因为所有这些线程都尝试进行相同的测量。 - xxbbcc