当我发现一些令人惊讶的事情(对我来说),我测试了不同的生成时间戳的方式.
使用P / Invoke调用Windows的GetSystemTimeAsFileTime比调用DateTime.UtcNow慢约3倍,内部使用CLR的包装器来获取相同的GetSystemTimeAsFileTime.
怎么可能?
这是DateTime.UtcNow
‘s implementation:
public static DateTime UtcNow { get { long ticks = 0; ticks = GetSystemTimeAsFileTime(); return new DateTime( ((UInt64)(ticks + FileTimeOffset)) | KindUtc); } } [MethodImplAttribute(MethodImplOptions.InternalCall)] // Implemented by the CLR internal static extern long GetSystemTimeAsFileTime();
核心CLR的wrapper for GetSystemTimeAsFileTime
:
FCIMPL0(INT64,SystemNative::__GetSystemTimeAsFileTime) { FCALL_CONTRACT; INT64 timestamp; ::GetSystemTimeAsFileTime((FILETIME*)×tamp); #if BIGENDIAN timestamp = (INT64)(((UINT64)timestamp >> 32) | ((UINT64)timestamp << 32)); #endif return timestamp; } FCIMPLEND;
我的测试代码利用BenchmarkDotNet:
public class Program { static void Main() => BenchmarkRunner.Run<Program>(); [Benchmark] public DateTime UtcNow() => DateTime.UtcNow; [Benchmark] public long GetSystemTimeAsFileTime() { long fileTime; GetSystemTimeAsFileTime(out fileTime); return fileTime; } [DllImport("kernel32.dll")] public static extern void GetSystemTimeAsFileTime(out long systemTimeAsFileTime); }
结果:
Method | Median | StdDev | ------------------------ |----------- |---------- | GetSystemTimeAsFileTime | 14.9161 ns | 1.0890 ns | UtcNow | 4.9967 ns | 0.2788 ns |
解决方法
CLR几乎肯定会传递一个指向本地(自动,堆栈)变量的指针来接收结果.堆栈没有被压缩或重新定位,所以不需要引导内存等,当使用本地编译器时,这样的东西不支持,所以没有开销来解释它们.
在C#中,p / invoke声明与传递生活在垃圾回收堆中的受管理类实例的成员兼容. P / invoke必须固定该实例,否则在OS功能写入之前/之前有输出缓冲区的风险.即使您传递存储在堆栈上的变量,p / invoke仍然必须测试,看看指针是否进入垃圾回收堆,然后才能分支到固定代码,因此即使在相同的情况下也会有非零开销.
你可以使用更好的结果
[DllImport("kernel32.dll")] public unsafe static extern void GetSystemTimeAsFileTime(long* pSystemTimeAsFileTime);
通过消除out参数,p / invoke不再需要处理别名和堆压缩,现在完全是您设置指针的代码的责任.