我们需要定期在我们的WAN(英国到美国)上以超过50Mbps的租用线路传输大型(60GB)Hyper-V虚拟机映像.我们还在站点之间使用DFS-R.从历史上看,我使用7-zip压缩虚拟机(分成较小的100MB块),然后将文件放入DFS-R传输文件夹.当积压清除时,在另一端解压缩.
我想知道我是否在浪费时间,并且可能会将整个VM(主要是VMDX文件)放在传输文件夹中,让DFS-R在传输过程中压缩它.
所以问题是 – 与7-zip的原生7z格式相比,DFS-R压缩算法的效率如何? 7-zip将图像打包至约20GB,节省70%.
我觉得打包和解包的额外时间超过了7-zip算法中任何可能的更高压缩比.也就是说,传输100MB的块感觉比一个大的50GB VMDX文件“更好”.
DFS-R使用称为远程差分压缩的东西.
该算法不是比较和传输整个文件,而是比较源和目标副本之间的顺序数据块的签名.这样,只需要跨越线路传输不同的数据块,以便在目标位置“重建”文件.
因此,RDC与7-zip中使用的压缩算法不具有可比性.尽管他们使用类似的技术(在数据范围上构建签名词典),但7-zip算法旨在将字节重新排列为无损容器格式,其中所有数据被“挤压”在一起,其中RDC的目的是识别类似文件之间的差异或文件版本,以便最小化传输的数据量,以保持副本同步
如果您已在目标位置拥有类似的VMDX文件,则无需将文件拆分为100MB块.在压缩图像时,务必始终使用相同的压缩算法
这种行为(比较类似的文件,不是同一文件的不同版本,并提取块)被称为“跨文件RDC”,公开可用的文档相当稀疏,但AskDS博客团队有一个简短但很好的澄清in this Q&A post