SSD挑战百万文件 正确认识硬盘4K性能的意义

纯金处理器2015-02-09 09:04产品 标签:意义 性能 硬盘 文件

《电脑爱好者》在以前的内容中不止一次强调过要给SSD固态硬盘进行4K对齐,否则就会影响SSD的性能发挥。但是,相信仍有不少同学“看不起”4K对齐,或是没有真正了解4K对齐到底会影响SSD哪方面的性能。因此,本文就让我们通过一次奇葩的测试,重新认识一下4K性能对SSD的意义吧。

小文件引起的大尴尬

相信大家都有过类似的经历:复制粘贴一个内含无数小文件的文件夹(如离线地图、游戏数据包等)时的速度极慢,但如果先将该文件夹压缩成一个压缩包再复制粘贴,你会发现速度又变得极快。很遗憾,我们在安装游戏时会产生大量小文件、数据备份时会遭遇大量小文件……日常应用中最最普遍的系统瓶颈(卡顿)几乎都是由无数个小文件引起的。因此,如何可以提高硬盘读写小文件的能力,无疑就是摆脱存储瓶颈的关键所在。

扩展阅读:4K对齐的原理

HDD机械硬盘以扇区(512字节)为单位,可直接覆盖写入新数据。而SSD固态用盘则以页(典型为4KB)为单位进行读写操作,但擦除时却是以块(典型为128个页)为单位。由于SSD无法直接覆写,所以有数据的页必须先擦除才能写入新数据,经历“读取→擦除→写入”的过程。传统硬盘分区会从起始偏移为63个扇区(这63个扇区用于保存主引导记录、分区表等信息),也就是分区偏移了31.5K,数据起始4KB在31.5KB~35.5KB,位于第8和第9页,以此类推其后所有数据都占用2个页。换句话说,如果4K没有对齐,覆写时需要对2页进行“读取→擦除→写入”操作,从而降低了SSD的效率。而4K对气候,覆写时就只需进行1页操作。

因量变而引起质变

理论上,SSD的4K性能将严重影响到小文件的读写性能。为了证明这一理论,笔者进行了3次奇葩的测试:

测试说明:为了突出4K性能对性能的实际影响,本次测试使用了东芝Q-PRO系列的128GB和256GB两款SSD硬盘(图1)。其中,256GB版的4K性能要优于128GB版(图2)。因此,我们可以将128GBSSD视为未4K对齐时的状态,而256GB SSD则可模拟已4K对齐时的状态。

01

02

第1次:分别在两块SSD中拷贝单文件大于1GB容量的电影,共22.4GB,合24个小文件;

第2次:分别在两块SSD中拷贝从KB到MB大小不等的图片,共24.8GB,合21745个小文件;

第3次:分别在两块SSD中拷贝单文件仅有23字节的txt文档,共25MB,合100万个小文件。

在第1次测试中,两块SSD的拷贝速度极为接近,可见大文件的读写对4K性能并不敏感。在第2次测试中,两块SSD的拷贝速度就体现出明显差距了,其中128GB版的SSD速度会从最初的250MB/s左右逐渐降到200MB/s左右(图3),而256GB版的SSD速度却始终稳定在290MB/s左右(图4),效率要比前者提高32%左右(见表)。

03

03

04

04

捕获

而最令人惊讶的就是第三次测试的结果。别看100万个txt小文件只有25MB大小,但它却占用了3.72GB的磁盘空间!此时,向128G SSD里拷贝这100万个小文件时的速度竟然只有56.9KB/s(图5),而256GB SSD的拷贝速度也仅有80.3KB/s(图6)。你没有看错,但是就是KB/s而不是MB/s!

07

06

06

05

看到这里,相信你已经了解海量小文件的威力了,而4K性能的强弱将直接影响到对大量小文件读写时的效率。虽然说测试3的环境太过极端,但测试2的情景相信大家都会经常面对吧?

先对齐还是后对齐

很多SSD用户都会遇到类似的尴尬:新买SSD装完系统后才发现忘记4K对齐了,此时我们只剩下两种选择:

1.为了避免已有数据影响性能而重新格式化硬盘再进行4K对齐;

2.在不影响已有数据的前提下使用软件进行后续4K对齐的补救(图7)。

08

使用分区助手选中为4K对齐的硬盘再点击左侧的“分区对齐”选项即可

那么,这两种先后的4K对齐顺序对SSD的4K性能有无影响呢?答案是没有影响。无论SSD内部有无数据,只要进行了4K对齐即可发挥出100%的4K性能。因此,我们大可不必担心网上盛传类似“SSD必须在干净时4K对齐效果最好”的传言了。

小结

SSD的4K对齐是个老生常谈的话题,而本文的目的则是在理论结合实际的情况下,尽可能表现出4K性能对SSD的影响所在。