云计算存储

在学习云计算的存储产品时的一些总结

传统单机存储

说到存储,最直观的理解就是物理机上的磁盘设备,通过 SATA 或其他点对点的接口实现与物理机的连接。在接入操作系统后,磁盘首先会被格式化并分区,操作系统会将存储空间整体进行分级,从大到小分为磁面、磁道和扇区,扇区作为磁盘最基本的存储单元,一般为 512Byte。

同时,操作系统会在分区建立文件系统,此时会设定虚拟的存储块(Block)大小,一般是扇区大小的整数倍,例如 Linux ext3 文件系统的 Block Size 缺省值是 4KB,文件系统还定义了操作系统访问物理磁盘扇区的寻址方式。

数据文件在磁盘中是被打撒存储的。数据会被分为众多的 采用 顺序存储或链式存储 的方式,存储在同一个物理磁盘中。因为磁盘与物理机的连接大多为串行 I/O,因此文件块的读取过程也是串行的。

传统单机存储的特点:块存储、串行读写、单机直连不可共享、数据的读写与文件系统相关

块存储

分布式块存储产品主要依托磁盘阵列,通过对多块物理磁盘的虚拟化,将逻辑盘“伪装成物理盘”映射给主机操作系统,提供上层使用。顾名思义,文件的读写寻址过程依然会被划分成众多的 Block,但由于虚拟化技术,Block 会分布于多块物理磁盘中,可以实现并行读写,提高效率。

同时,还可以与主机组网使用(例如 SAN 架构组网)实现共享存储,但是由于块存储方式与文件系统高度耦合,因此在文件共享功能上有使用限制(例如 Windows 采用 FAT32/NTFS 文件系统,Linux 采用 ext3/ext4,Linux 无法对 NTFS 进行写入操作)。

此外,SAN 架构组网的成本比较高(需要配置光模块),因此通常不会使用块存储进行文件共享。

块存储的特点:并行读写速度快、可以直接映射、有限制的共享、数据的读写与文件系统相关

文件存储

云计算文件存储系统是一套软硬件解决方案,通常情况下是网络内独立的服务器,通过搭载 FTP 或 NAS 服务实现,文件的读写过程与业务方的文件系统无关联,但由于文件传输依托以太网,相比块存储的磁盘阵列,读写速度较低。也不适用于数据库等需要磁盘直接映射的场景。

文件存储的特点:高效的文件共享、低成本、速度低、无直接映射关系

对象存储

对象存储综合了二者的优点:利用分布式存储实现并行读取提高读取速度;以独立的 Web 服务实现对接,与文件系统解耦。

该方式将存储对象的数据分为元数据和内容数据,内容数据被打散存储在分布式服务器中,元数据则记录内容数据的索引地址由专门的元数据服务器存储管理。在数据读写时,分布式的内容服务器可以实现并行处理,有效提高了文件的读写速度。

对象存储的特点:高效的文件共享、速度快