存储需要达到的要求:
高效存储、读取数据、并发工作、数据安全、校验机制(能够使用少数数据保存多量数据)、存储空间管理(有足够的能力管理硬件)
存储分类:
时间/部署角度:传统的集中式存储、分布式存储
服务类型角度:块存储、文件存储、对象存储
对存储性能测试:一般是将文件几乎快填满的情况下,再尝试存储,看系统对存储空间的管理能力
MDS-元数据服务:数据索引
块存储
特点:高性能、低延迟、高效的随机读写能力、共享场景较少、单一应用对单一存储
应用实例:数据库、电信、票据
工作:
1,把盘可以做成RAID组
2,在RAID组基础上做物理卷
3,在物理卷基础上做卷组
4,将空间映射给主机
块存储主要和机器交互,块存储提供的是一个裸空间,如果用户想使用的话,需要格式化。
三种连接方式:DAS直连、SAN-FC网络、IPSAN-以太网
块存储结构:机头/控制器(双控制器架构)、扩展柜
提供的软件服务:Thin Provisioning Snapshot Clone
文件存储
用户与计算机交互的主要方式
特点:高并发、数据共享、低成本、高性能计算
擅长数据共享(NFS协议、CIFS协议)
成本低,可以使用以太网承载
核心:文件系统(典型的Linux系统完全由文件搭建)
物理空间(地址空间)
文件系统(名字空间):文件夹、文件(文件名、大小、权限、时间戳、位置、格式)
各种类型的文件:.doc .exe .mp4 .dll .txt
搭建一个商业级的文件系统,研发周期长、困难、语义比较多
对象存储
对象是OSS存储数据的基本单元,也被称为OSS的文件。对象由元信息、用户数据和文件名组成。对象由存储空间内部唯一的Key来标识。对象元信息是一组键值对,表示了对象的一些属性,比如最后修改时间、大小等信息,同时也存储一些自定义的信息。
特点:读多写少(更多可能被读取,很少修改)、高并发
应用实例:大数据、公有云、网盘(百度网盘)、媒体(腾讯视频)、医疗影像(PACS)、冷数据的归档
语义比较少:put(上传)、get(下载)、delete(删除)等
可以在文件基础之上建立对象存储
可以使用键值对方式存储,每个对象都有自己的ID,所以没有层级关系,对于海量文件,与文件系统相比有显著的优势
访问方式:http协议(URL(URI),使用这种标志符可以定位到具体位置,天生适合互联网)
缺点:必须一次性的写入对象,无法修改对象,对象存储不能很好地与传统数据库搭配使用,所以编写对象时间比较缓慢,不是那么简单。并且不支持随机读取和写入。
块存储、文件存储和对象存储区别
块存储:专业(基本都是匹配为专用的环境、系统、应用),不适合分布式(虽扩展性强,但是性能下降,网络延迟,与自身定位违背),一般局域网内使用
文件存储:通用(处处都可以用到,但是做到商业级研发周期长、语义多、比较复杂),一般局域网内使用
对象存储:海量(访问方式和结构比较简单,非文件存储那种树形结构而是是一种扁平结构,查询有显著的优势),http的访问方式非常适用互联网的环境,超高并发(比如网上买票),需要适应公网环境(不稳定性、比如断点续传 重复数据删除、数据压缩)
从数据结构角度来看三种存储方式:块存储(数组)、文件存储(二叉树)、对象存储(哈希表)
MinIO-多云对象存储
特点:
- 多云:多云对象存储允许企业在任何云上构建与AWS S3兼容的数据基础设施,可以在任何地方运行,从边缘到公共云,无需更改代码
- 开源:数以万计的客户和社区成员为其提供安全性、弹性、持久性和卓越运营。
- 活动复制:提供存储桶级粒度,而且支持同步和接近同步复制
- 兼容性:不同环境,都能展示框架,从不同的公有云、私有云和边缘中提供相同的功能。
- 加密:使用最高级别加密
- 安全性:保护数据不被意外或者有益删除
- 提供版本控制保护数据,但是会使得存储桶大小变大
- 具有企业数据生命周期管理工具,包括版本控制、对象锁定和各种衍生组件。
- 提供个性化的数据管理界面
- 提供日志,监控操作和数据
- 目前仍然是最快的对象存储
个人总结:
显然对象存储非常适用于多读少写的大数据、数据集,支持海量数据,对网络要求低,语义简单,访问方式是基于http协议访问,适合互联网,语义简单。