秦奕接着说道:“目前主流的存储冗余方案,当属数字线性磁带备份技术。这种磁带运用螺旋扫描记录技术,在磁带纵轴方向平行记录数据。磁带机磁头在磁带高速运转时,以倾斜角度进行数据读写,极大地提升了数据存储密度。”
“凭借大容量特性,数字线性磁带能轻松容纳机场每日运营产生的航班计划、旅客信息、设备状态等海量数据,完成每日全量备份任务。而且,相较于其他存储设备,数字线性磁带单位存储成本较低。”
“不过,相比优势,这项技术的弊端更为突出。”
“虽然数字线性磁带数据存储密度高,但受磁带机读写速度和传输接口带宽限制,机场运行控制中心系统每日产生的数据量极为庞大,全量备份到磁带上,往往需要耗费数小时。”
“随着机场规模不断扩大,客流量航班量都会进一步提升,数据也会相应增加,备份时间还会持续增加。”
“这不仅占用大量时间窗口,还可能影响其他维护任务的正常开展。”
“更麻烦的是,一旦出现数据丢失或损坏的情况,恢复流程极其复杂。工作人员需要在众多磁带中寻找对应的备份磁带,这无疑是大海捞针。”
“找到磁带后,还需借助专门的磁带机读取数据。要是磁带机发生故障,或者磁带受潮、磨损,数据恢复工作将陷入困境,有时甚至需要花费数天时间。”
吴松英听完,眉头拧成了一个疙瘩,问道:“照你这么说,目前还没有成熟便捷的技术可用于存储冗余方案?”
“是的。” 秦奕缓缓说道,“不过我近期对存储冗余有了些新想法,后续打算在原型机测试中尝试一下。”
他所谓的新想法,正是前世在服务器存储领域广泛应用的单机存储冗余方案 —— 磁盘阵列,这是前世 1988 年 david patterson、Randy Katz和Garth Gibson 在计算机存储领域里程碑式论文《A case for Redundant Arrays of Inexpensive disks (RAId)》中提出的方案。
该方案通过将多块廉价磁盘组合成冗余阵列,运用数据冗余和校验技术,大幅提升存储系统的可靠性,即便某一块磁盘出现故障,系统也能借助其他磁盘上的冗余信息恢复数据,确保业务正常运行。
不过这个思路对秦奕这种重生的人来说是很简单直接的,对这个时候的业内人士来说却不是,当下行业思维深受 “高可靠性必须依赖昂贵硬件” 这一观念的束缚,企业级存储严重依赖价格高昂的专用磁盘,廉价磁盘仅被当作个人电脑的配件,在专业存储领域难登大雅之堂。
所以《RAId》这篇论文的创新性,不仅在于提出 “多块磁盘组合实现高可用” 的方案,更在于从根本上颠覆了当时主流的存储设计范式,为后续存储技术的发展奠定了理论基础。后来大数据、云存储等领域的数据冗余方案,基本都借鉴了这篇论文的思想。
“小秦啊。” 吴松英听完秦奕对磁盘阵列的简单介绍,目光中透着审慎,“我知道你向来敢于探索新领域,可专用磁盘的稳定性大家有目共睹。这么多年,各大企业都靠它保障数据安全。你想用廉价磁盘搭建存储阵列,那要怎么保障可靠性?”
秦奕对吴松英的疑问早有预料,不慌不忙地回应:“传统专用磁盘相比廉价磁盘虽说单块容量大,表面上看可靠性更高,但它存在单点故障风险。一旦磁盘损坏,整个系统就会瘫痪,后果不堪设想。”
“磁盘阵列方案通过软件和架构设计,将多块廉价磁盘组合成一个逻辑单元,可以实现数据冗余存储。举个例子,如果我将数据会同时写入两块磁盘,互为镜像。一块磁盘损坏时,另一块能立即顶替工作,确保数据不丢失,业务不中断。”
“镜像存储?”吴松英发现了一个问题,“虽说镜像存储能保障数据安全,可要是两块磁盘数据不一致,该怎么确认哪块硬盘的数据才准确呢?要是恢复了错误数据,那麻烦可就大了。”
秦奕有条不紊地解释道:“为规避镜像存储的问题,我们可以采用三块硬盘搭建存储阵列。”
“其中两块硬盘存储数据,另一块则存放奇偶校验信息。写入数据时,系统会依据特定算法,计算出数据的奇偶校验值,并将其存储在第三块硬盘上。读取数据时,系统不仅会从两块数据硬盘中读取数据,还会借助校验硬盘验证数据的准确性。”
“要是某块数据硬盘出现故障,系统能凭借另一块数据硬盘和校验硬盘上的信息,迅速恢复故障硬盘的数据。这不仅规避了镜像存储数据不一致的问题,还极大提升了数据的可靠性和容错能力。”
“相较传统的专用磁盘存储,这套方案只需投入三块廉价硬盘,就能在保障数据安全的同时,降低成本。”
“除此之外,磁盘阵列在可扩展性上优势显着,当机场的业务进一步发展,存储需求增加时,只需在现有阵列中添加磁盘,就能轻松扩大存储容量,不像专用磁盘,受限于设备规格,扩展难度大、成本也高。”
吴松英原本紧蹙的眉头渐渐松开,脸上的质疑慢慢转为思索。
“行吧。”他说道,“你在原型机测试时,把专用磁盘和磁盘阵列两个方案的存储相关指标都测试一下,对比着看看。”
“没问题。” 秦奕爽快应道,“在硬件层面,除了做好小型机和存储系统的冗余,网络方面同样要设计冗余。我们得在物理网络上铺设不同物理路径的电缆,防止施工时挖断某条电缆,导致网络中断。”
“后续条件允许的话,数据链路层、网络层都要制定冗余方案。至于应用层,主要是给数据库软件做冗余方案……”
吴松英听着秦奕滔滔不绝的讲述,脑袋都有些发懵,连忙打断:“行了,你讲的这些高可用方案,一时半会我也没法完全弄清楚可行性。高可用方面的讨论就先到这儿,你后续整理一个完整的方案出来,我再仔细研究。”
“方案我已经放在资料里了!” 秦奕笑着提醒,“后续您可以抽空仔细看看。”
“是哦。” 吴松英这才反应过来,低头看了看资料目录,发现里面确实有高可用方案这一项。
他翻到对应的内容,浏览了一会儿后说道:“这里面提到的高可用相关指标,你再给我详细解释解释。”