磁带在数据存储业务中仍扮演重要角色

发布时间:2023-11-02 09:12:22
来源: 《商业观察》
作者:王治山
阅读量: 13091

《商业观察》记者王治山  北京报道

在一次软件更新过程中,一个偶发错误清除了 Gmail 信箱中的多个存储副本后,谷歌转向了自身的 备份磁带,成功完成了数据恢复任务。谷歌公司表示, 该事件影响了大约 3 000 万的 Gmail 用户。

在一般人的印象里,磁带备份应该早就过时了, 但事实上现在仍旧有许多企业持续在使用着磁带库产 品,谷歌就是其中之一。在这次事件中,这些备份磁 带对于 Gmail 用户来说,是无价的存在,他们收件箱 中的邮件,在一次软件更新时凭空消失了,而谷歌公 司正是通过自身的磁带备份,完成了对数据的恢复。

“我知道大部分人关心的是:如果我们在多个数 据中心都保存有数据的多个副本,这样的事情怎么会 发生呢?”工程和站点安全业务副总裁写道:“是的, 在一些罕见的情况下,软件 bug 会影响到数据的多个 备份,这就是目前发生的状况,一些邮件的副本被删除了。 在过去的 30 个小时中,我们一直在努力工作,为受此问题 影响的人们找回数据。为了保护用户的数据不会受到这些 异常漏洞的影响,我们还将其备份到了磁带之上。因为磁 带是可以离线保存的,所以它们不会受到软件 bug 的影响。 当然,从磁带中恢复数据也不是几毫秒就可以完成的任务, 但我很庆幸,最终,用户的数据并没有出现丢失的现象。”

磁带在数据备份上的优势

今天,我们正处于数据存储和管理革命的风口浪尖。 虽然企业希望通过优化数据管理来实现快速检索、远程协 作和最终的货币化,以推动更为深远的商业价值,但在此 之前,他们需要努力解决海量数据增长和遗留系统复杂性 所带来的固有挑战。目前企业往往会将高达 80% 的数据, 存储在错误的存储层上,因此,如何通过在最合适的存储 层上,对数据进行长期有效的存储和保护,是实现更为细 化的数据控制与提升 IT 效率的关键步骤。因此,为活跃与 非活跃数据,分别选择正确的存储解决方案,必须通过权 衡每种方案的性价比、性能、可访问性和保护能力来做出 决定。

尽管业内存在着一些过时的看法,但当涉及到存储非 活跃数据时,磁带技术在满足标准方面是一个狠角色。磁 带在很长的一段时间内,都已经被证明是备份和存档场景中的成本领导者,而且这一点暂时看不到会被改变的迹象。 随着每一代 LTO 磁带容量的显著提高,所对应的每 GB 磁 带存储成本一直保持着下降的态势,这意味着,即便是在 当今数据增长速度经常超过预算增长速度的环境之中,用 户也完全可以利用磁带的优势,完成期望的备份和归档任 务。将磁带技术作为整体数据备份和归档存储策略的主要 原因如下。

第一,磁带比云的价格更低。在决定存储解决方案时, 最重要的因素之一就是总体拥有成本。磁带的总体拥有成 本是完全可预测的,其中最大的支出就是初期购买磁带库 设备的费用。那么,磁带技术与当今市场上一些基于云的 归档技术相比,在这方面的表现如何呢 ? 实际情况是,对 于长期使用的场景而言,所有的本地存储都比云存储更划 算。云计算最大的成本优势,是按月收取运营费用,这与 购买磁带硬件所需的高额前期投资相比,似乎显得获得成 本是非常低的。

全面的成本分析,是评估整个解决方案的关键之处。 数据需要保存多长时间,以及随着时间的推移,数据量的 增长曲线等。当用户数据量很大且保留期较长时,云端存 储的成本很快就会增加。此外,云端的数据存储本身并不 昂贵,但在移动和访问数据的时候 , 成本会比较高昂。

第二,带独有的容量线路图。当我们谈及大规模的数 据量时,磁带的经济效益会变得非常明显。由于大多数的数字资产是由非活跃文件组成的,通过磁盘存储这些数据 的成本会很高,而磁带设备被视为是可以近乎无限扩容的、 性价比极高的大型非结构化数据存储库。

此外,磁盘驱动器已经达到了最大的容量极限,每个 驱动器提供 99 平方英寸的可记录空间。为了获得更大的存 储容量,磁盘制造商被迫创造出了新的记录方法(叠瓦、 加热、充氦),但这种容量极限的问题依然存在。

作为一种替代方案,LTO(Linear Tape-Open)是一种 适应性、扩展性极佳的行业标准开放磁带格式,对于解决 日益增长的数据量以及数据保护等层面的需求,有着巨大 的帮助。LTO 可实现安全的、可靠的、长期的数据归档存储, 成本大大低于磁盘、闪存或云,特别是考虑到检索、电源 和冷却等费用因素,其已成为了当今企业存储基础架构的 重要组成部分。

最新的 LTO-9 磁带容量已超过其前身 LTO-8 容量的 50%,达到了 18TB 的原始容量。而根据最新的 LTO 路线图 预测,单盘 LTO-10 磁带可实现 36TB 的原始容量; 而 LTO-11 与 12,则分别可达到 72TB 和 144TB 的容量,这表明用户将从磁带存储的每 GB 最低成 本中受益更多。尽管数据集正在不断地增长,但 磁带技术的进化,始终可以让终端用户要么保持 类似的占用空间,要么通过升级到新一代磁带来 缩小占用空间。

第三,磁带无与伦比的使用寿命和耐用性。 硬盘驱动器的传统寿命为三 ~ 五年,由于硬盘的 不可预测性,裸磁盘驱动器的使用时间可能更短, 如果它们被存储在任意类型的数据监控系统之外, 数据甚至可能在终端用户不知情的情况下,发生 无法访问的情况。而如果储存环境得当,磁带介质可以使用 30 年之久。基于磁带的存储系统,可 比传统的基于磁盘的存储系统,以及大多数现代 化的存储介质提供更高的耐久性。此外,磁带可 以导出并运输到世界上的任何地点,进行安全保 存或灾难恢复。

根据磁带的容量大小和组织的业务目标,磁 带可以成为补充磁盘、对象存储或云存储等其他 存储办法的有效补充,以实现更经济、更易于管 理且更安全的存储策略。

第四,磁带可以进行更为先进的数据检索。 在数据检索速度,以及查找和读取多个文件的能 力方面,磁带已经取得了显著的技术进步。海量 数字资产的备份和归档是一项艰巨的任务,因此, 为高性能计算、科学研究、媒体和娱乐、云存储、教育、 医疗保健、金融和传统 IT 等涉及大量数据的行业场景部署 磁带解决方案,不仅是最可靠也是最快的解决方案。磁带 可以以非常快的速度传输数据,甚至超越磁盘,同时磁带 还具有高度的可扩展性,可以通过扩展框架和无缝安装实 现的磁带库升级,可以有效提高磁带设备的性能。

例 如, 一 台 24 驱 动 器 的 磁 带 库, 每 小 时 可 以 写 入 60TB 的数据,而就云存储来说,其在归档速度的控制和灵 活性方面存在限制。数据下载的速度完全取决于企业自身 的带宽。以每秒 1GB 的带宽,将 60TB 的数据归档到云端 需要 6 天的时间,如果是更典型的每秒 250MB 的传输速度, 则需要大约 25 天的时间将数据传输到云端。同时,从云端 回收和恢复数据的时间,也可能是一个漫长的过程。

第五,磁带能够防止网络攻击。大多数磁带通常只会 被保存在磁带库槽位或需要手动访问的存储架中,这意味 着只有当磁带被装载到驱动器上时,它们才会被联机。磁带的离线特性,已经成为了应对网络犯罪的数据保护策略 中的关键组成部分,它可以防止网络犯罪攻击组织的备份、 归档或其他数据。当没有网络连接或其他连接到磁带的途 径时,存储在磁带上的文件无法被黑客攻击、加密或删除, 这意味着企业不必为任何“被绑架”的数据支付赎金。

此外,新一代磁带可以在不需要数据迁移的情况下进 行购买。新磁带可以简单地放入一个新的磁带库分区之中, 然后将所有新的数据都写入到该分区;任何需要恢复的旧 数据都可以通过旧驱动器访问。在备份环境中,旧的驱动 器和介质可随着时间逐渐过期,无需迁移;在归档环境中, 迁移有时并不是必需的,即便需要,在其他软件和硬件的 帮助下,迁移工作也会变得容易得多。

因此,鉴于磁带技术的诸多优势及其不断的进步,现 在是时候更新一下过时的观念了。越来越多的企业,正在 寻求将数据作为经济资产来利用,稳健、有效的数据存储 能力是不可或缺的一环。而作为一种灵活、可靠、高性能、 安全兼具高性价比的长期数据存储解决方案,磁带可被视 为是帮助组织实现这一目标的坚实基础。

磁带在绿色环保方面的重要作用 

可持续性一直是几十年来影响企业和社会政策议程的 最热门话题。在传统意义上与绿色认证似乎关联不大的磁 带供应商们看来,云计算产业依旧存在着一个巨大缺口, 并正在努力对其进行修补。

当前针对“冷数据”场景的新型超大规模磁带存储系 统,其技术可以比基于磁盘的归档系统节约近 80% 的成本。 此外,业界公认的一点在于,磁带不仅比磁盘的价格更低, 而且在数据中心中需要消耗的电力和冷却成本也少得多。

通过由 IDC 发布的白皮书《以可持续存 储策略——加速绿色数据中心的发展》的内容 显示,如果使用磁带技术,到 2030 年,全球 数据中心可以减少 43% 以上即 6.64 亿吨的二 氧化碳排放,这一数字相当于 1.44 亿辆乘用 车一年的温室气体排放量,或者相当于 8 000 万户家庭一年的能源使用量。白皮书中提出 了提高电力使用效率的许多理由,其中就包 括了通过更有效的存储政策,从而达到减排 效果。

到目前为止,磁带仍是世界上性价比较 高的存储介质(按每 GB 成本计算)。磁带存 储本身只需要极少的电力来保证运行;并且 由于不会增加环境温度,所以数据中心在冷 却方面的电力投入也可以得到有效的控制。此外,基于优 秀的误码率和超过 30 年的使用寿命,磁带完全可以胜任长 期可靠的数据存储任务。

考虑到数据量的飞速增长,企业应该考虑是否需要将 所有这些“活跃的”数据始终保持一种易于访问的状态, 或者是否可以将部分数据离线存储在一个专门的冷数据存 储环境之中。而磁带介质,作为“近线存储”或“活动归档” 的存储层,可以让用户无需将这些数据保存在需要持续的 电源和冷却支出上来维持操作硬盘驱动器。

这一切都可以用数字来说明:在具体场景中,存储在 企业存储系统中 80% 的数据可被判定为“归档数据”,而只 需要将其中 57% 的数据迁移到磁带上,到 2030 年,数据 中心每年就可以减少 43.7% 的二氧化碳排放量。

IDC 分析人士表示:“未使用过磁带的企业,应该认真 考虑此类产品的特性,其在降低成本,改善碳足迹,并使 数据可以从任何故障或攻击中恢复方面,能够提供最大化 的帮助。即使是云原生解决方案提供商也应当认识到,高 容量、自动化的磁带系统,可以在核心和云端环境,均发 挥非常重要的作用。”

磁带与云存储的共存共生

与云存储或其他网络存储设备不同,存储在磁带上的 数据,不容易受到网络恶意软件或勒索软件的影响。在现 代化的存储环境中,用户对存储介质的选择并不是非此即 彼的逻辑关系,主要还是取决于具体的使用环境,因为磁 带和云是可以共存的。

多年以来,磁带主要是被用于数据的异地备份和长期 保存。备份应用程序将数据复制到磁带后,用户会将磁带从库中导出,并运送到异地的保险库中,以减轻局部灾难 可能造成的负面影响。

而公有云存储也是一种很好的非本地存储解决方案, 特别是对于灾难恢复来说。通过将备份文件以对象的形式 存储在公有云端之后,用户可以很容易地在云端完成数据 恢复。此外,用户还可以更快地启动虚拟化应用程序,从 而在发生灾难时,更快地为用户恢复服务。

网络攻击事情发生的频率远远超过我们的想象,2021 年 3 月,美国保险公司之一 CNA 金融遭遇了勒索软件攻击, 攻击者要求支付 4 000 万美元赎金,以恢复 CNA 对其文件 的访问权限;5 月,位于阿拉巴马州的 Colonial Pipeline 受 到网络安全攻击,据证实,由于 Darkside 勒索软件团伙发 起的网络攻击,该公司旗下的大部分燃料管道都被迫关闭; 6 月,REvil 勒索软件团伙攻击了基于 Kaseya 云端的 MSP  platfor 软件供应商 Kaseya,并宣称约 60 家 Kaseya 客户和 1 500 家企业受到了勒索软件攻击的影响。

恶意软件的攻击,将是持久、复杂、昂贵的。事实上, 根据 Cybersecurity Ventures 的数据,至 2021 年,全球范围 内网络犯罪造成的损失,预计达到了每年 6 万亿美元。所以, 防范勒索软件和其他形式的恶意软件攻击的防御办法,一 直都是数据安全体系中的重要组成部分。

日益增长的网络威胁推动了对数据管理最佳实践的全 新需求。“3-2-1-1”数据保护成为了最佳保护方案,3 份 数据,保存在 2 种类型的存储介质上(如磁盘和磁带),1 份用于异地容灾,1 份用于离线保存。当使用磁带作为防范 勒索软件策略的一部分时,有许多最佳实践可供考虑。例如, 企业可以调整自身的备份方案,更频繁地将备份副本复制 到磁带介质上,以最大限度地降低数据丢失或停机可能造 成的损失。

磁带是离线存储的最佳选择。与云存储或本地 磁盘不同,磁带是可以真正实现离线的一种介质。 除读写操作外,存储在 LTO 磁带上的数据或备份 文件都可以做到与网络“绝缘”,甚至可以被存储 在磁带库设备之中,做到“离线不离库”,处于一 个完全安全的、受保护的环境中。因此,存储在磁 带上的数据,不会像那些被保存在云存储或其他网 络附加存储设备中的数据那样,受到网络恶意软件 或勒索软件攻势的影响。

在这种情况下,用户每天的备份,都会进行装 箱并运输到指定的仓库。这最大限度地减少了人工 对磁带的处理,并消除了对第三方离线存储服务的 需要,每年可以节省数千至数万美元的预算,当然, 这取决于磁带的具体数量。

在这种方式下,磁带完全可以满足离线存储解决方案 的要求。通过将备份复制到磁带上,并把磁带作为“安全的、 离线的数据拷贝”,保存在现场的磁带库设备中,可以有效 防止恶意软件的侵袭;同时,由于磁带被保存在了设备之中, 对于磁带的处理也更为方便了,还可以降低介质被人为损 坏的风险。此外,该策略还具备非常优异的成本效益表现。 因为磁带,一直被视为是存储成本最低的介质。

目前,磁带的离线存储属性已经被更多的用户所采用, 成为了一种最有效、成本最低的方法,来保护数据免受勒 索软件和其他恶意软件的攻击。

(责任编辑:于昊阳)

商业观察网-《商业观察》杂志社官网版权与免责声明:

① 凡本网注明“来源:商业观察网或《商业观察》杂志”的所有作品,版权均属于商业观察网,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:商业观察网”。违反上述声明者,本网将追究其相关法律责任。

② 凡本网注明“来源:XXX(非商业观察网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

③ 如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。