分享:

我们正在产生多少数据?它们都储存在哪里?

2021-07-13 16:06 中国航空报 张乃欣

远古人类在洞穴壁画中储存信息,目前已知最古老的壁画有4万多年历史。语言和文字随着人类的进化出现,帮助人类以各种书面形式存储详细信息;在公元一世纪左右,造纸术在中国诞生。最古老的印刷书籍出现于公元600年至公元900年之间的中国。一千多年来,书籍一直是信息存储的主要来源。人类在过去的150年里取得的技术进步比在之前2000年里取得的还要多。数字电子技术的发明可以说是人类史上最重要的发展成就之一。

自1947年发明晶体管和1956年发明集成微芯片以来,我们的社会经历了一次转变。仅仅50多年的时间里,我们在计算能力、无线技术、互联网、人工智能,以及显示技术、移动通信、交通、遗传、医学和太空探索方面都取得了前所未有的进步。最重要的是,数字数据存储的引入改变了我们生产、操作和存储信息的方式。这一转变发生在1996年。在当时,相比起书面存储,数字存储有更低的成本和更高的效益。

数字数据存储技术非常多样,其中最重要的有磁存储器(硬盘、磁带)、光盘(CD、DVD、蓝光)和半导体存储器(SSD、闪存)。每种类型的存储器都各自适用于特定的用途。半导体存储器是便携式电子产品的首选,光盘存储主要用于电影、软件和游戏,而磁数据存储仍然是个人计算机、数据服务器等大容量信息存储的主导技术。

所有数字数据存储技术的工作原理都是相同的。信息可以存储在任何包含两种不同且可切换的物理状态的材料中。在二进制代码中,数字信息以1和0的形式存储,也称为比特。8比特构成1字节。每个物理状态分配一个逻辑0或1。这些物理状态越小,存储设备中可以容纳的比特就越多。今天,数字比特的宽度大约为10至30纳米(十亿分之一米)。这些设备都非常复杂,因为如果想要它们在这种规模上存储信息,需要在原子级别上对材料进行控制。

大数据

数字信息已经渗透到我们生活和社会的方方面面,以至于近些年信息生产量的增长似乎势不可挡。在地球上,我们每天都会产生5亿条推文、2940亿封电子邮件、400万GB的Facebook数据、650亿条WhatsApp消息和72万个小时的YouTube新视频。

2018年,全世界创建、捕获、复制和消耗的数据总量为33泽字节(ZB),相当于33万亿GB。2020年,这一数字增长到59ZB,预计到2025年将达到令人难以置信的175ZB。1泽字节是8,000,000,000,000,000,000,000比特。

为了让这些数字更直观,我们假设每一个比特都是一枚1英镑的硬币,大约3毫米(0.1英寸)厚。由一摞硬币组成的1ZB将有2550光年高,这是地球到最近的恒星系半人马座α距离的600倍。目前,我们每年产生的数据量是这个数字的59倍,复合增长率估计在61%左右。

数据存储

大部分数字信息存储在三种位置里。首先是终端的全球集合,包括所有物联网设备、个人电脑、智能手机和所有其他信息存储设备。第二是边缘位置,包括如手机发射塔和机构服务器的基础设施,以及如大学、政府办公室、银行和工厂的服务处。第三,存储大部分数据的核心位置——传统数据服务器和云数据中心。

世界上大约有600个超大规模的数据中心,每个超大规模数据中心拥有超过5000台服务器。其中约39%在美国,而中国、日本、英国、德国和澳大利亚的超大规模数据中心数量总和约占总数的30%。世界上最大的数据服务器是位于中国呼和浩特的中国电信数据中心(占地1070万平方英尺)和位于内华达州里诺市附近的The Citadel数据中心(占地720万平方英尺,用电量815兆瓦)。

为满足日益增长的数字数据存储需求,每两年就会有约100个新的超大规模数据中心建成。最近的研究调查了这种趋势,结论显示,若年增长率为50%,那么大约150年后,数字比特的数量将达到一个不可思议的数值,超过地球上所有的原子数量的总和。大约110年后,维持这种数字化生产所需的能源将超过现在的全球能源消耗总量。

责任编辑:实习编辑