分类
生活点滴 评论型文章

当数据灾难降临时——论数据备份的一些方法和策略

(在苹果系统下,如果文章中的图片不能正常显示,请升级Safari浏览器到最新版本,或者使用Chrome、Firefox浏览器打开。)

最近有联系过我的朋友应该知道,我的电脑在最近出现了硬盘损坏的情况,这直接导致了我的一些项目的进度和写博客文章的进度被推迟,同样也影响了我一些其他方面的使用。我们都知道,一旦硬盘损坏,数据很可能会丢失,所以,我们应当定期备份数据,而且,不能抱着侥幸心理,认为这样的事情不会发生在自己的身上。我曾经也是这样认为的,当硬盘损坏的事情真的发生在自己的身上时,想哭都来不及。对于我们做机器学习的人来说,硬盘损坏,就很可能意味着,我们之前大量的研究工作会付之东流,或者我们辛辛苦苦写的即将发表的论文丢失,导致一些很严重的后果。

我简单说一说硬盘的一些工作原理吧,硬盘就是将我们平时在电脑上所看到的数据,通过一定的物理变化的方式,将其存入硬盘,以永久的保存。不过,这种物理变化,是有寿命的,也就是说,这种变化只能发生固定次数,超过一定次数之后,就会出现一些问题。就机械硬盘来说,我们经常听说“坏道”这两个字,这就是机械硬盘中,某些扇区的磁道,我们无法正常的写入数据,或者读出数据。我的硬盘就出现了无法读取数据的问题,这直接导致了系统无法启动,以及部分文件在打开时,磁头会卡住无法读取文件,导致死机的问题发生。

不过一般来说,硬盘其实是很耐用的,我们正常使用的情况下,硬盘可以支撑好多年。但是由于种种原因,比如硬盘摔坏,大量使用P2P下载,长时间24小时不关机,会使得硬盘的寿命大大减少,从而很快会出现损坏,以及包括电脑被偷在内,都会导致我们数据的丢失。所以如果电脑中存有一些对于我们的生活和工作比较重要的一些文件资料的话,我们应当养成定期备份数据的好习惯,这对于我们来说是很重要的。数据备份,就像养兵千日用兵一时一样,平时我们可能会觉得并没有什么用,一旦我们需要使用到的时候,就会对我们恢复重要或全部的数据,起到很大的作用。

我们在云计算中经常讲,数据存储的安全性,不仅仅是保证数据的私密性,还要保证数据不会发生丢失,一般来说是通过分布式存储来实现的,而且是在多个不同的地方进行分布式存储。一些著名的平台,比如说GitHub就是这样子,如果你的仓库有很多人克隆到本地,就相当于他们用自己的计算机,帮你进行分布式存储,而且GitHub本身就会帮你存储。

不过,GitHub一般仅仅是用来存储代码之类的文件的,并不怎么适合用来像网盘那样子存储,而且网盘类产品,一般情况下,当我们的数据量比较大时,网络的通信会花费我们相当长的时间,几十个GB的文件就已经很难用网盘来存储了,就某度云盘的上传下载速度来说,大概需要一天一夜的时间。对于我们备份数据,最好的方式,就是自己另外购买一块容量足够的移动硬盘。

至于定期备份,我们可以根据自己的需要,每天,或者每三天,一周,两周,一个月,或者半年,将数据完整的备份一次。数据的备份一般分为海量备份和增量备份两种方式。备份周期在一个月以内的,不太适合使用海量备份的方式,因为短期内,一般不会有太多的文件发生改变,这反而会加重移动硬盘的负担,甚至会出现移动硬盘比自己电脑硬盘更早的发生损坏的现象。所以我们通常采用增量备份的方式,第一次备份时,先将所有的数据文件备份一次,以后则每次将有修改的或者新增加和删除的文件备份就好了,就像Git技术一样。但是,Git技术不仅仅是操作有些复杂,不适合非程序员使用,而且有一个问题,他会保存历史版本,而我们备份数据时,一般不关心历史版本,我们只关心备份的数据与我们当前电脑上的数据相同即可,而且保存历史版本的话会导致文件磁盘占用比较大。不过,其实在有些场景下,例如项目代码,我们是需要保存历史版本的,以便回滚。

不论我们是自己编写备份软件,还是使用现成的备份软件,我们应当注意需要满足这几个功能需求:可以进行增量备份,可以直接实现备份数据的备份和恢复,可以在多台设备之间将数据同步更新至最新版本,并且操作方便等。现成的备份软件我就不用多说了,网上一搜,应该不少。

另一方面,我们备份数据时,应当尽量使用机械硬盘,因为机械式硬盘的寿命一般来说会更长,而且只要我们存放得当,硬盘可以持续十几年不会发生损坏,我有一个机械硬盘,用了十几年,到现在仍然没有发生数据丢失,即使这么长时间的使用,已经导致硬盘有一些损坏了,而固态硬盘一旦有一些损坏,数据很可能就全丢了。并且如果有条件的话,尤其是对于数据的容灾性要求很高的情况下,我们的备份数据不要只存一份,而是需要在不同的存储器上存储几份,而且,这些不同的存储器也要存放在不同的地理位置上,以避免一些诸如火灾、水灾、火山喷发和地震等灾害。不过这样的分布式备份,我们往往需要使用互联网来同步传输数据了。

数据无价,它是我们人类智慧的结晶,我们应当使用各种手段来保护好它,数据备份是很重要的。最近很火的一些区块链技术,也应该是一种可以用来进行数据备份的方法,不过,这种技术的细节我并没有了解多少,各位访客们如果感兴趣的话,可以了解一下。

 

版权声明
本博客的文章除特别说明外均为原创,本人版权所有。欢迎转载,转载请注明作者及来源链接,谢谢。
本文地址: https://blog.ailemon.net/2018/07/22/some-methods-and-strategies-need-doing-before-data-disaster-come-down/
All articles are under Attribution-NonCommercial-ShareAlike 4.0

关注“AI柠檬博客”微信公众号,及时获取你最需要的干货。


发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

17 + 18 =

如果您是第一次在本站发布评论,内容将在博主审核后显示,请耐心等待