Archive & Backup

提起归档和备份两个词,给人感觉上是相同的概念,就是对指定文件的一个copy而已。archive和backup感觉是相似的,但是他们有着明显的不同de。

archive

An archive is a collection of data moved to repository for backup,to keep separate for compliance reasons or for moving off primary storage media.
档案是一个被移到仓库备份的数据的集合。变为档案这一动作,我们叫归档,归档需要将进行归档数据移出主存媒介,或者其它方式将归档数据与现网在用数据1合理地隔离开来
It can include a simple list of files or files organized under a directory or catalog structure(depending on how a particular program supports archiving)
_档案可以包括一个简单的文件列表,或者通过目录或者catalog structure组织文件(依据特特定程序支持怎样归档)
Web and File Transfer Protocol sites that provide downloadable software programs sometimes refer to the list of downloadable files as an archive or archives.
_有些提供下载程序的网页和文件站点,通常将可供下载的程序列表作为归档。

Backup vs. archive

While data backup and archiving are similar, the have distinct difference.
Backups are copies of data stored for the purpose of recovery in the case of corruption.
These copies are typically created using replication or mirroring and are updated as files change.
It is short-term storage that needs to perform well enough to restore data quickly.
Backups are usually stored as blocks to facilitate the recovery of large amounts of data at one time.

Archived data is not a copy,but rather inactive an rarely altered data that needs to be retained for long periods of time.
相比备份的源数据,归档的源数据相对来说是不平凡极少再改动的数据,已经形成了一个稳定的版本的数据。这种数据需要长期保持。
Performance is less critical in archive storage.
档案对存储媒介性能不是要求那么重要。比如i/o,检索查询速度等。
Rather than stored in blocks,archived data is usually stored as a file or object that can be stored with metadata attached so that granular access to data is possible.
相比通过块存储,归档数据通常打包为一个文件或者能够附加上metadata数据的存储对象中,这样可以通过已颗粒方式从归档中访问数据。

Archive storage options

Archive storage typically needs to be able to store large amounts of data,for long periods of time at a low cost.
The following storage options are commonly used for archived data:

  • Tape 磁带 花费很小,但是访问效率实在太低了相比其它文档存储选择。由于这个特点,所以适合很长时间的档案存储,几乎不需要被访问。
  • Disk 磁盘(Hard disk drives) 电力和冷却是硬盘存储的一个花销。
  • Cloud 云存档是最受欢迎归档方式,因为它可以容易的扩展和移除在硬件、电力、冷却上的花销。然而,对于大的数据中心持续增长的归档数据,云存储的开销也会随着增长。一些主要的云存储提供商提供的云存储平台都是低性能低花销的。
  • Object 对象 是一个有效的归档存储方式,因为它有能力存储大量的metadata2,metadata是轻松访问数据至关重要的部分。Object storage 也是低花销,可以存储大量数据的。

很多情况下many cases,归档和备份软件是被整合在一起的。some software also offers the ability to cache segments of archived data on disk ,while the majority is stored on object or tape to improve response times when data is accessed.
有些软件也提供缓存归档数据部分在磁盘上,主要部分还是存储在对象或者磁带中,为的是提高快速响应数据访问请求。


  1. 相对于归档数据,就是最新版本在用的数据。

  2. 用于描述其它data的data。metadata是data的基础信息总结。例如:author,date created,date modified,file size 等,通过metadata能够快速地过滤定位需要定位的document。metadata除了用于文档,还用于images,videos,spreadsheets and web pages.web pages对metadata的使用非常常见。metadata添加可以可以手动也可以程序自动。

Archive & Backup 概念的更多相关文章

  1. 备份MySQL数据库

    备份MySQL数据库脚本: #!/bin/bash # description: MySQL buckup shell script # author: lmj # web site: http:// ...

  2. Spring Boot 启动原理分析

    https://yq.aliyun.com/articles/6056 转 在spring boot里,很吸引人的一个特性是可以直接把应用打包成为一个jar/war,然后这个jar/war是可以直接启 ...

  3. [转帖]rsync简介

    rsync用法详细解释 https://www.cnblogs.com/noxy/p/8986164.html 之前一直使用 scp 现在发现这个命令更好一些. 提要 熟悉 rsync 的功能及其特点 ...

  4. rsync用法详细解释

    提要 熟悉 rsync 的功能及其特点 掌握 rsync 语法及常用选项的功能 掌握 rsync 命令的三种基本使用方法 掌握如何筛选 rsync 的传输目标 掌握使用 rsync 进行镜像和增量备份 ...

  5. Actifio如何保护和管理Oracle-带外篇

    引言 本文提供CDS带外环境下相关配置,保护和恢复Oracle的所需步骤. 目的是提供Oracle数据库配置前的详细说明,Actifio环境下发现和配置Oracle数据库,执行还原和恢复,以及配置Or ...

  6. Linux samba服务搭建

    实验准备: 准备两台机器,server0(172.25.0.11)和deskop0(172.25.0.12),要求在server0上实现samba共享,在desktop0上访问共享. 1.允许mark ...

  7. [daily][samba] smbclient使用

    用的也不是太明白,反正凑合用吧. 在用之前,只得到了两个信息,1:ip 192.168.30.9.    2:可以免密登录. 1.  用这个命令看一看,主要是找到这个目录:Anonymous ┬─[t ...

  8. MySQL数据库自动备份

    1.vi /home/wangcn/auto_log.sh#!/bin/bash #Shell Command For Backup MySQL Database Everyday Automatic ...

  9. Linux访问Windows共享目录的方法——smbclient

    之前写过Ubuntu访问Windows共享目录,里面主要介绍如何在GUI上访问windows共享目录. 本文侧重于整理通过命令行访问的方法. 先确保smbclient.ubuntu下可以直接运行下面命 ...

随机推荐

  1. node.js Setup Wizard ended prematurely 安装失败

    解决: 1. 按照管理员权限运行. 2.安装时禁用掉node 运行环境中的performance counters 和 ETW,或者可以尝试先禁用performance counters .

  2. 依赖注入[7]: .NET Core DI框架[服务注册]

    包含服务注册信息的IServiceCollection对象最终被用来创建作为DI容器的IServiceProvider对象.服务注册就是创建出现相应的ServiceDescriptor对象并将其添加到 ...

  3. Dubbo工作原理,集群容错,负载均衡

    Remoting:网络通信框架,实现了sync-over-async和request-response消息机制. RPC:一个远程过程调用的抽象,支持负载均衡.容灾和集群功能. Registry:服务 ...

  4. 什么是HTML?HTML5是什么?HTML5有那些优势和特性?

    一.什么是HTML 在了解html5之前,首先要说一下html语言,尽管是更新后的5,但很多的地方还是保留了html的优势. HTML是HyperText Markup Language超级文本标记语 ...

  5. [Swift]LeetCode272. 最近的二分搜索树的值 II $ Closest Binary Search Tree Value II

    Given a non-empty binary search tree and a target value, find k values in the BST that are closest t ...

  6. Java中需要知道的关键字

    Java中有一些或常用,或不常用,但却不得不知关键字,本篇文章将讨论这些关键字的作用. transient transient关键字可能用的不是那么频繁,但却是一个很重要的关键字,它的作用是在对象序列 ...

  7. Python内置函数(27)——hasattr

    英文文档: hasattr(object, name) The arguments are an object and a string. The result is True if the stri ...

  8. Java开发需掌握的常用Linux命令(持续更新)

    linux命令是对Linux系统进行管理的命令.对于Linux系统来说,无论是中央处理器.内存.磁盘驱动器.键盘.鼠标,还是用户等都是文件,Linux系统管理的命令是它正常运行的核心,与之前的DOS命 ...

  9. 从零打卡leetcode之day 2---两数相加

    前言 就是要把leetcode刷完,每天一道题,每天进步一点点. 从零打卡leetcode之day 2 题目描述: 给定两个非空链表来表示两个非负整数.位数按照逆序方式存储, 它们的每个节点只存储单个 ...

  10. 【Java基础】【21IO(字符流)&字符流其他内容&递归】

    21.01_IO流(字符流FileReader) 1.字符流是什么 字符流是可以直接读写字符的IO流 字符流读取字符, 就要先读取到字节数据, 然后转为字符. 如果要写出字符, 需要把字符转为字节再写 ...