Archive & Backup

提起归档和备份两个词,给人感觉上是相同的概念,就是对指定文件的一个copy而已。archive和backup感觉是相似的,但是他们有着明显的不同de。

archive

An archive is a collection of data moved to repository for backup,to keep separate for compliance reasons or for moving off primary storage media.
档案是一个被移到仓库备份的数据的集合。变为档案这一动作,我们叫归档,归档需要将进行归档数据移出主存媒介,或者其它方式将归档数据与现网在用数据1合理地隔离开来
It can include a simple list of files or files organized under a directory or catalog structure(depending on how a particular program supports archiving)
_档案可以包括一个简单的文件列表,或者通过目录或者catalog structure组织文件(依据特特定程序支持怎样归档)
Web and File Transfer Protocol sites that provide downloadable software programs sometimes refer to the list of downloadable files as an archive or archives.
_有些提供下载程序的网页和文件站点,通常将可供下载的程序列表作为归档。

Backup vs. archive

While data backup and archiving are similar, the have distinct difference.
Backups are copies of data stored for the purpose of recovery in the case of corruption.
These copies are typically created using replication or mirroring and are updated as files change.
It is short-term storage that needs to perform well enough to restore data quickly.
Backups are usually stored as blocks to facilitate the recovery of large amounts of data at one time.

Archived data is not a copy,but rather inactive an rarely altered data that needs to be retained for long periods of time.
相比备份的源数据,归档的源数据相对来说是不平凡极少再改动的数据,已经形成了一个稳定的版本的数据。这种数据需要长期保持。
Performance is less critical in archive storage.
档案对存储媒介性能不是要求那么重要。比如i/o,检索查询速度等。
Rather than stored in blocks,archived data is usually stored as a file or object that can be stored with metadata attached so that granular access to data is possible.
相比通过块存储,归档数据通常打包为一个文件或者能够附加上metadata数据的存储对象中,这样可以通过已颗粒方式从归档中访问数据。

Archive storage options

Archive storage typically needs to be able to store large amounts of data,for long periods of time at a low cost.
The following storage options are commonly used for archived data:

  • Tape 磁带 花费很小,但是访问效率实在太低了相比其它文档存储选择。由于这个特点,所以适合很长时间的档案存储,几乎不需要被访问。
  • Disk 磁盘(Hard disk drives) 电力和冷却是硬盘存储的一个花销。
  • Cloud 云存档是最受欢迎归档方式,因为它可以容易的扩展和移除在硬件、电力、冷却上的花销。然而,对于大的数据中心持续增长的归档数据,云存储的开销也会随着增长。一些主要的云存储提供商提供的云存储平台都是低性能低花销的。
  • Object 对象 是一个有效的归档存储方式,因为它有能力存储大量的metadata2,metadata是轻松访问数据至关重要的部分。Object storage 也是低花销,可以存储大量数据的。

很多情况下many cases,归档和备份软件是被整合在一起的。some software also offers the ability to cache segments of archived data on disk ,while the majority is stored on object or tape to improve response times when data is accessed.
有些软件也提供缓存归档数据部分在磁盘上,主要部分还是存储在对象或者磁带中,为的是提高快速响应数据访问请求。


  1. 相对于归档数据,就是最新版本在用的数据。

  2. 用于描述其它data的data。metadata是data的基础信息总结。例如:author,date created,date modified,file size 等,通过metadata能够快速地过滤定位需要定位的document。metadata除了用于文档,还用于images,videos,spreadsheets and web pages.web pages对metadata的使用非常常见。metadata添加可以可以手动也可以程序自动。

Archive & Backup 概念的更多相关文章

  1. 备份MySQL数据库

    备份MySQL数据库脚本: #!/bin/bash # description: MySQL buckup shell script # author: lmj # web site: http:// ...

  2. Spring Boot 启动原理分析

    https://yq.aliyun.com/articles/6056 转 在spring boot里,很吸引人的一个特性是可以直接把应用打包成为一个jar/war,然后这个jar/war是可以直接启 ...

  3. [转帖]rsync简介

    rsync用法详细解释 https://www.cnblogs.com/noxy/p/8986164.html 之前一直使用 scp 现在发现这个命令更好一些. 提要 熟悉 rsync 的功能及其特点 ...

  4. rsync用法详细解释

    提要 熟悉 rsync 的功能及其特点 掌握 rsync 语法及常用选项的功能 掌握 rsync 命令的三种基本使用方法 掌握如何筛选 rsync 的传输目标 掌握使用 rsync 进行镜像和增量备份 ...

  5. Actifio如何保护和管理Oracle-带外篇

    引言 本文提供CDS带外环境下相关配置,保护和恢复Oracle的所需步骤. 目的是提供Oracle数据库配置前的详细说明,Actifio环境下发现和配置Oracle数据库,执行还原和恢复,以及配置Or ...

  6. Linux samba服务搭建

    实验准备: 准备两台机器,server0(172.25.0.11)和deskop0(172.25.0.12),要求在server0上实现samba共享,在desktop0上访问共享. 1.允许mark ...

  7. [daily][samba] smbclient使用

    用的也不是太明白,反正凑合用吧. 在用之前,只得到了两个信息,1:ip 192.168.30.9.    2:可以免密登录. 1.  用这个命令看一看,主要是找到这个目录:Anonymous ┬─[t ...

  8. MySQL数据库自动备份

    1.vi /home/wangcn/auto_log.sh#!/bin/bash #Shell Command For Backup MySQL Database Everyday Automatic ...

  9. Linux访问Windows共享目录的方法——smbclient

    之前写过Ubuntu访问Windows共享目录,里面主要介绍如何在GUI上访问windows共享目录. 本文侧重于整理通过命令行访问的方法. 先确保smbclient.ubuntu下可以直接运行下面命 ...

随机推荐

  1. Python连接MySQL数据库之pymysql模块使用

    安装PyMySQL pip install pymysql PyMySQL介绍 PyMySQL是在python3.x版本中用于连接MySQL服务器的一个库,2中则使用mysqldb. Django中也 ...

  2. ASP.NET WebApi OWIN 实现 OAuth 2.0(自定义获取 Token)

    相关文章:ASP.NET WebApi OWIN 实现 OAuth 2.0 之前的项目实现,Token 放在请求头的 Headers 里面,类似于这样: Accept: application/jso ...

  3. CoreProfiler升级到.NetStandard 2.0

    致所有感兴趣的朋友: CoreProfiler和相应的Sample项目cross-app-profiling-demo都已经升级到.NetStandrard 2.0和.NetCore 2.0. 有任何 ...

  4. S-CMS企建v3二次SQL注入

    S-CMS企建v3二次SQL注入 0x01 前言 继上一篇的S-CMS漏洞再来一波!首发T00ls 0x2 目录 Sql注入二次SQL注入 0x03 Sql注入 漏洞文件:\scms\bbs\bbs. ...

  5. MyEclipse设置Console输出到文件

    Java程序默认输出为Console,如果要想将Console输出结果保存到文件中,则需要做如下配置: 在JAVA程序上右键--> Run As --> Run Configuration ...

  6. [Swift]LeetCode40. 组合总和 II | Combination Sum II

    Given a collection of candidate numbers (candidates) and a target number (target), find all unique c ...

  7. [Swift]LeetCode327. 区间和的个数 | Count of Range Sum

    Given an integer array nums, return the number of range sums that lie in [lower, upper] inclusive.Ra ...

  8. kubernetes系列之ConfigMap使用方式

    作用理解 核心用途就是容器和配置的分离解耦. 如启用一个mysql容器,mysql容器重要的文件有两部分,一部分为存储数据文件,一部分为配置文件my.cnf,存储数据可以用持久存储实现和容器的分离解耦 ...

  9. 6.Git基础-远程仓库的使用

    远程仓库是指托管在因特网或其他网络中的你的项目的版本库.比如你在GitHub中托管的代码库,就是远程仓库. 1.查看远程仓库 --  git remote  git remote 查看已经配置的远程仓 ...

  10. Vue轻松入门,一起学起来!

    我们创建一个项目,这个项目我们细说Vue. 一.如何在项目中添加模块 我们通过npm 进行 安装 模块. 首先我们通过cmd.exe cd进入你的项目根目录,必须存在package.json文件,安装 ...