阿里云 OSS-HDFS 服务(JindoFS 服务)快照使用说明§
(从 JindoData 4.0.0 开始支持)
阿里云 OSS-HDFS 服务(JindoFS 服务)是OSS新推出新的存储空间类型,兼容HDFS接口, 支持目录以及目录层级,通过Jindo SDK 4.x 可以兼容访问 OSS-HDFS 服务。关于用户如何创建和使用 OSS-HDFS 服务的基本功能,请参考链接。
OSS-HDFS 服务的快照功能在使用上与 HDFS 的快照功能完全兼容。本文主要介绍在 OSS-HDFS 服务中使用快照功能的一些常见操作。
为了方便下面命令的介绍,我们假设oss://oss-dfs-test
这个Bucket已经开启 OSS-HDFS 服务。下面所有的例子都会针对这个 Bucket 进行操作。
开启快照功能§
假设我们先在oss://oss-dfs-test
下创建一个目录TestSnapshot。
hdfs dfs -mkdir oss://oss-dfs-test.<Endpoint>/TestSnapshot
默认情况下,目录的快照功能是关闭的。需要开启和关闭目录的快照功能,需要使用 jindofs 命令行工具 。具体的开启快照的格式为
./jindofs admin -allowSnapshot -dlsUri <path>
如果我们要开启前面创建的 TestSnapshot 的快照功能。可以输入如下的命令:
./jindofs admin -allowSnapshot -dlsUri oss://oss-dfs-test.<Endpoint>/TestSnapshot
创建快照§
在一个目录开启快照功能后,可以通过 HDFS 的 shell 命令。具体格式为:
hdfs dfs -createSnapshot <path> [<snapshotName>]
例如上面例子的中的 TestSnapshot,我们进行了一些目录和文件的操作。然后可以创建一个快照对此刻的快照的状态进行保存。假设我们命名快照名为 S1。
#下面这些为创建测试的文件和目录
hdfs dfs -mkdir oss://oss-dfs-test.<Endpoint>/TestSnapshot/dir1
hdfs dfs -mkdir oss://oss-dfs-test.<Endpoint>/TestSnapshot/dir2
hdfs dfs -touchz oss://oss-dfs-test.<Endpoint>/TestSnapshot/dir1/file1
hdfs dfs -touchz oss://oss-dfs-test.<Endpoint>/TestSnapshot/dir3/file2
#通过HDFS的shell命令行工具执行以下命令创建快照,并将快照命名为S1:
hdfs dfs -createSnapshot oss://oss-dfs-test.<Endpoint>/TestSnapshot S1
访问快照中的目录和文件§
快照目录的格式§
为了区别于文件系统现有的目录和文件,访问快照中的文件和目录需要添加快照的信息来指出自己要访问的快照名。对于一个开启了快照的目录,我们要访问它下面某个快照的目录和文件,我们可以下面的格式来访问:
<snapshotRoot>/.snapshot/<snapshotName>/<actual subPath>
其中 snapshotRoot 为快照的根目录,也就是开启快照命令中dlsUri参数制定的路径。snapshotName是之前创建的快照名。制定了快照名之后,之后的路径就是原来快照根目录(snapshotRoot)下要访问的路径。
比如上面的例子 TestSnapshot 目录,我们如果要列出oss://oss-dfs-test.<Endpoint>/TestSnapshot/dir1
下的文件。可以用常规的 ls 命令。
hdfs dfs -ls oss://oss-dfs-test.<Endpoint>/TestSnapshot/dir1
由于我们在 TestSnapshot 下开启的快照,并创建了快照 S1。我们也可以通过下面的路径来列出快照 S1 下的目录和文件。
hdfs dfs -ls oss://oss-dfs-test.<Endpoint>/TestSnapshot/.snapshot/S1/dir1
其中 .snapshot/S1
就是用来表明目录的快照的信息。
利用快照恢复数据§
快照的一个常见作用是进行数据备份和恢复。利用快照可以对重要数据进行恢复,防止用户错误性的操作。只要根据上面讲的快照目录的格式就可以访问到只读副本中的数据,然后可以根据需求进行恢复操作。
在上面的文件系统中,假设在后面的某次任务中误删了oss://oss-dfs-test.<Endpoint>/TestSnapshot/dir1
hdfs dfs -rm -r oss://oss-dfs-test.<Endpoint>/TestSnapshot/dir1
由于我们已经对 /TestSnapshot 添加了快照 S1。我们可以用如下的命令恢复数据。
hdfs dfs -cp oss://oss-dfs-test.<Endpoint>/TestSnapshot/.snapshot/S1/dir1 oss://oss-dfs-test.<Endpoint>/TestSnapshot
这个时候我们再访问 /TestSnapshot/dir1,就会发现原来的误删的文件夹和文件都恢复了。
hdfs dfs -ls oss://oss-dfs-test.<Endpoint>/TestSnapshot/dir1
重命名快照§
对于一个已经创建的快照,可以通过下面的命令进行重命名
hdfs dfs -renameSnapshot <path> <oldName> <newName>
例如上面例子的中的 TestSnapshot 的快照 S1,我们可以用下面的命令进行重命名为 S100
hdfs dfs -renameSnapshot oss://oss-dfs-test.<Endpoint>/TestSnapshot S1 S100
删除快照§
当不需要快照的时候,可以运行下面的命令来删除制定的快照。
hdfs dfs -deleteSnapshot <path> <snapshotName>
在上面的例子中,我们可以运行下面的命令来删除之前创建并重命名的快照 S100
hdfs dfs -deleteSnapshot oss://oss-dfs-test.<Endpoint>/TestSnapshot S100
关闭快照功能§
当我们需要关闭目录的快照功能的时候,我们同样需要使用 JindoSDK 的 shell 命令行。具体的关闭快照的格式为
./jindofs admin -disallowSnapshot -dlsUri <path>
查看两个快照之间的差异§
可以通过下面当命令查看两个快照之间的差异
./jindofs admin -snapshotDiff -dlsUri <uri> -fromSnapshot <fromSnapshot> -toSnapshot <toSnapshot>
注意事项§
如果需要关闭目录的快照功能,首先要确保该目录下的所有快照已经被删除。删除快照的命令可以参考前面的删除快照命令。如果该目录下还存在快照,关闭快照功能会报错。 对于我们前面的例子 TestSnapshot,假设我们已经删除了所有快照。我们可以用下面的命令来关闭目录的快照功能。
./jindofs admin -disallowSnapshot -dlsUri oss://oss-dfs-test.<Endpoint>/TestSnapshot