在实际环境中,HDFS集群上的数据可能是不间断的输入,此时如果直接用distcp复制集群的数据可能会导致执行失败或拷贝的一些数据在目标集群上不可用。
可通过在源集群中创建一个快照(snapshot),然后基于快照的数据进行迁移。后续还可基于快照进行增量的更新。