pdumpfs-rsyncでバックアップ
だいぶ前(id:ke-k:20060118)に、バックアップと更新履歴を取れるスクリプトとして、pdumpfs(http://namazu.org/~satoru/pdumpfs/)をあげましたが、実際にはバックアップを別のマシンで取るようにpdumpfs-rsync(http://tach.arege.net/software/pdumpfs-rsync/)を使っています。で、これについてちょっと気になることが。pdumpfs-rsyncの詳しい仕様については、本家を参照していただくとして、このスクリプトって
- 一旦rsyncでlatest/hogeディレクトリにダウンロード
- pdumpfsのスクリプトを使って2006/01/01/hogeといった日付ごとのディレクトリにコピー
- 前日のデータと同じデータならハードリンクを作成
といった手順でバックアップを取ってますが、必ずlatestと日付ごとのディレクトリに(ハードリンクでない)同じデータが入ってしまうので、最低でもバックアップ対象のデータの2倍容量使って非効率な気がするんですが、どうなんでしょう?
rsyncでlatestにコピーしたあとに、latestから日付ごとのディレクトリに全部ハードリンクしてしまえば、ディスクの使用量もファイルの比較する手間もなくなって幸せになれそうなんですが。ハードリンクだと、rsyncでlatestを更新したときに、日付ごとの方のファイルも書き換わってしまうとか?
まあ、考えてても結論が出そうにないので、スクリプトの後ろの方の
pdumpfs.update_snapshot(src, latest, today)
を
pdumpfs.update_snapshot(src, src, today)
に変えてみました。うまくいっているかどうかはしばらくすればわかることでしょうf(^^;。