自动备份 PostgreSQL 数据库的最佳方法是什么?

Ran*_*ell 25 postgresql backup database-administration

我发现每周都必须备份数据库很乏味。而且我还认为每周备份应该变成每日备份。如果我必须这样做,我不想手动完成。每天自动备份 PostgreSQL 数据库的最佳方法是什么?

cas*_*cas 48

就像您对任何其他可以自动化的重复性任务所做的一样 - 您编写一个脚本来进行备份,然后设置一个 cron 作业来运行它。

像下面这样的脚本,例如:

(注意:它必须以 postgres 用户或任何其他具有相同权限的用户身份运行)

#! /bin/bash

# backup-postgresql.sh
# by Craig Sanders <cas@taz.net.au>
# This script is public domain.  feel free to use or modify
# as you like.

DUMPALL='/usr/bin/pg_dumpall'
PGDUMP='/usr/bin/pg_dump'
PSQL='/usr/bin/psql'

# directory to save backups in, must be rwx by postgres user
BASE_DIR='/var/backups/postgres'
YMD=$(date "+%Y-%m-%d")
DIR="$BASE_DIR/$YMD"
mkdir -p "$DIR"
cd "$DIR"

# get list of databases in system , exclude the tempate dbs
DBS=( $($PSQL --list --tuples-only |
          awk '!/template[01]/ && $1 != "|" {print $1}') )

# first dump entire postgres database, including pg_shadow etc.
$DUMPALL --column-inserts | gzip -9 > "$DIR/db.out.gz"

# next dump globals (roles and tablespaces) only
$DUMPALL --globals-only | gzip -9 > "$DIR/globals.gz"

# now loop through each individual database and backup the
# schema and data separately
for database in "${DBS[@]}" ; do
    SCHEMA="$DIR/$database.schema.gz"
    DATA="$DIR/$database.data.gz"
    INSERTS="$DIR/$database.inserts.gz"

    # export data from postgres databases to plain text:

    # dump schema
    $PGDUMP --create --clean --schema-only "$database" |
        gzip -9 > "$SCHEMA"

    # dump data
    $PGDUMP --disable-triggers --data-only "$database" |
        gzip -9 > "$DATA"

    # dump data as column inserts for a last resort backup
    $PGDUMP --disable-triggers --data-only --column-inserts \
        "$database" | gzip -9 > "$INSERTS"

done

# delete backup files older than 30 days
echo deleting old backup files:
find "$BASE_DIR/" -mindepth 1 -type d -mtime +30 -print0 |
    xargs -0r rm -rfv
Run Code Online (Sandbox Code Playgroud)

编辑:
pg_dumpall -D不推荐使用开关(第 27 行),现在替换为--column-inserts
https://wiki.postgresql.org/wiki/Deprecated_Features

  • +1 获得出色的脚本 (11认同)
  • 很棒的脚本,但我发现我需要调整正则表达式,使其不包含管道和空行作为数据库名称。`DBS=$($PSQL -l -t | egrep -v 'template[01]' | awk '{print $1}' | egrep -v '^\|' | egrep -v '^$')` (2认同)

Nic*_*son 8

pg_dump dbname | gzip > filename.gz
Run Code Online (Sandbox Code Playgroud)

重新加载

createdb dbname
gunzip -c filename.gz | psql dbname
Run Code Online (Sandbox Code Playgroud)

或者

cat filename.gz | gunzip | psql dbname
Run Code Online (Sandbox Code Playgroud)

使用split. 该split命令允许您将输出拆分为底层文件系统可接受的大小。例如,要制作 1 兆字节的块:

pg_dump dbname | split -b 1m - filename
Run Code Online (Sandbox Code Playgroud)

重新加载

createdb dbname
cat filename* | psql dbname
Run Code Online (Sandbox Code Playgroud)

你可以把其中一个扔进去 /etc/cron.hourly

来自http://www.postgresql.org/docs/8.1/interactive/backup.html#BACKUP-DUMP-ALL