python postgres游标时间戳问题

ada*_*dam 5 python postgresql cherrypy

我对事务数据库有点新,并且遇到了我想要了解的问题.

我创建了一个简单的演示,其中数据库连接存储在cherrypy创建的5个线程中.我有一个方法,显示存储在数据库中的时间戳表和一个添加新的时间戳记记录的按钮.

该表有2个字段,一个用于python传递的datetime.datetime.now()时间戳,另一个用于数据库时间戳设置为默认NOW().


CREATE TABLE test (given_time timestamp,
                   default_time timestamp DEFAULT NOW());
Run Code Online (Sandbox Code Playgroud)

我有2个与数据库交互的方法.第一个将创建一个新游标,插入一个新的given_timestamp,提交游标,然后返回索引页面.第二种方法将创建一个新游标,选择10个最新时间戳并将其返回给调用者.


import sys
import datetime
import psycopg2
import cherrypy

def connect(thread_index): 
    # Create a connection and store it in the current thread 
    cherrypy.thread_data.db = psycopg2.connect('dbname=timestamps')

# Tell CherryPy to call "connect" for each thread, when it starts up
cherrypy.engine.subscribe('start_thread', connect)

class Root:
    @cherrypy.expose
    def index(self): 
        html = []
        html.append("<html><body>")

        html.append("<table border=1><thead>")
        html.append("<tr><td>Given Time</td><td>Default Time</td></tr>")
        html.append("</thead><tbody>")

        for given, default in self.get_timestamps():
            html.append("<tr><td>%s<td>%s" % (given, default))

        html.append("</tbody>")
        html.append("</table>")

        html.append("<form action='add_timestamp' method='post'>")
        html.append("<input type='submit' value='Add Timestamp'/>")
        html.append("</form>")

        html.append("</body></html>")
        return "\n".join(html)

    @cherrypy.expose
    def add_timestamp(self):
        c = cherrypy.thread_data.db.cursor()
        now = datetime.datetime.now()
        c.execute("insert into test (given_time) values ('%s')" % now)
        c.connection.commit()
        c.close()
        raise cherrypy.HTTPRedirect('/')

    def get_timestamps(self):
        c = cherrypy.thread_data.db.cursor()
        c.execute("select * from test order by given_time desc limit 10")
        records = c.fetchall()
        c.close()
        return records

if __name__ == '__main__':

    cherrypy.config.update({'server.socket_host': '0.0.0.0',
                            'server.socket_port': 8081,
                            'server.thread_pool': 5,
                            'tools.log_headers.on': False,
                            })

    cherrypy.quickstart(Root())
Run Code Online (Sandbox Code Playgroud)

我希望given_time和default_time时间戳只相隔几微秒.但是我得到了一些奇怪的行为.如果我每隔几秒钟添加一次时间戳,则default_time与given_time相差不到几微秒,但通常比之前的 given_time减去几微秒.

Given Time                  Default Time
2009-03-18 09:31:30.725017  2009-03-18 09:31:25.218871
2009-03-18 09:31:25.198022  2009-03-18 09:31:17.642010
2009-03-18 09:31:17.622439  2009-03-18 09:31:08.266720
2009-03-18 09:31:08.246084  2009-03-18 09:31:01.970120
2009-03-18 09:31:01.950780  2009-03-18 09:30:53.571090
2009-03-18 09:30:53.550952  2009-03-18 09:30:47.260795
2009-03-18 09:30:47.239150  2009-03-18 09:30:41.177318
2009-03-18 09:30:41.151950  2009-03-18 09:30:36.005037
2009-03-18 09:30:35.983541  2009-03-18 09:30:31.666679
2009-03-18 09:30:31.649717  2009-03-18 09:30:28.319693

然而,如果我每分钟添加一个新的时间戳,则given_time和default_time都只是按预期的几微秒关闭.但是,在提交第6个时间戳(线程数+ 1)之后,default_time与第一个given_time时间戳相差几微秒.

Given Time                  Default Time
2009-03-18 09:38:15.906788  2009-03-18 09:33:58.839075
2009-03-18 09:37:19.520227  2009-03-18 09:37:19.520293
2009-03-18 09:36:04.744987  2009-03-18 09:36:04.745039
2009-03-18 09:35:05.958962  2009-03-18 09:35:05.959053
2009-03-18 09:34:10.961227  2009-03-18 09:34:10.961298
2009-03-18 09:33:58.822138  2009-03-18 09:33:55.423485

即使我在每次使用后显式关闭游标,看起来前一个游标仍然被重用.如果我在完成光标并每次创建一个新光标后关闭光标,那怎么可能呢?有人可以解释一下这里发生了什么吗?

接近答案:

我已经将一个cursor.connection.commit()添加到了get_timestamps方法,现在它为我提供了带有时间戳的准确数据.任何人都可以解释为什么我需要调用cursor.connection.commit()当我所做的只是一个选择?我猜每次我得到一个游标,一个事务就开始了(或者继续它提交的现有事务单元).有没有更好的方法来做到这一点,或者每次我得到一个光标时,无论我对该光标做什么,我都会坚持提交?

kqu*_*inn 2

为了解决您最近的编辑提出的问题:

在 PostgreSQL中NOW()不是当前时间,而是当前事务开始时的时间。Psycopg2 可能会隐式地为您启动一个事务,并且由于该事务永远不会关闭(通过提交或其他方式),因此时间戳会“卡住”并变得过时。

可能的修复:

  • 经常提交(如果你只做 SELECT 就很愚蠢)
  • 设置 Psycopg2 使用不同的行为来自动创建交易(可能很难正确执行,并且影响应用程序的其他部分)
  • 使用不同的时间戳函数,例如statement_timestamp()(不符合 SQL 标准,但对于这种情况来说是完美的)

手册第 9.9.4 节中,强调添加:

PostgreSQL 提供了许多返回与当前日期和时间相关的值的函数。这些 SQL 标准函数都根据当前事务的开始时间返回值:

  • CURRENT_DATE
  • CURRENT_TIME
  • CURRENT_TIMESTAMP
  • CURRENT_TIME(precision)
  • CURRENT_TIMESTAMP(precision)
  • LOCALTIME LOCALTIMESTAMP
  • LOCALTIME(precision)
  • LOCALTIMESTAMP(precision)

CURRENT_TIMECURRENT_TIMESTAMP 传递带有时区的值; LOCALTIMELOCALTIMESTAMP 交付无时区的价值。

CURRENT_TIMECURRENT_TIMESTAMPLOCALTIMELOCALTIMESTAMP可以选择指定一个精度参数,这会导致结果四舍五入到秒字段中的小数位数。如果没有精度参数,结果将以完全可用的精度给出。

...

由于这些函数返回当前事务的开始时间,因此它们的值在事务期间不会改变。这被认为是一个功能:目的是允许单个事务具有一致的“当前”时间概念,以便同一事务中的多个修改具有相同的时间戳。

注意:其他数据库系统可能会更频繁地提高这些值。

PostgreSQL 还提供了返回当前语句的开始时间以及调用该函数时的实际当前时间的函数。非 SQL 标准时间函数的完整列表是:

  • now()
  • transaction_timestamp()
  • statement_timestamp()
  • clock_timestamp()
  • timeofday()

now()是传统的 PostgreSQL,相当于CURRENT_TIMESTAMP. transaction_timestamp()同样相当于CURRENT_TIMESTAMP,但命名是为了清楚地反映它返回的内容。statement_timestamp() 返回当前语句的开始时间(更具体地说,是从客户端收到最新命令消息的时间)。 statement_timestamp()transaction_timestamp()在事务的第一个命令期间返回相同的值,但在后续命令期间可能会有所不同。 clock_timestamp()返回实际的当前时间,因此即使在单个 SQL 命令内,其值也会发生变化。timeofday()是一个历史 PostgreSQL 函数。与 一样 clock_timestamp(),它返回实际的当前时间,但作为格式化文本字符串而不是带有时区值的时间戳。