如何调试 SQLAlchemy 查询的缓慢启动时间？_python

我正在尝试诊断我的应用程序在执行 SQL Alchemy 查询时花费的时间。 我观察到执行查询和 SQLAlchemy 事务开始之间有 300 毫秒的间隔。 在此时间间隔内，没有日志报告幕后发生的事情。 我有以下代码段，它创建一个新的作用域会话，然后使用该会话按主键查找项目。 此操作大约需要 500 毫秒。

谁能建议我如何加快查找速度？ 开始执行查询所需的 375 毫秒是我真正关心的地方。

函数片段：

def review_item(review_id):
    """Review a specific item."""        
    logger.info('Creating a new DB session')
    session = m.DBSession()
    logger.debug('Session created')

    logger.info('Building query at %s', review_id, datetime.now())
    qry = session.query(m.Result).filter_by(image_id=review_id)
    logger.info('Running query')
    item = qry.one()
    logger.info('Retrieved item %s at %s', item, datetime.now())

    return item

我看到以下日志输出：

2015-10-19 13:51:06,874 INFO  [treachery.views][waitress] Creating a new DB session
2015-10-19 13:51:06,874 DEBUG [treachery.views][waitress] Session created
2015-10-19 13:51:06,875 INFO  [treachery.views][waitress] Building query at 2015-10-19 13:51:06.875089
2015-10-19 13:51:06,875 INFO  [treachery.views][waitress] Running query
2015-10-19 13:51:07,261 INFO  [sqlalchemy.engine.base.Engine][waitress] BEGIN (implicit)
2015-10-19 13:51:07,262 INFO  [sqlalchemy.engine.base.Engine][waitress] SELECT result.image_id AS result_image_id, result.tag_classes AS result_tag_classes, result.tag_probs AS result_tag_probs 
 FROM result 
 WHERE result.image_id = %(image_id_1)s
2015-10-19 13:51:07,262 INFO  [sqlalchemy.engine.base.Engine][waitress] {'image_id_1': u'2015/05/e1f04824d496457cb74b668976b991ef.jpeg'}
2015-10-19 13:51:07,372 DEBUG [sqlalchemy.engine.base.Engine][waitress] Col ('result_image_id', 'result_tag_classes', 'result_tag_probs')
2015-10-19 13:51:07,373 DEBUG [sqlalchemy.engine.base.Engine][waitress] Row (u'2015/05/e1f04824d496457cb74b668976b991ef.jpeg', [u'nobody', u'painting', u'decoration', u'indoors', u'food', u'pattern', u'frame', u'one', u'travel', u'illustration', u'hanging', u'wood', u'background', u'people', u'wall', u'table', u'design', u'exhibition', u'house', u'flower'], [0.989168643951416, 0.975763559341431, 0.96831738948822, 0.952613711357117, 0.945497691631317, 0.941344261169434, 0.932282328605652, 0.928139090538025, 0.926733613014221, 0.912606000900269, 0.883346319198608, 0.875022172927856, 0.871710419654846, 0.865160286426544, 0.86181652545929, 0.821693539619446, 0.810265898704529, 0.798673629760742, 0.796967625617981, 0.789543986320496])
2015-10-19 13:51:07,373 DEBUG [treachery.views][waitress] Retrieved item <treachery.models.Result object at 0x7f82b409a250> at 2015-10-19 13:51:07.373463

当查询开始执行时，观察日志行“运行查询”和“BEGIN（隐式）”日志行之间的长延迟（几乎 400 毫秒）。

SQLAlchemy 延迟连接到数据库，所以如果上面的代码是在应用程序中运行的第一个 SQL 查询，那么它需要创建一个新连接，这对于许多 RDBMS 来说是一个相当慢的操作。

我的猜测是正确的，然后对同一函数的后续调用不应该有 400 毫秒的延迟。

这是的一个讨论了 MySQL 打开新连接缓慢的各种原因。

如何调试 SQLAlchemy 查询的缓慢启动时间？

问题描述

1楼