Hei*_*ein 5 python sql parsing extract
我想直接从 SQL 语句中提取结果表的列名:
query = """
select
sales.order_id as id,
p.product_name,
sum(p.price) as sales_volume
from sales
right join products as p
on sales.product_id=p.product_id
group by id, p.product_name;
"""
column_names = parse_sql(query)
# column_names:
# ['id', 'product_name', 'sales_volume']
Run Code Online (Sandbox Code Playgroud)
知道要做什么parse_sql()吗?生成的函数应该能够识别别名并删除表别名/标识符(例如“sales.”或“p.”)。
提前致谢!
我已经使用库sqlparse做了类似的事情。基本上,这个库接受您的 SQL 查询并将其标记化。完成后,您可以搜索选择查询令牌并解析底层令牌。在代码中,读起来就像
import sqlparse
def find_selected_columns(query) -> list[str]:
tokens = sqlparse.parse(query)[0].tokens
found_select = False
for token in tokens:
if found_select:
if isinstance(token, sqlparse.sql.IdentifierList):
return [
col.value.split(" ")[-1].strip("`").rpartition('.')[-1]
for col in token.tokens
if isinstance(col, sqlparse.sql.Identifier)
]
else:
found_select = token.match(sqlparse.tokens.Keyword.DML, ["select", "SELECT"])
raise Exception("Could not find a select statement. Weired query :)")
Run Code Online (Sandbox Code Playgroud)
此代码还应该适用于使用公共表表达式的查询,即它只返回最终的选择列。根据您使用的 SQL 方言和引号字符,您可能需要调整这一行 col.value.split(" ")[-1].strip("`").rpartition('.')[- 1]