在声明中指定时如何自动验证字符串/Unicode 列最大长度?

Dam*_*ent 6 python validation sqlalchemy maxlength

SQLAlchemy 允许在声明列时指定长度String

foo = Column(String(10))
Run Code Online (Sandbox Code Playgroud)

如 SQL 中所示:

foo VARCHAR(10)
Run Code Online (Sandbox Code Playgroud)

我知道某些 DBMS 在表中创建行时使用此长度值来分配内存。但有些 DBMS(如 SQLite)不关心它,仅为了与 SQL 标准兼容而接受此语法。但某些 DBMS(如 MySQL)要求指定它。

就我个人而言,我喜欢指定某些文本数据的最大长度,因为它有助于设计 UI,因为您知道显示它所需的区域。

此外,我认为这将使我的应用程序行为在不同的 DBMS 中更加一致。

因此,我想通过检查其长度与声明的长度(当声明长度时)来验证插入时 String/Unicode 列的值。

检查约束

第一个解决方案是使用检查约束

from sqlalchemy import CheckConstraint, Column, Integer, String, create_engine
from sqlalchemy.exc import IntegrityError
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker

engine = create_engine("sqlite:///:memory:", echo=True)
Base = declarative_base(bind=engine)
Session = sessionmaker(bind=engine)


class Foo(Base):
    __tablename__ = "Foo"

    id = Column(Integer, primary_key=True)
    bar = Column(String(10), CheckConstraint("LENGTH(bar) < 10"))


Base.metadata.create_all()

if __name__ == "__main__":
    session = Session()
    session.add(Foo(bar="a" * 20))

    try:
        session.commit()
    except IntegrityError as e:
        print(f"Failed with: {e.orig}")
Run Code Online (Sandbox Code Playgroud)

它可以工作,但 SQL约束表达式不是由 SQLAlchemy 生成的。因此,如果 DBMS 需要不同的语法,则可能需要一些自定义生成。

验证器

我还尝试使用 SQLAlchemy验证器

class Foo(Base):
    __tablename__ = "Foo"

    id = Column(Integer, primary_key=True)
    bar = Column(String(10))

    @validates("bar")
    def check_bar_length(self, key, value):
        column_type = getattr(type(self), key).expression.type
        max_length = column_type.length

        if len(value) > max_length:
            raise ValueError(
                f"Value '{value}' for column '{key}' "
                f"exceed maximum length of '{max_length}'"
            )

        return value
Run Code Online (Sandbox Code Playgroud)
try:
    Foo(bar="a" * 20)
except ValueError as e:
    print(f"Failed with: {e}")
Run Code Online (Sandbox Code Playgroud)

现在,最大长度是从声明的长度推断出来的。

检查是在实体创建时完成的,而不是在提交时完成的。我不知道这是否会成为一个问题。

定制型

上面显示的两种解决方案都需要对每一列应用验证。我正在寻找一种解决方案来自动检查具有声明长度的 String/Unicode 列。

使用自定义类型可能是解决方案。但它看起来像是一个丑陋的黑客,因为自定义类型不是为了数据验证而是为了数据转换。

那么,您是否考虑另一个解决方案,也许是我不知道的 SQLAlchemy 功能,这将帮助我将检查自动添加到指定Stringa 的所有列?length

Dam*_*ent 2

我找到了一个似乎适合我的需求的解决方案。但我认为添加约束的方式有点hacky。

它涉及使用:

实体声明

该实体照常声明,无需指定任何约束:

from sqlalchemy import Column, Integer, LargeBinary, String, Unicode, 

class Foo(Entity):
    __tablename__ = "Foo"

    id = Column(Integer, primary_key=True)
    string_without_length = Column(String())
    string_with_length = Column(String(10))
    unicode_with_length = Column(Unicode(20))
    binary = Column(LargeBinary(256))
Run Code Online (Sandbox Code Playgroud)

约束附加

在检测类之前将约束附加到列:

from sqlalchemy import CheckConstraint, func, String
from sqlalchemy.event import listen_for
from sqlalchemy.orm import mapper

@listens_for(mapper, "instrument_class")
def add_string_length_constraint(mapper, cls):
    table = cls.__table__

    for column in table.columns:
        if isinstance(column.type, String):
            length = column.type.length

            if length is not None:
                CheckConstraint(
                    func.length(column) <= length,
                    table=column,
                    _autoattach=False,
                )
Run Code Online (Sandbox Code Playgroud)

生成的 DDL 语句 (SQLite)

CREATE TABLE "Foo" (
    id INTEGER NOT NULL, 
    string_without_length VARCHAR, 
    string_with_length VARCHAR(10) CHECK (length(string_with_length) <= 10), 
    unicode_with_length VARCHAR(20) CHECK (length(unicode_with_length) <= 20), 
    binary BLOB, 
    PRIMARY KEY (id)
)
Run Code Online (Sandbox Code Playgroud)
  • String没有长度的列不受影响,
  • String并且Unicode具有长度的列添加了 CHECK 约束,
  • 其他接受length参数的列(如 LargeBinary)不受影响。

实施细节

@listens_for(mapper, "instrument_class")
Run Code Online (Sandbox Code Playgroud)

instrument_class当创建了检测类的映射器但未完全初始化时,会发生该事件。它可以在您的基本声明类(使用 创建declarative_base())上或直接在slqalchemy.orm.mapper类上侦听。

if isinstance(column.type, String):
Run Code Online (Sandbox Code Playgroud)

只有String(和子类,如Unicode)列...

if length is not None:
Run Code Online (Sandbox Code Playgroud)

...其length设置被考虑。

CheckConstraint(
    func.length(column) <= length,
    table=column,
    _autoattach=False,
)
Run Code Online (Sandbox Code Playgroud)

该约束是使用 SQLAlchemy 表达式生成的。

最后,黑客部分

创建约束时,SQLAlchemy 会自动将其附加到表(我认为它会检测约束所涉及的列)。

由于我希望将其生成为列定义的一部分,因此我使用 禁用此自动附加_autoattach=False,然后使用 指定列table=column

如果您不关心它,请忽略这些论点:

CheckConstraint(func.length(column) <= length)
Run Code Online (Sandbox Code Playgroud)

生成的 DDL 语句将是:

CREATE TABLE "Foo" (
    id INTEGER NOT NULL, 
    string_without_length VARCHAR, 
    string_with_length VARCHAR(10), 
    unicode_with_length VARCHAR(20), 
    binary BLOB, 
    PRIMARY KEY (id), 
    CHECK (length(string_with_length) <= 10), 
    CHECK (length(unicode_with_length) <= 20)
)
Run Code Online (Sandbox Code Playgroud)