我在重排数据表方面有一些操作,到目前为止效果很好。
在一个超过 50000 行的表格中,我有文本列,其中文本应该仅为数字。
现在我想将它转换为整数列。
所以:
ALTER TABLE mytable ALTER COLUMN mycolumn TYPE integer;
Run Code Online (Sandbox Code Playgroud)
这会产生错误 42804:*datatype_mismatch*
通过阅读文档,我找到了解决方案:
ALTER TABLE mytable ALTER COLUMN mycolumn TYPE integer USING (TRIM(mycolumn)::integer);
Run Code Online (Sandbox Code Playgroud)
但我知道数据在数字顺序方面可能不正确,因为这“掩盖”了错误,并且列有可能被编辑(手动)。毕竟,也许只是添加了尾随空格或进行了其他一些小的编辑。
我有数据备份。
我如何找到给定列的哪个确切单元格包含错误以及哪个值不能通过一些适合从 pgadmin 使用的方便查询转换为 int?
如果不是太复杂,请查询。
扩展@dystroy 的回答,这个查询应该咳出任何有问题的行的精确值:
CREATE OR REPLACE FUNCTION convert_to_integer(v_input text)
RETURNS INTEGER AS $$
BEGIN
BEGIN
RETURN v_input::INTEGER;
EXCEPTION WHEN OTHERS THEN
RAISE EXCEPTION 'Invalid integer value: "%". Returning NULL.', v_input;
RETURN NULL;
END;
END;
$$ LANGUAGE plpgsql;
Run Code Online (Sandbox Code Playgroud)
原答案:
如果以下有效:
ALTER TABLE mytable
ALTER COLUMN mycolumn TYPE integer USING (TRIM(mycolumn)::integer);
Run Code Online (Sandbox Code Playgroud)
那么你应该可以运行以下命令来定位垃圾:
select mycolumn from mytable
where mycolumn::text <> (TRIM(mycolumn)::integer)::text;
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1739 次 |
| 最近记录: |