Mat*_*ewD 5 unicode unixodbc pyodbc freetds sql-server-2008
我无法从MSSQL服务器获取有效的字符串到python.我相信在某处存在编码不匹配.我相信它是在ODBC层和python之间,因为我能够在tsql和isql中获得可读的结果.
pyodbc期望什么字符编码?我需要在链中进行哪些更改才能使其正常工作?
具体例子
这是一个简化的python脚本作为示例:
#!/usr/bin/env python
import pyodbc
dsn = 'yourdb'
user = 'import'
password = 'get0lddata'
database = 'YourDb'
def get_cursor():
con_string = 'DSN=%s;UID=%s;PWD=%s;DATABASE=%s;' % (dsn, user, password, database)
conn = pyodbc.connect(con_string)
return conn.cursor()
if __name__ == '__main__':
c = get_cursor()
c.execute("select id, name from recipe where id = 4140567")
row = c.fetchone()
if row:
print row
Run Code Online (Sandbox Code Playgroud)
该脚本的输出是:
(Decimal('4140567'), u'\U0072006f\U006e0061\U00650067')
Run Code Online (Sandbox Code Playgroud)
或者,如果脚本的最后一行更改为:
print "{0}, '{1}'".format(row.id, row.name)
Run Code Online (Sandbox Code Playgroud)
然后结果是:
Traceback (most recent call last):
File "/home/mdenson/projects/test.py", line 20, in <module>
print "{0}, '{1}'".format(row.id, row.name)
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)
使用tsql执行相同查询的脚本:
root@luke:~# tsql -S cmw -U import -P get0lddata
locale is "C"
locale charset is "ANSI_X3.4-1968"
using default charset "UTF-8"
1> select id, name from recipe where id = 4140567
2> go
id name
4140567 orange2
(1 row affected)
Run Code Online (Sandbox Code Playgroud)
以及在isql中:
root@luke:~# isql -v yourdb import get0lddata
SQL> select id, name from recipe where id = 4140567
+----------------------+--------------------------+
| id | name |
+----------------------+--------------------------+
| 4140567 | orange2 |
+----------------------+--------------------------+
SQLRowCount returns 1
1 rows fetched
Run Code Online (Sandbox Code Playgroud)
所以我早上一直在这个工作,看起来又高又低,并没有弄清楚什么是错.
细节
以下是版本详细信息:
pyodbc 2.1.7-1(来自ubuntu包)和3.0.7-beta06(从源代码编译)
服务器是带有SQL Server Express 2008 R2的XP
以下是客户端上一些配置文件的内容.
/etc/freetds/freetds.conf
[global]
tds version = 8.0
text size = 64512
[cmw]
host = 192.168.90.104
port = 1433
tds version = 8.0
client charset = UTF-8
Run Code Online (Sandbox Code Playgroud)
/etc/odbcinst.ini
[FreeTDS]
Description = TDS driver (Sybase/MS SQL)
Driver = /usr/lib/x86_64-linux-gnu/odbc/libtdsodbc.so
Setup = /usr/lib/x86_64-linux-gnu/odbc/libtdsS.so
CPTimeout =
CPReuse =
FileUsage = 1
Run Code Online (Sandbox Code Playgroud)
/etc/odbc.ini
[yourdb]
Driver = FreeTDS
Description = ODBC connection via FreeTDS
Trace = No
Servername = cmw
Database = YourDB
Charset = UTF-8
Run Code Online (Sandbox Code Playgroud)
因此,经过继续工作,我现在正在将 unicode 字符输入 python 中。不幸的是,我偶然发现的解决方案就像亲吻你的表弟一样令人满意。
我通过安装 python3 和 python3-dev 包然后用 python3 重建 pyodbc 解决了这个问题。
现在我已经完成了这个工作,即使我仍然使用 python 2.7 运行它们,我的脚本也可以工作了。
所以我不知道这样做修复了什么,但它现在可以工作,我可以继续我开始的项目。