相关疑难解决方法(0)

Python:向Windows控制台发送一些Utf-8字符串

可能重复:
Python,Unicode和Windows控制台

我从文件中读取了一些字符串,当我尝试在Windows控制台中打印这些utf-8字符串时,我收到错误

UnicodeDecodeError: 'ascii' codec can't decode byte 0xc4 in position 0: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)

我试图用"chcp 65001"将控制台编码设置为utf-8 但是比我得到这个错误消息

LookupError: unknown encoding: cp65001
Run Code Online (Sandbox Code Playgroud)

python encoding windows-console

5
推荐指数
1
解决办法
2718
查看次数

如何解码cp1252,它是十进制&#147而不是\ x93?

我正在获取网页的源代码,编码是cp1252.Chrome正确显示页面.

这是我的代码:

import sys
from urllib.request import urlopen
from bs4 import BeautifulSoup, UnicodeDammit
import re
import codecs

url = "http://www.sec.gov/Archives/edgar/data/1400810/000119312513211026/d515005d10q.htm"
page = urlopen(url).read()
print(page)
# A little preview :
# b'...Regulation S-T (&#167;232.405 of this chapter) during the preceding 12 months (or for such shorter period that the\nregistrant was required to submit and post such files).&nbsp;&nbsp;&nbsp;&nbsp;Yes&nbsp;&nbsp;<FONT STYLE="FONT-FAMILY:WINGDINGS">&#120;</FONT>...'

soup = BeautifulSoup(page, from_encoding="cp1252")
print(str(soup).encode('utf-8'))
# Same preview section as above
# b'...Regulation S-T (\xc2\xa7232.405 of this chapter) during the preceding 12 months …
Run Code Online (Sandbox Code Playgroud)

encoding beautifulsoup utf-8 cp1252 python-3.x

5
推荐指数
1
解决办法
2310
查看次数

包括 cookie 错误的 Python 请求

我正在尝试在合并现有 Cookie 的同时使用 Requests 模块在 python 上发出 get 请求,这是我的代码的样子:

import requests

url="https://stackoverflow.com/"
headers = {"User-Agent", "Mozilla/5.0"}
cookie = {
    "domain": ".stackoverflow.com",
    "expirationDate": "1458316186",
    "hostOnly": "false",
    "httpOnly": "false",
    "name": "__qca",
    "path": "/",
    "secure": "false",
    "session": "false",
    "storeId": "0",
    "value": "P0-SOMEVALUE-SOMEVALUE",
    "id": 1
}

print requests.get(url, cookies=cookie).text


Traceback (most recent call last):
  File "test.py", line 19, in <module>
    print requests.get(url, cookies=cookie).text
  File "C:\Python27\lib\site-packages\requests\api.py", line 55, in get
    return request('get', url, **kwargs)
  File "C:\Python27\lib\site-packages\requests\api.py", line 44, in request
    return session.request(method=method, url=url, **kwargs)
  File …
Run Code Online (Sandbox Code Playgroud)

python cookies python-requests

5
推荐指数
1
解决办法
2255
查看次数

无法在python 2.7.x控制台中输入(čćšžđ)

所以,我通过互联网搜索,这是非常令人沮丧的.当我尝试搜索时,我会得到关于如何解码和编码文件的解释.但我对此并不感兴趣.我知道这是可能的,因为我能够做到这一点.我不知道发生了什么.此外,我已经尝试重新安装python.更改配置IDLE等下的选项.在我的笔记本电脑上没有任何问题.我可以做这个:

>> a = '?'
>>
>> print a
>> ?
Run Code Online (Sandbox Code Playgroud)

在我的电脑上,我得到:

 >> a = '?'
 >> Unsupported characters in input
Run Code Online (Sandbox Code Playgroud)

我再说一遍,我不是在谈论程序中的编码.我在谈论Python控制台,它可以在我的笔记本电脑上工作,并在以前的机器上工作.必须有一个解决这个问题的方法.

另外,看看这个:

>>> a = u'ç'
>>> a
u'\xe7'
>>> print a
ç
>>> a = u'?'
Unsupported characters in input

>>> 
Run Code Online (Sandbox Code Playgroud)

python python-idle python-2.7

5
推荐指数
1
解决办法
859
查看次数

如何使用 Python 在 Windows 控制台中打印卢比符号?

我想将印度卢比符号添加到程序中。这是一个针对 Windows 的非 GUI 程序,将从控制台作为 exe 运行。(我最终会通过 pyinstaller 将其转换为 exe)。我尝试使用:

print unicode(u"\u20B9")+"12,500"
Run Code Online (Sandbox Code Playgroud)

(取自http://www.fileformat.info/info/unicode/char/20b9/index.htm
它在 IDLE 解释器中运行良好,但是当我尝试从 cmd(Windows 7)运行相同的代码时,它给出了错误:

Traceback (most recent call last):
  File "D:\My Programs\Projects\StockExchangeSim.py", line 9, in <module>
    print unicode(u"\u20B9")+"12,500"
  File "C:\Python27\lib\encodings\cp850.py", line 12, in encode
    return codecs.charmap_encode(input,errors,encoding_map)
UnicodeEncodeError: 'charmap' codec can't encode character u'\u20b9' in position
 0: character maps to <undefined>
Run Code Online (Sandbox Code Playgroud)

有没有办法处理这个问题?如果有的话,在其他windows电脑上使用会不会有问题?

python unicode symbols

5
推荐指数
2
解决办法
3833
查看次数

UnicodeDecodeError: 'charmap' 编解码器无法解码位置 55 中的字节 0x81:字符映射到 &lt;undefined&gt;

我是 Python 新手,希望有人可以向我解释错误消息的含义。

具体来说,我有一些Python和SPSS组合在一起的代码保存在Atom中,这是一个前同事创建的。现在因为前同事不在了,我现在需要运行代码。我所做的是从 SPSS22 运行以下代码。

    begin program.
    import spss,spssaux,imp
    abcvalid = imp.load_source('abcvalid', "I:/VALIDITY CHECK/Python Library/2016/abcvalid2016.py") 
    import abcvalid
    abcvalid.fullprocess("9_26_2016","M:/Users/Yli\2016 SURVEY/DOWNLOADS/9_26_2016/","M:/Users/Yli/2016 SURVEY/Legacy15.sav")
    end program.
Run Code Online (Sandbox Code Playgroud)

然后我从输出中得到了以下内容。

    Traceback (most recent call last):
      File "<string>", line 5, in <module>
      File "I:/VALIDITY CHECK/Python Library/2016/abcnvalid2016.py", line 2067, in fullprocess
        dataprep(date,filepath,legacypath)
      File "I:/VALIDITY CHECK/Python Library/2016/abcvalid2016.py", line 2006, in dataprep
        emailslower(date,filepath)
      File "I:/VALIDITY CHECK/Python Library/2016/abcvalid2016.py", line 1635, in emailslower
        DATASET ACTIVATE comment_data.""".format(date,filepath))
      File "C:\PROGRA~1\IBM\SPSS\STATIS~1\22\Python\Lib\site-packages\spss\spss.py", line 1494, in Submit
        cmdList = spssutil.CheckStr(cmdList)
      File "C:\PROGRA~1\IBM\SPSS\STATIS~1\22\Python\Lib\site-packages\spss\spssutil.py", line 166, in CheckStr
        s1 …
Run Code Online (Sandbox Code Playgroud)

python decode syntax-error spss

4
推荐指数
3
解决办法
2万
查看次数

PowerShell与Python中的Unicode?Windows中的替代shell?

我想要一个在Windows上支持Unicode的shell.它出货的PowerShell似乎没有.

PowerShell V2(Windows 7 x64):

PS C:\> powershell
Windows PowerShell
Copyright (C) 2009 Microsoft Corporation. All rights reserved.

PS C:\> python
Python 2.6.2 (r262:71605, Apr 14 2009, 22:46:50) [MSC v.1500 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> unicode_char=unichr(0xf12)
>>> unicode_char
u'\u0f12'
>>> print unicode_char
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\python26\lib\encodings\cp437.py", line 12, in encode
    return codecs.charmap_encode(input,errors,encoding_map)
UnicodeEncodeError: 'charmap' codec can't encode character u'\u0f12' in position …
Run Code Online (Sandbox Code Playgroud)

python windows unicode powershell

3
推荐指数
1
解决办法
3812
查看次数

BeautifulSoup 4将HTML实体转换为unicode,但在使用print时获取垃圾字符

我正在尝试使用BeautifulSoup 4从网上抓取文本来解析它.将bs4处理过的文本打印到控制台时,我遇到了一个问题.每当我点击一个原本是HTML实体的角色时,就像’ 我在控制台上得到了垃圾字符.我相信bs4正在将这些实体正确转换为unicode,因为如果我尝试使用其他编码来打印文本,它会抱怨字符的适当缺乏unicode映射(比如u'\ u2019.)我不知道为什么打印功能对这些字符感到困惑.我已经尝试更改字体,这会改变垃圾字符,并且我在使用美国英语语言环境的Windows 7机器上.这是我的代码供参考,任何帮助表示赞赏.提前致谢!

#!/usr/bin/python
import json
import urllib2
import cookielib
import bs4

cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))

url = "http://api.nytimes.com/svc/search/v2/articlesearch.json?q=Tiguan\
&page=0&api-key=blah"
response = opener.open(url)
articles = response.read()
decoded = json.loads(articles)

totalpages = decoded['response']['meta']['hits']/10

for page in range(totalpages + 1):
    if page>0:
        url = "http://api.nytimes.com/svc/search/v2/articlesearch.json?\
q=Tiguan&page=" + str(page) + "&api-key=blah"
        response = opener.open(url)
        articles = response.read()
        decoded = json.loads(articles)
    for url in decoded['response']['docs']:
        print url['web_url']
        urlstring = url['web_url']
        art = opener.open(urlstring)
        soup = bs4.BeautifulSoup(art.read())
        goodstuff = soup.findAll('nyt_text')
        for …
Run Code Online (Sandbox Code Playgroud)

python unicode beautifulsoup html-entities

3
推荐指数
1
解决办法
3708
查看次数

在Python中打印所有unicode字符

我已经编写了一些代码来创建十六进制系统的所有4位数组合,现在我正在尝试使用它来打印出与这些值相关联的所有unicode字符.这是我用来执行此操作的代码:

char_list =["0","1","2","3","4","5","6","7","8","9","A","B","C","D","E","F"]
pairs = []
all_chars = []

# Construct pairs list
for char1 in char_list:
    for char2 in char_list:
        pairs.append(char1 + char2)

# Create every combination of unicode characters ever
    for pair1 in pairs:
        for pair2 in pairs:
            all_chars.append(pair1 + pair2)

# Print all characters
for code in all_chars:
    expression = "u'\u" + code + "'"
    print "{}: {}".format(code,eval(expression))
Run Code Online (Sandbox Code Playgroud)

以下是我收到的错误消息:

Traceback (most recent call last): File "C:\Users\andr7495\Desktop\unifun.py", 
line 18, in <module> print "{}: {}".format(code,eval(expression))
UnicodeEncodeError: 'ascii' codec can't …
Run Code Online (Sandbox Code Playgroud)

python unicode

3
推荐指数
1
解决办法
2703
查看次数

使用python使用chcp 65001预启动控制台窗口

我使用python库向Windows控制台打印出一个Unicode字符.如果我在库上调用打印出Unicode字符的函数,它将通过异常'charmap' codec can't encode characters.

所以这就是我试图解决的错误:os.system("chcp 65001")在调用库函数之前从python中调用"chcp 65001"windows console命令.

我知道有类似的问题,这就是我尝试上述解决方案的原因.但问题是,它成功地在控制台上调用命令并告诉我它激活了代码页.但是,仍有例外情况再次出现.但是如果我尝试在不关闭前一个控制台的情况下再次运行程序,程序将成功执行,没有任何异常.这意味着上面的控制台命令在第一次尝试后生效.

我的问题是:有没有办法通过预激活unicode支持启动Windows控制台,这样我就不必再调用程序两次了.

python windows unicode console python-3.x

3
推荐指数
1
解决办法
2515
查看次数