我有这样的清单:
\n\nl=[u'\\u0634\\u0628\\u06a9\\u0647 \\u0645\\u062d\\u0628\\u0627\\u0646 \\u0627\\u0647\\u0644 \\u0628\\u06cc\\u062a \\u0639\\u0644\\u06cc\\u0647\\u0645 \\u0627\\u0644\\u0633\\u0644\\u0627\\u0645', u'\\u0622\\u062e\\u0631\\u06cc\\u0646 \\u0641\\u0639\\u0627\\u0644\\u06cc\\u062a \\u0647\\u0627 \\u062f\\u0631 \\u0647\\u0627\\u062f\\u06cc \\u0646\\u062a \\u0628\\u0631\\u06af\\u0631\\u0641\\u062a\\u0647 \\u0627\\u0632 \\u0646\\u0627\\u0645 \\u0627\\u0645\\u0627\\u0645 \\u0646\\u0642\\u06cc \\u0639\\u0644\\u06cc\\u0647 \\u0627\\u0644\\u0633\\u0644\\u0627\\u0645', u'\\u0648\\u0631\\u0648\\u062f', u'\\u0622\\u062e\\u0631\\u06cc\\u0646 \\u0622\\u0646\\u0644\\u0627\\u06cc\\u0646 \\u0647\\u0627', u'\\u06a9\\u0627\\u0631\\u0628\\u0631\\u0627\\u0646 \\u0641\\u0639\\u0627\\u0644', u'\\u06af\\u0631\\u0648\\u0647 \\u0647\\u0627\\u06cc \\u0641\\u0639\\u0627\\u0644', u'\\u0645\\u062d\\u0628\\u0648\\u0628\\u062a\\u0631\\u06cc\\u0646 \\u0628\\u0631\\u0686\\u0633\\u0628 \\u0647\\u0627', u'\\u0628\\u0647 \\u067e\\u0627\\u062a\\u0648\\u0642 \\u0627\\u06cc\\u0646\\u062a\\u0631\\u0646\\u062a\\u06cc \\u0645\\u062d\\u0628\\u0627\\u0646 \\u0627\\u0647\\u0644 \\u0628\\u06cc\\u062a \\u0639\\u0644\\u06cc\\u0647\\u0645 \\u0627\\u0644\\u0633\\u0644\\u0627\\u0645 \\u062e\\u0648\\u0634 \\u0622\\u0645\\u062f\\u06cc\\u062f', u'\\u06cc\\u0627 \\u062d\\u0633\\u06cc\\u0646(\\u0639)...\\n\\n\\u0645\\u06cc \\u0628\\u0631\\u0645 \\u06cc\\u06a9 \\u0631\\u0648\\u0632 \\u0627\\u0632 \\u0627\\u0635\\u0644\\u06cc\\u062a\\u0645\\n\\u0622\\u062e\\u0631 \\u0627\\u0632 \\u0639\\u0634\\u0642\\u062a \\u0639\\u0631\\u0627\\u0642\\u06cc \\u0645\\u06cc \\u0634\\u0648\\u0645..', u'#\\u0627\\u0644\\u0644\\u0651\\u0647\\u0640\\u064f\\u0640\\u0640\\u0645\\u0651\\u064e \\u0635\\u064e\\u0640\\u0644\\u0651\\u0650 \\u0639\\u064e\\u0644\\u0640\\u06cc #\\u0645\\u064f\\u062d\\u064e\\u0640\\u0640\\u0645\\u0651\\u064e\\u062f \\u0648\\u064e\\u0622\\u0644\\u0650 #\\u0645\\u064f\\u062d\\u064e\\u0640\\u0640\\u0645\\u0651\\u064e\\u062f \\u0648\\u064e\\u0639\\u064e\\u062c\\u0651\\u0650\\u0640\\u0640\\u0644\\u0652 \\u0641\\u0640\\u064e\\u0640\\u064e\\u0631\\u064e\\u062c\\u064e\\u0640\\u0647\\u064f\\u0645 \\n#\\u0627\\u0644\\u0644\\u0651\\u0647\\u0640\\u064f\\u0640\\u0640\\u0645\\u0651\\u064e \\u0635\\u064e\\u0640\\u0644\\u0651\\u0650 \\u0639\\u064e\\u0644\\u0640\\u06cc #\\u0645\\u064f\\u062d\\u064e\\u0640\\u0640\\u0645\\u0651\\u064e\\u062f \\u0648\\u064e\\u0622\\u0644\\u0650 #\\u0645\\u064f\\u062d\\u064e\\u0640\\u0640\\u0645\\u0651\\u064e\\u062f \\u0648\\u064e\\u0639\\u064e\\u062c\\u0651\\u0650\\u0640\\u0640\\u0644\\u0652 \\u0641\\u0640\\u064e\\u0640\\u064e\\u0631\\u064e\\u062c\\u064e\\u0640\\u0647\\u064f\\u0645 \\n#\\u0627\\u0644\\u0644\\u0651\\u0647\\u0640\\u064f\\u0640\\u0640\\u0645\\u0651\\u064e \\u0635\\u064e\\u0640\\u0644\\u0651\\u0650 \\u0639\\u064e\\u0644\\u0640\\u06cc #\\u0645\\u064f\\u062d\\u064e\\u0640\\u0640\\u0645\\u0651\\u064e\\u062f \\u0648\\u064e\\u0622\\u0644\\u0650 #\\u0645\\u064f\\u062d\\u064e\\u0640\\u0640\\u0645\\u0651\\u064e\\u062f \\u0648\\u064e\\u0639\\u064e\\u062c\\u0651\\u0650\\u0640\\u0640\\u0644\\u0652 \\u0641\\u0640\\u064e\\u0640\\u064e\\u0631\\u064e\\u062c\\u064e\\u0640\\u0647\\u064f\\u0645', u'#\\u0627\\u0644\\u0644\\u0651\\u0647\\u0640\\u064f\\u0640\\u0640\\u0645\\u0651\\u064e …Run Code Online (Sandbox Code Playgroud) 我正在编写一个 Python 程序来从 JSON 文件读取信息,然后将信息写入 csv 文件。JSON 文件包含英文和中文字符。但是,生成的csv文件无法显示汉字,而是显示一些奇怪的字符(如\xc3\xa6\xe2\x80\xa2\xc2\xb8)。
\n\n以下是我的程序的一部分
\n\nreload(sys)\nsys.setdefaultencoding('utf-8')\n\nwith open('file.json') as data_file:\n data_teacher = json.load(data_file)\n\ntopic[worksheet] = data_teacher[worksheetID]['Topic']\nsys.stdout = open('Worksheet.csv','w')\nsys.stdout.write(str(topic[worksheet].encode('utf-8')))\nRun Code Online (Sandbox Code Playgroud)\n\n我应该如何修改我的程序,以便它可以允许在csv文件中显示汉字?
\n我正进入(状态:
error: illegal base64 data at input byte 2564
Run Code Online (Sandbox Code Playgroud)
当我解密两个编码字符串时:
data1:="8uxiowaHGmt6usI7U2SErXwpi/JLKbdhI3o...."(encrypted data)
data2:="iqqtWBCW7Ih9GAXubtIoLjucdIDfWd+oo2j...."(encrypted data)
data:=data1+data2
value, err = base64.StdEncoding.DecodeString(data)
if err != nil {
log.Println(err)
return
}
Run Code Online (Sandbox Code Playgroud)
谁能建议可能是什么问题?
theurl = 'http://bit.ly/6IcCtf/'
urlReq = urllib2.Request(theurl)
urlReq.add_header('User-Agent',random.choice(agents))
urlResponse = urllib2.urlopen(urlReq)
htmlSource = urlResponse.read()
if unicode == 1:
#print urlResponse.headers['content-type']
#encoding=urlResponse.headers['content-type'].split('charset=')[-1]
#htmlSource = unicode(htmlSource, encoding)
htmlSource = htmlSource.encode('utf8')
return htmlSource
Run Code Online (Sandbox Code Playgroud)
请看一下unicode部分.我尝试了这两个选项......但是没有用.
htmlSource = htmlSource.encode('utf8')
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe7 in position 370747: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)
当我尝试更长的编码方法时...
_mysql_exceptions.Warning: Incorrect string value: '\xE7\xB9\x81\xE9\xAB\x94...' for column 'html' at row 1
Run Code Online (Sandbox Code Playgroud) 所以我认为我的问题非常简单.我需要解码Base64,直到没有Base64,如果有一些Base64,我用RegEx检查,但我不知道如何解码,直到没有Base64.
在这个简短的代码中我可以解码Base64,直到没有Base64,因为我的文本是定义的.(直到Base64 Decode Stuff不是"Hello World"解码)
# Import Libraries
from base64 import *
import re
# Text & Base64 String
strText = "Hello World"
strEncode = "VmxSQ2ExWXlUWGxUYTJoUVVqSlNXRlJYY0hOT1ZteHlXa1pLVVZWWE9EbERaejA5Q2c9PQo=".encode("utf-8")
# Decode
objRgx = re.search('^(?:[A-Za-z0-9+/]{4})*(?:[A-Za-z0-9+/]{2}==|[A-Za-z0-9+/]{3}=)?$', strEncode.decode("utf-8"))
strDecode = b64decode(objRgx.group(0).encode("utf-8"))
print(strDecode.decode("utf-8"))
while strDecode != strText.encode("utf-8"):
strDecode = b64decode(strDecode)
print(strDecode.decode("utf-8"))
Run Code Online (Sandbox Code Playgroud)
有没有人有一个想法如何解码Base64,直到有真正的文本(没有更多base64)
PS抱歉我的英语不好.
我正在尝试使用Düsseldorf字符串.当我这样做时:
# -*- coding: utf-8 -*-
print "Düsseldorf"
Run Code Online (Sandbox Code Playgroud)
它打印奇怪的字符.有人可以帮帮我吗?
非常感谢你.
(用于XML HTTP请求的JavaScript和用于执行SQL查询的PHP.)
我正在构建一个执行查询的Web应用程序.它使用XMLHTTP请求GET方法并将查询传递给执行它的PHP脚本.它工作正常,直到我( )在其中引入括号.
这是一个如何工作的例子:
function executeQry(){
qry = document.getElementByID('textarea').value;
qryHTTPRequest(encodeURI(qry));
//I've also tried encodeURIComponent(qry);
}
function xmlHTTPRequest(qry){
//fetches
urlFetch = "http://my.url.com/script.php?qry=" + qry;
}
Run Code Online (Sandbox Code Playgroud)
这是一个快速参考,我知道我的xmlhttp请求工作正常,因为它执行其他查询传递时需要做的事情,例如:
SELECT * FROM `tableName`
Run Code Online (Sandbox Code Playgroud)
工作正常,但当你尝试做类似的事情
CREATE TABLE `new_table`
AS (SELECT * FROM `old_table`)
Run Code Online (Sandbox Code Playgroud)
然后这就是它不会执行的时候,我得到了403错误,所以我认为这是一个()因为我甚至在PHP本身上尝试了相同的代码,而不必通过它并且它工作,所以必须有一个URL编码过程的问题对吗?如果这是问题,是否有一种编码这些字符的方法?我假设还有其他字符不能用encodeURI()方法编码encodeURIComponent().提前致谢!
我需要将String内容解析为二进制序列,并将它们转换为UTF-8等效String.
例如,B,A和R的UTF-8二进制当量如下:B = 01000010 A = 01000001 R = 01010010
现在,我需要将字符串"010000100100000101010010"转换为字符串"BAR",
即对于上述情况,输入24个字符的字符串被分成三个相等的部分(每个部分中有8个字符)并转换为其UTF-8等价物作为字符串值.
示例代码:
public static void main(String args[]) {
String B = "01000010";
String A = "01000001";
String R = "01010010";
String BAR = "010000100100000101010010";
String utfEquiv = toUTF8(BAR);//expecting to get "BAR"
System.out.println(utfEquiv);
}
private static String toUTF8(String str) {
// TODO
return "";
}
Run Code Online (Sandbox Code Playgroud)
什么应该是方法toUTF8(String str){}的实现
我正在尝试运行以下代码
import json
import textProcess as tp
review = open('../inres_review.json')
vocabulary = open('../vocabulary.txt','w+')
label = open('../label.txt','w+')
data = open('../data.txt','w+')
voc = []
revs = []
lab = []
dat = []
i=1
for line in review:
jre = json.loads(line)
jstar = jre['stars']
text = jre['text']
lab.append(jstar)
ws = tp.removeStopPunc(text)
revs.append(ws)
voc += ws
i += 1
for i in lab:
label.write(str(i)+"\n")
print ("label created successfully!")
voc = list(set(voc))
print (len(voc))
print (type(i))
for i in voc:
vocabulary.write(i.encode('UTF-8')+"\n")
print ("Vocabulary created …Run Code Online (Sandbox Code Playgroud) 我有一个使用Base64编码的密钥。
尝试解码时,我收到以下错误。错误被抛出byte[] todecode_byte = Convert.FromBase64String(data);
base64Decode中的错误输入不是有效的Base-64字符串,因为它包含非Base 64字符,两个以上的填充字符或填充字符中的非法字符。
我正在使用以下方法对此进行解码:
public string base64Decode(string data)
{
try
{
System.Text.UTF8Encoding encoder = new System.Text.UTF8Encoding();
System.Text.Decoder utf8Decode = encoder.GetDecoder();
byte[] todecode_byte = Convert.FromBase64String(data); // this line throws the exception
int charCount = utf8Decode.GetCharCount(todecode_byte, 0, todecode_byte.Length);
char[] decoded_char = new char[charCount];
utf8Decode.GetChars(todecode_byte, 0, todecode_byte.Length, decoded_char, 0);
string result = new String(decoded_char);
return result;
}
catch (Exception e)
{
throw new Exception("Error in base64Decode" + e.Message);
}
}
Run Code Online (Sandbox Code Playgroud)