标签: encoding

>>import unicodedata\n>>p=\'\xe2\x82\xac\'\n## notably x80 seems to correspond to [Windows CP1252 according to the link][2]\n>>p.decode(\'latin-1\') \n>>u\'\\x80\'\n

Run Code Online (Sandbox Code Playgroud)\n\n

然后我对它们都使用了这个 print 语句，这就是我得到的：

\n\n

对于 utf8：

\n\n

>>> print unichr(0x20AC).encode(\'utf-8\')\n\xc3\xa2\xe2\x80\x9a\xc2\xac\n

Run Code Online (Sandbox Code Playgroud)\n\n

对于拉丁-1：

\n\n

>>> print unichr(0x80).encode(\'latin-1\')\n\xe2\x82\xac\n

Run Code Online (Sandbox Code Playgroud)\n\n

到底发生了什么？为什么编码对于 utf-8 返回 \'\xc3\xa2\xe2\x80\x9a\xc2\xac\' ？另外...看来Latin1 十六进制代码点可能与它们的utf8 对应代码点不同（我有一位同事认为不同——说Latin1 在这方面就像ASCII）。但不同代码点的存在似乎对我来说另有暗示...然而，python 2.7 读取Windows CP1252 \'x80\'的原因对我来说是一个真正的谜......这是 latin-1 的标准在Python 2.7？

python unicode encoding utf-8 latin1

use*_*696

lucky-day

0
推荐指数

1
解决办法

2720
查看次数

如何使用 Javascript 将此文本转换为正确的 HTML 字符

如何使用 Javascript 将此文本转换为正确的 HTML 字符：

'PingAsyncTask - 令牌 v\ufffdlido'

输入你的控制台：

console.log('PingAsyncTask - 令牌 v\ufffdlido');

我已经尝试了所有常用功能：

谁能帮我？

html javascript encoding utf-8 converters

Pau*_*nho

lucky-day

0
推荐指数

1
解决办法

1584
查看次数

回归分析中如何区分分类变量和序数变量？

我正在对与房屋有关的数据进行线性回归分析。目前我有 23 个功能。其中一些显然是有序的（例如年份、房间数、楼层）。有些功能是分类的，我对在编码为数字格式时如何处理它们感到困惑。我对使用哪种编码方法犹豫不决：one-hot 编码（用于分类）或只是序数映射（用于序数数据）。我知道诸如颜色、性别、地区、国籍等分类特征显然必须使用虚拟编码进行编码。而且很明显，诸如可能值为“旧”、“翻新”、“新”的条件这样的分类特征可以分别排序和编码为1、2、3。

但我不确定如何编码不太明显的特征。该特征的性质不会立即引人注目，并且在某种程度上可以同时归因于序数数据和分类数据。让我们看一下例子：

Strongly Agree 
Agree 
Undecided 
Disagree 
Strongly Disagree

Run Code Online (Sandbox Code Playgroud)

它来自问题： https://stats.stackexchange.com/questions/58818/can-ordinal-variables-be-used-as-predictor-for-linear-multiple-regression-analys

作者决定按顺序对它们进行编码。有些人建议使用虚拟编码。不清楚。
另一个例子（材料）：

Plastic
Wood    
Metal
Armored

Run Code Online (Sandbox Code Playgroud)

从我的角度来看，这些数据可以按顺序排序和编码为 1,2,3,4。简单装甲比金属更贵。金属比木材等贵。但我在 youtube 上看到了一个讲座，据说不要仅仅因为看到一些升序或降序模式就对特征进行常规编码。这些模式可能是幻觉和错误的。

另一个例子（互联网连接类型）：

DSL
ADSL
SDSL
Cable
Broadband

Run Code Online (Sandbox Code Playgroud)

其中一些比其他更快，一些比其他慢，但没有“明确的顺序”。如何处理此类“不清楚”的分类数据。

如何区分分类数据和序数数据？或者我只需要按序编码非常简单的序数变量，例如“条件”，并将其余不清楚的变量保留为分类和虚拟编码。

encoding regression machine-learning linear-regression categorical-data

Erb*_*yev

2017 04-13

0
推荐指数

1
解决办法

1585
查看次数

OPT、TTF、EOT 和 WOFF 的编码是什么？

OPT、TTF、EOT 和 WOFF 的编码是什么？我似乎找不到他们。

是否有映射到文件类型的编码列表？

encoding truetype opentype woff eot

Qui*_*ney

lucky-day

0
推荐指数

1
解决办法

4784
查看次数

Swift - 将字典 [String:Any] 编码和解码为 plist

我正在尝试将字典存储在我的类 Marker 中，但它抛出一个错误，指出它不可编码或不可解码。我可以看到错误是由 [String: Any] 引起的，但我该如何解决呢？

var buttonActions : [String: [String: [String:Any]]] = [:]

Run Code Online (Sandbox Code Playgroud)

保存和加载

func saveData() {
    let dataFilePath = FileManager.default.urls(for: .documentDirectory, in: .userDomainMask).first?.appendingPathComponent("\(fileName).plist")

    let encoder = PropertyListEncoder()
    do {
        let data = try encoder.encode(markerArray)
        try data.write(to: dataFilePath!)
        print("Saved")
    } catch {
        print("Error Encoding \(error)")
    }
}

func loadData() {
    let dataFilePath = FileManager.default.urls(for: .documentDirectory, in: .userDomainMask).first?.appendingPathComponent("\(fileName).plist")

    if let data = try? Data(contentsOf: dataFilePath!){
        let decoder = PropertyListDecoder()
        do {
            markerArray = try decoder.decode([Marker].self, from: data)
        } catch { …

Run Code Online (Sandbox Code Playgroud)

encoding dictionary nested decode swift

STe*_*ier

2018 12-03

0
推荐指数

1
解决办法

2571
查看次数

编码字符串在java中不能正常工作

我正在开发一个 JavaFX 应用程序。我需要TreeView使用波斯语以编程方式创建一个节点名称。
问题是我在运行应用程序时看到奇怪的字符。我在网上搜索过同样的问题。我编写了一个函数来根据同一问题的答案进行编码：

public static String getUTF(String encodeString) {
        return new String(encodeString.getBytes(StandardCharsets.ISO_8859_1),
                         StandardCharsets.UTF_8);
}

Run Code Online (Sandbox Code Playgroud)

我用它来转换我的字符串来构建TreeView：

CheckBoxTreeItem<String> userManagement = 
             new CheckBoxTreeItem<>(GlobalItems.getUTF("???????"));

Run Code Online (Sandbox Code Playgroud)

对于某些字符，此答案无法正常工作：

我仍然得到奇怪的结果。如果我不使用编码，我会得到：

java string encoding javafx character-encoding

Ali*_* HA

2019 09-05

0
推荐指数

1
解决办法

319
查看次数

python请求发布返回奇怪的字符

我正在尝试向应该返回 json 的 api 端点发送 post 请求。但是我得到了奇怪的字符。我尝试用 utf-8 编码但没有成功。

import requests

url1= "https://cliff.mediacloud.org/process"

header ={"accept": "application/json, text/javascript, */*; q=0.01",
"accept-encoding": "gzip, deflate, br",
"accept-language": "en-US,en;q=0.9,fr-DZ;q=0.8,fr;q=0.7",
"content-length": "56",
"content-type": "application/x-www-form-urlencoded; charset=UTF-8",
"cookie": "__cfduid=d90785d2f72bf656c19e794239e26185d1585929126; _ga=GA1.2.1927368988.1585929126; _gid=GA1.2.61609766.1585929126 ; _gat_gtag_UA_60744513_13=1",
"origin": "https://cliff.mediacloud.org",
"referer": "https://cliff.mediacloud.org/",
"sec-fetch-dest": "empty",
"sec-fetch-mode": "cors",
"sec-fetch-site": "same-origin",
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36",
"x-requested-with": "XMLHttpRequest"}

text1 = "i am traveling to france"

data1={"text": text1,
"demonyms": "false",
"language": "EN"}

r = requests.post(url=url1, headers=header, data=data1 ) …

Run Code Online (Sandbox Code Playgroud)

python encoding python-3.x python-requests

lye*_*ian

lucky-day

0
推荐指数

1
解决办法

325
查看次数