标签: encoding

我需要在 .NET Web 应用程序上设置哪种字符编码?

在W3C 验证器上检查我的网站,它只说:

没有在文档级别声明字符编码

在文档中(无论是 HTML 元元素还是 XML 声明中)均未找到字符编码信息。通常建议在文档本身中声明字符编码,特别是当文档有可能从磁盘、CD 等读取或保存到磁盘、CD 等时。

我知道这不是那么重要,但我很好奇:我需要在 .NET 4.0 Web 应用程序上设置哪种元标记/编码?我如何知道哪个编码 .NET 管理我的数据?

.net html encoding meta-tags

0
推荐指数
1
解决办法
167
查看次数

Mac OS X 10.7.3 中的 iconv 不执行任何操作

我正在尝试将 php 文件 (client.php) 从 utf-8 转换为 iso-8859-1,并且以下命令对文件不执行任何操作:

iconv -f UTF-8 -t ISO-8859-1 client.php

执行后,将显示原始文件内容。

事实上,当我在执行iconv后检查文件的编码时:

文件-I client.php

显示了相同的旧 utf-8:

client.php:文本/x-php;字符集=utf-8

unix macos encoding iconv

0
推荐指数
1
解决办法
8789
查看次数

Latin1 字符值的显示与 utf8 中的不同

对于 PYTHON 2.7(我在 3 中使用了编码,现在很困惑......希望得到一些如何在 python 3 中复制此测试的建议......)

\n\n

对于欧元字符 (\xe2\x82\xac),我使用此工具查找了其 utf8 十六进制代码点。它说是0x20AC。

\n\n

对于 Latin1(再次使用 Python2 2.7),我使用解码来获取其十六进制代码点:

\n\n
>>import unicodedata\n>>p=\'\xe2\x82\xac\'\n## notably x80 seems to correspond to [Windows CP1252 according to the link][2]\n>>p.decode(\'latin-1\') \n>>u\'\\x80\'\n
Run Code Online (Sandbox Code Playgroud)\n\n

然后我对它们都使用了这个 print 语句,这就是我得到的:

\n\n

对于 utf8:

\n\n
>>> print unichr(0x20AC).encode(\'utf-8\')\n\xc3\xa2\xe2\x80\x9a\xc2\xac\n
Run Code Online (Sandbox Code Playgroud)\n\n

对于拉丁-1:

\n\n
>>> print unichr(0x80).encode(\'latin-1\')\n\xe2\x82\xac\n
Run Code Online (Sandbox Code Playgroud)\n\n

到底发生了什么?为什么编码对于 utf-8 返回 \'\xc3\xa2\xe2\x80\x9a\xc2\xac\' ?另外...看来Latin1 十六进制代码点可能与它们的utf8 对应代码点不同(我有一位同事认为不同——说Latin1 在这方面就像ASCII)。但不同代码点的存在似乎对我来说另有暗示...然而,python 2.7 读取Windows CP1252 \'x80\'的原因对我来说是一个真正的谜......这是 latin-1 的标准在Python 2.7?

\n

python unicode encoding utf-8 latin1

0
推荐指数
1
解决办法
2720
查看次数

如何使用 Javascript 将此文本转换为正确的 HTML 字符

如何使用 Javascript 将此文本转换为正确的 HTML 字符:

'PingAsyncTask - 令牌 v\ufffdlido'

输入你的控制台:

console.log('PingAsyncTask - 令牌 v\ufffdlido');

我已经尝试了所有常用功能:

  1. https://gist.github.com/chrisveness/bcb00eb717e6382c5608
  2. http://monsur.hossa.in/2012/07/20/utf-8-in-javascript.html
  3. http://jsfromhell.com/geral/utf-8

谁能帮我?

html javascript encoding utf-8 converters

0
推荐指数
1
解决办法
1584
查看次数

回归分析中如何区分分类变量和序数变量?

我正在对与房屋有关的数据进行线性回归分析。目前我有 23 个功能。其中一些显然是有序的(例如年份、房间数、楼层)。有些功能是分类的,我对在编码为数字格式时如何处理它们感到困惑。我对使用哪种编码方法犹豫不决:one-hot 编码(用于分类)或只是序数映射(用于序数数据)。我知道诸如颜色、性别、地区、国籍等分类特征显然必须使用虚拟编码进行编码。而且很明显,诸如可能值为“旧”、“翻新”、“新”的条件这样的分类特征可以分别排序和编码为1、2、3

但我不确定如何编码不太明显的特征。该特征的性质不会立即引人注目,并且在某种程度上可以同时归因于序数数据和分类数据。让我们看一下例子:

Strongly Agree 
Agree 
Undecided 
Disagree 
Strongly Disagree 
Run Code Online (Sandbox Code Playgroud)

它来自问题: https://stats.stackexchange.com/questions/58818/can-ordinal-variables-be-used-as-predictor-for-linear-multiple-regression-analys

作者决定按顺序对它们进行编码。有些人建议使用虚拟编码。不清楚。
另一个例子(材料):

Plastic
Wood    
Metal
Armored 
Run Code Online (Sandbox Code Playgroud)

从我的角度来看,这些数据可以按顺序排序和编码为 1,2,3,4。简单装甲比金属更贵。金属比木材等贵。但我在 youtube 上看到了一个讲座,据说不要仅仅因为看到一些升序或降序模式就对特征进行常规编码。这些模式可能是幻觉和错误的。

另一个例子(互联网连接类型):

DSL
ADSL
SDSL
Cable
Broadband
Run Code Online (Sandbox Code Playgroud)

其中一些比其他更快,一些比其他慢,但没有“明确的顺序”。如何处理此类“不清楚”的分类数据。

如何区分分类数据和序数数据?或者我只需要按序编码非常简单的序数变量,例如“条件”,并将其余不清楚的变量保留为分类和虚拟编码。

encoding regression machine-learning linear-regression categorical-data

0
推荐指数
1
解决办法
1585
查看次数

OPT、TTF、EOT 和 WOFF 的编码是什么?

OPT、TTF、EOT 和 WOFF 的编码是什么?我似乎找不到他们。

是否有映射到文件类型的编码列表?

encoding truetype opentype woff eot

0
推荐指数
1
解决办法
4784
查看次数

Swift - 将字典 [String:Any] 编码和解码为 plist

我正在尝试将字典存储在我的类 Marker 中,但它抛出一个错误,指出它不可编码或不可解码。我可以看到错误是由 [String: Any] 引起的,但我该如何解决呢?

var buttonActions : [String: [String: [String:Any]]] = [:]
Run Code Online (Sandbox Code Playgroud)

保存和加载

func saveData() {
    let dataFilePath = FileManager.default.urls(for: .documentDirectory, in: .userDomainMask).first?.appendingPathComponent("\(fileName).plist")

    let encoder = PropertyListEncoder()
    do {
        let data = try encoder.encode(markerArray)
        try data.write(to: dataFilePath!)
        print("Saved")
    } catch {
        print("Error Encoding \(error)")
    }
}

func loadData() {
    let dataFilePath = FileManager.default.urls(for: .documentDirectory, in: .userDomainMask).first?.appendingPathComponent("\(fileName).plist")

    if let data = try? Data(contentsOf: dataFilePath!){
        let decoder = PropertyListDecoder()
        do {
            markerArray = try decoder.decode([Marker].self, from: data)
        } catch { …
Run Code Online (Sandbox Code Playgroud)

encoding dictionary nested decode swift

0
推荐指数
1
解决办法
2571
查看次数

编码字符串在java中不能正常工作

我正在开发一个 JavaFX 应用程序。我需要TreeView使用波斯语以编程方式创建一个节点名称。
问题是我在运行应用程序时看到奇怪的字符。我在网上搜索过同样的问题。我编写了一个函数来根据同一问题的答案进行编码:

public static String getUTF(String encodeString) {
        return new String(encodeString.getBytes(StandardCharsets.ISO_8859_1),
                         StandardCharsets.UTF_8);
}
Run Code Online (Sandbox Code Playgroud)

我用它来转换我的字符串来构建TreeView

CheckBoxTreeItem<String> userManagement = 
             new CheckBoxTreeItem<>(GlobalItems.getUTF("???????"));
Run Code Online (Sandbox Code Playgroud)

对于某些字符,此答案无法正常工作:

在此处输入图片说明

我仍然得到奇怪的结果。如果我不使用编码,我会得到:

在此处输入图片说明

java string encoding javafx character-encoding

0
推荐指数
1
解决办法
319
查看次数

python请求发布返回奇怪的字符

我正在尝试向应该返回 json 的 api 端点发送 post 请求。但是我得到了奇怪的字符。我尝试用 utf-8 编码但没有成功。

import requests

url1= "https://cliff.mediacloud.org/process"

header ={"accept": "application/json, text/javascript, */*; q=0.01",
"accept-encoding": "gzip, deflate, br",
"accept-language": "en-US,en;q=0.9,fr-DZ;q=0.8,fr;q=0.7",
"content-length": "56",
"content-type": "application/x-www-form-urlencoded; charset=UTF-8",
"cookie": "__cfduid=d90785d2f72bf656c19e794239e26185d1585929126; _ga=GA1.2.1927368988.1585929126; _gid=GA1.2.61609766.1585929126 ; _gat_gtag_UA_60744513_13=1",
"origin": "https://cliff.mediacloud.org",
"referer": "https://cliff.mediacloud.org/",
"sec-fetch-dest": "empty",
"sec-fetch-mode": "cors",
"sec-fetch-site": "same-origin",
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36",
"x-requested-with": "XMLHttpRequest"}

text1 = "i am traveling to france"

data1={"text": text1,
"demonyms": "false",
"language": "EN"}

r = requests.post(url=url1, headers=header, data=data1 ) …
Run Code Online (Sandbox Code Playgroud)

python encoding python-3.x python-requests

0
推荐指数
1
解决办法
325
查看次数

如何使用列表元素?| PYTHON

我有一个清单,例如['exa', 'mp', 'l', 'e']

我需要使用每个元素来对其进行十六进制化。我想怎么做?首先,我想以某种方式获取每个元素,然后执行 hex(element)。我如何得到它?或者我可以对整个列表进行十六进制化?

提前致谢。

我想说我尝试过str(listname),但它只是输出"['exa', 'mp', 'l', 'e']"不符合我的期望。

python arrays encoding hex list

0
推荐指数
1
解决办法
44
查看次数