在W3C 验证器上检查我的网站,它只说:
没有在文档级别声明字符编码
在文档中(无论是 HTML 元元素还是 XML 声明中)均未找到字符编码信息。通常建议在文档本身中声明字符编码,特别是当文档有可能从磁盘、CD 等读取或保存到磁盘、CD 等时。
我知道这不是那么重要,但我很好奇:我需要在 .NET 4.0 Web 应用程序上设置哪种元标记/编码?我如何知道哪个编码 .NET 管理我的数据?
我正在尝试将 php 文件 (client.php) 从 utf-8 转换为 iso-8859-1,并且以下命令对文件不执行任何操作:
iconv -f UTF-8 -t ISO-8859-1 client.php
执行后,将显示原始文件内容。
事实上,当我在执行iconv后检查文件的编码时:
文件-I client.php
显示了相同的旧 utf-8:
client.php:文本/x-php;字符集=utf-8
对于 PYTHON 2.7(我在 3 中使用了编码,现在很困惑......希望得到一些如何在 python 3 中复制此测试的建议......)
\n\n对于欧元字符 (\xe2\x82\xac),我使用此工具查找了其 utf8 十六进制代码点。它说是0x20AC。
\n\n对于 Latin1(再次使用 Python2 2.7),我使用解码来获取其十六进制代码点:
\n\n>>import unicodedata\n>>p=\'\xe2\x82\xac\'\n## notably x80 seems to correspond to [Windows CP1252 according to the link][2]\n>>p.decode(\'latin-1\') \n>>u\'\\x80\'\nRun Code Online (Sandbox Code Playgroud)\n\n然后我对它们都使用了这个 print 语句,这就是我得到的:
\n\n对于 utf8:
\n\n>>> print unichr(0x20AC).encode(\'utf-8\')\n\xc3\xa2\xe2\x80\x9a\xc2\xac\nRun Code Online (Sandbox Code Playgroud)\n\n对于拉丁-1:
\n\n>>> print unichr(0x80).encode(\'latin-1\')\n\xe2\x82\xac\nRun Code Online (Sandbox Code Playgroud)\n\n到底发生了什么?为什么编码对于 utf-8 返回 \'\xc3\xa2\xe2\x80\x9a\xc2\xac\' ?另外...看来Latin1 十六进制代码点可能与它们的utf8 对应代码点不同(我有一位同事认为不同——说Latin1 在这方面就像ASCII)。但不同代码点的存在似乎对我来说另有暗示...然而,python 2.7 读取Windows CP1252 \'x80\'的原因对我来说是一个真正的谜......这是 latin-1 的标准在Python 2.7?
\n如何使用 Javascript 将此文本转换为正确的 HTML 字符:
'PingAsyncTask - 令牌 v\ufffdlido'
输入你的控制台:
console.log('PingAsyncTask - 令牌 v\ufffdlido');
我已经尝试了所有常用功能:
谁能帮我?
我正在对与房屋有关的数据进行线性回归分析。目前我有 23 个功能。其中一些显然是有序的(例如年份、房间数、楼层)。有些功能是分类的,我对在编码为数字格式时如何处理它们感到困惑。我对使用哪种编码方法犹豫不决:one-hot 编码(用于分类)或只是序数映射(用于序数数据)。我知道诸如颜色、性别、地区、国籍等分类特征显然必须使用虚拟编码进行编码。而且很明显,诸如可能值为“旧”、“翻新”、“新”的条件这样的分类特征可以分别排序和编码为1、2、3。
但我不确定如何编码不太明显的特征。该特征的性质不会立即引人注目,并且在某种程度上可以同时归因于序数数据和分类数据。让我们看一下例子:
Strongly Agree
Agree
Undecided
Disagree
Strongly Disagree
Run Code Online (Sandbox Code Playgroud)
作者决定按顺序对它们进行编码。有些人建议使用虚拟编码。不清楚。
另一个例子(材料):
Plastic
Wood
Metal
Armored
Run Code Online (Sandbox Code Playgroud)
从我的角度来看,这些数据可以按顺序排序和编码为 1,2,3,4。简单装甲比金属更贵。金属比木材等贵。但我在 youtube 上看到了一个讲座,据说不要仅仅因为看到一些升序或降序模式就对特征进行常规编码。这些模式可能是幻觉和错误的。
另一个例子(互联网连接类型):
DSL
ADSL
SDSL
Cable
Broadband
Run Code Online (Sandbox Code Playgroud)
其中一些比其他更快,一些比其他慢,但没有“明确的顺序”。如何处理此类“不清楚”的分类数据。
如何区分分类数据和序数数据?或者我只需要按序编码非常简单的序数变量,例如“条件”,并将其余不清楚的变量保留为分类和虚拟编码。
encoding regression machine-learning linear-regression categorical-data
OPT、TTF、EOT 和 WOFF 的编码是什么?我似乎找不到他们。
是否有映射到文件类型的编码列表?
我正在尝试将字典存储在我的类 Marker 中,但它抛出一个错误,指出它不可编码或不可解码。我可以看到错误是由 [String: Any] 引起的,但我该如何解决呢?
var buttonActions : [String: [String: [String:Any]]] = [:]
Run Code Online (Sandbox Code Playgroud)
保存和加载
func saveData() {
let dataFilePath = FileManager.default.urls(for: .documentDirectory, in: .userDomainMask).first?.appendingPathComponent("\(fileName).plist")
let encoder = PropertyListEncoder()
do {
let data = try encoder.encode(markerArray)
try data.write(to: dataFilePath!)
print("Saved")
} catch {
print("Error Encoding \(error)")
}
}
func loadData() {
let dataFilePath = FileManager.default.urls(for: .documentDirectory, in: .userDomainMask).first?.appendingPathComponent("\(fileName).plist")
if let data = try? Data(contentsOf: dataFilePath!){
let decoder = PropertyListDecoder()
do {
markerArray = try decoder.decode([Marker].self, from: data)
} catch { …Run Code Online (Sandbox Code Playgroud) 我正在开发一个 JavaFX 应用程序。我需要TreeView使用波斯语以编程方式创建一个节点名称。
问题是我在运行应用程序时看到奇怪的字符。我在网上搜索过同样的问题。我编写了一个函数来根据同一问题的答案进行编码:
public static String getUTF(String encodeString) {
return new String(encodeString.getBytes(StandardCharsets.ISO_8859_1),
StandardCharsets.UTF_8);
}
Run Code Online (Sandbox Code Playgroud)
我用它来转换我的字符串来构建TreeView:
CheckBoxTreeItem<String> userManagement =
new CheckBoxTreeItem<>(GlobalItems.getUTF("???????"));
Run Code Online (Sandbox Code Playgroud)
对于某些字符,此答案无法正常工作:
我仍然得到奇怪的结果。如果我不使用编码,我会得到:
我正在尝试向应该返回 json 的 api 端点发送 post 请求。但是我得到了奇怪的字符。我尝试用 utf-8 编码但没有成功。
import requests
url1= "https://cliff.mediacloud.org/process"
header ={"accept": "application/json, text/javascript, */*; q=0.01",
"accept-encoding": "gzip, deflate, br",
"accept-language": "en-US,en;q=0.9,fr-DZ;q=0.8,fr;q=0.7",
"content-length": "56",
"content-type": "application/x-www-form-urlencoded; charset=UTF-8",
"cookie": "__cfduid=d90785d2f72bf656c19e794239e26185d1585929126; _ga=GA1.2.1927368988.1585929126; _gid=GA1.2.61609766.1585929126 ; _gat_gtag_UA_60744513_13=1",
"origin": "https://cliff.mediacloud.org",
"referer": "https://cliff.mediacloud.org/",
"sec-fetch-dest": "empty",
"sec-fetch-mode": "cors",
"sec-fetch-site": "same-origin",
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36",
"x-requested-with": "XMLHttpRequest"}
text1 = "i am traveling to france"
data1={"text": text1,
"demonyms": "false",
"language": "EN"}
r = requests.post(url=url1, headers=header, data=data1 ) …Run Code Online (Sandbox Code Playgroud) 我有一个清单,例如['exa', 'mp', 'l', 'e']。
我需要使用每个元素来对其进行十六进制化。我想怎么做?首先,我想以某种方式获取每个元素,然后执行 hex(element)。我如何得到它?或者我可以对整个列表进行十六进制化?
提前致谢。
我想说我尝试过str(listname),但它只是输出"['exa', 'mp', 'l', 'e']"不符合我的期望。
encoding ×10
python ×3
html ×2
utf-8 ×2
.net ×1
arrays ×1
converters ×1
decode ×1
dictionary ×1
eot ×1
hex ×1
iconv ×1
java ×1
javafx ×1
javascript ×1
latin1 ×1
list ×1
macos ×1
meta-tags ×1
nested ×1
opentype ×1
python-3.x ×1
regression ×1
string ×1
swift ×1
truetype ×1
unicode ×1
unix ×1
woff ×1