我尝试检测我的文件中使用了哪个字符编码.
我尝试使用此代码来获取标准编码
public static Encoding GetFileEncoding(string srcFile)
{
// *** Use Default of Encoding.Default (Ansi CodePage)
Encoding enc = Encoding.Default;
// *** Detect byte order mark if any - otherwise assume default
byte[] buffer = new byte[5];
FileStream file = new FileStream(srcFile, FileMode.Open);
file.Read(buffer, 0, 5);
file.Close();
if (buffer[0] == 0xef && buffer[1] == 0xbb && buffer[2] == 0xbf)
enc = Encoding.UTF8;
else if (buffer[0] == 0xfe && buffer[1] == 0xff)
enc = Encoding.Unicode;
else if (buffer[0] == 0 && …Run Code Online (Sandbox Code Playgroud) 我想从一个java.net.URI对象中获取一个对象String.该字符串有一些字符需要用它们的百分比转义序列替换.但是当我使用URLEncoder对UTF-8编码的字符串进行编码时,即使/被替换为它们的转义序列.
如何从String对象获取有效的编码URL?
http://www.google.com?q=a b给出 http%3A%2F%2www.google.com ...而我希望输出为 http://www.google.com?q=a% 20B
有人可以告诉我如何实现这一目标.
我试图在Android应用程序中执行此操作.所以我可以访问有限数量的库.
我使用Sublime文本中的HTML编码特殊字符将所有特殊字符转换为HTML代码.我在文件的不同部分有很多重音字符.所以,如果我可以选择所有特殊字符然后使用插件一次转换所有内容将会很棒!
是否有正则表达式有助于仅选择所有特殊字符?
是否有内置的方法在Excel VBA中对字符串进行URL编码,还是需要手动滚动此功能?
“ ” ‘ ’由于我的应用程序中存在编码问题,我需要用常规引号('和")替换单引号和双引号()的Microsoft Word版本.我不需要它们是HTML实体,我不能更改我的数据库架构.
我有两个选择:使用正则表达式或关联数组.
有一个更好的方法吗?
为什么我们有Base64编码?我是一个初学者,我真的不明白为什么你会把字节混淆成别的东西(除非是加密).在其中一本书中,我读到Base64编码在无法进行二进制传输时非常有用.例如.当我们发布表单时,它会被编码.但为什么我们将字节转换成字母?我们难道不能将字节转换为字符串格式,中间有空格吗?例如,00000001 00000004?或者只是0000000100000004没有任何空间,因为字节总是以8对的形式出现?
我在我的网页上使用Font Awesome,我想在:before伪元素中显示一个图标.
根据文档/ cheatsheet,我必须键入以获取此字体,但它无法正常工作.我认为这是正常的,因为不支持HTML实体:before.
所以我用Google搜索了一下,发现如果要显示HTML实体:before,则必须使用转义的十六进制引用.
所以我正在寻找十六进制参考,但我一无所获.我认为这是因为这些都是"私人使用"价值观,无论这意味着什么.
有没有办法让它工作:before?
我在.Net中寻找一个通用方法来编码一个用于Xml元素或属性的字符串,当我没有立即找到它时,我感到很惊讶.所以,在我走得太远之前,我可能只是缺少内置函数吗?
假设它确实不存在,我正在整理我自己的通用EncodeForXml(string data)方法,我正在考虑最好的方法.
我正在使用的数据提示整个事情可能包含坏的字符,如&,<,"等.它还可能包含正确转义的实体:&,<和",这意味着只使用一个CDATA部分可能不是最好的主意.这似乎有点笨拙;我最终会得到一个很好的字符串值,可以直接在xml中使用.
我过去使用过正则表达式来捕捉坏的&符号,我想在这种情况下使用它来捕获它们以及第一步,然后对其他字符进行简单的替换.
那么,这可以进一步优化而不会太复杂,有什么我想念的吗?:
Function EncodeForXml(ByVal data As String) As String
Static badAmpersand As new Regex("&(?![a-zA-Z]{2,6};|#[0-9]{2,4};)")
data = badAmpersand.Replace(data, "&")
return data.Replace("<", "<").Replace("""", """).Replace(">", "gt;")
End Function
Run Code Online (Sandbox Code Playgroud)
对不起你所有的C#-only伙计们 - 我真的不在乎我使用哪种语言,但我想让Regex保持静态,你不能在C#中做到这一点而不在方法之外声明它,所以这将是VB .净
最后,我们仍然使用.Net 2.0,但是如果有人可以将最终产品转换为字符串类的扩展方法,那也很酷.
更新前几个响应表明.Net确实有内置的方法来做到这一点.但是现在我已经开始了,我想完成我的EncodeForXml()方法只是为了它的乐趣,所以我仍然在寻找改进的想法.值得注意的是:一个更完整的字符列表应该被编码为实体(可能存储在列表/映射中),并且比在串行中的不可变字符串上执行.Replace()获得更好的性能.
最近,我有很多的麻烦__repr__(),format()和编码. 输出__repr__()应该编码还是unicode字符串?__repr__()Python中 的结果是否有最佳编码?我想输出的内容确实有非ASCII字符.
我使用Python 2.x,并希望编写可以轻松适应Python 3的代码.程序因此使用
# -*- coding: utf-8 -*-
from __future__ import unicode_literals, print_function # The 'Hello' literal represents a Unicode object
Run Code Online (Sandbox Code Playgroud)
以下是一些困扰我的其他问题,我正在寻找解决它们的解决方案:
sys.stdout.encoding设置了UTF-8,但最好是其他情况也能正常工作).sys.stdout.encoding是None).__repr__()功能的代码目前有很多return ….encode('utf-8'),而且很重要.有什么强劲和轻松的吗?return ('<{}>'.format(repr(x).decode('utf-8'))).encode('utf-8'),即对象的表示被解码,放入格式化字符串,然后重新编码.我想避免这种错综复杂的转变.为了编写__repr__()与这些编码问题相关的简单函数,您建议做什么?
尝试使用列表包将源文件包含到我的乳胶文档中,我在代码中的注释中遇到了德语变音符号的问题.运用
\lstset{
extendedchars=\true,
inputencoding=utf8x
}
Run Code Online (Sandbox Code Playgroud)
处理源文件中的变音符号(以无BOM的UTF-8编码),但它们以某种方式移动到它们所包含的单词的开头.所以
// die Größe muss berücksichtigt werden
Run Code Online (Sandbox Code Playgroud)
在输入源文件中,变为
// die ößGre muss übercksichtigt werden
Run Code Online (Sandbox Code Playgroud)
在输出文件中.
注意:因为我在初始设置中发现错误,所以我大量编辑了这个问题