标签: non-ascii-characters

元标记内容中的法语口音

我在元标记的内容部分中有法语口音。例子：

\n\n

<meta name="description" content="\xc3\xa0 Qu\xc3\xa9bec r\xc3\xa9f\xc3\xa9rence" />\n

Run Code Online (Sandbox Code Playgroud)\n\n

当我查看页面源时，我得到：

\n\n

<meta name="description" content="\xc3\x83  Qu\xc3\x83\xc2\xa9bec r\xc3\x83\xc2\xa9f\xc3\x83\xc2\xa9rence" />\n

Run Code Online (Sandbox Code Playgroud)\n\n

我尝试过使用à Québec référence，但这就是它在内容部分中的显示方式。

\n\n

我正在使用 \n<meta http-equiv="Content-Type" content="text/html;charset=iso-8859-1" />并且我认为这不会在不弄乱项目中其他地方的数千个字符的情况下发生改变。

\n\n

我如何让它看起来像第一个示例，是否有 php 函数可以使用？谢谢。

\n\n

另外解释为什么它被翻译成 \'\xc3\x83 Qu\xc3\x83\xc2\xa9bec r\xc3\x83\xc2\xa9f\xc3\x83\xc2\xa9rence\' 会很好。

\n\n

更新

\n\n

我已经想出了一个解决办法。Aptana Studio 和 Notepad++ 等程序以一种奇怪的方式保存字符。我用记事本编辑它并保存它，这似乎解决了问题。感谢您的快速回复。非常感激。:)

\n

html php non-ascii-characters meta-tags

1
推荐指数

1
解决办法

3728
查看次数

在Python中处理非ASCII字符的可靠方法？

我有一个电子表格列，其标题包含非 ASCII 字符，因此：

\n\n

\'\xc3\xaf\xc2\xbb\xc2\xbfCampaign\'\n

Run Code Online (Sandbox Code Playgroud)\n\n

如果我将此字符串放入解释器中，我会得到：

\n\n

\'\\xc3\\xaf\\xc2\\xbb\\xc2\\xbfCampaign\'\n

Run Code Online (Sandbox Code Playgroud)\n\n

rows该字符串是a 中的键之一csv.DictReader()

\n\n

value当我尝试使用此键填充新字典时：

\n\n

spends[\'\xc3\xaf\xc2\xbb\xc2\xbfCampaign\'] = 2\n

Run Code Online (Sandbox Code Playgroud)\n\n

我得到：

\n\n

Key Error: \'\\xc3\\xaf\\xc2\\xbb\\xc2\\xbfCampaign\'\n

Run Code Online (Sandbox Code Playgroud)\n\n

如果我打印行键的值，我可以看到它是\'\\xef\\xbb\\xbfCampaign\'

\n\n

显然，我可以更新我的程序来访问这个密钥：

\n\n

spends[\'\\xef\\xbb\\xbfCampaign\']\n

Run Code Online (Sandbox Code Playgroud)\n\n

但在 Python 中是否有“更好”的方法来做到这一点？事实上，如果该键的值每次更改为包含其他非 ASCII 字符，那么处理可能出现的任何非 ASCII 字符的包罗万象的方法是什么？

\n

python unicode character-encoding non-ascii-characters python-2.7

1
推荐指数

1
解决办法

1283
查看次数

如何在Python中打印根符号？

我试过这个：

print u"\u221A"

Run Code Online (Sandbox Code Playgroud)

但它在 Python 中不起作用。

有人能告诉我如何在 python 中做到这一点吗？我需要它来展示我所做的事情。

python ascii non-ascii-characters

作者

0
推荐指数

1
解决办法

3458
查看次数

查找文件名中包含非 ASCII 字符的文件

有没有办法可以find处理包含非 ASCII 字符的文件？我当然可以使用管道 - 并使用 perl 过滤文件，但为了提高效率，我想将其全部设置为find. 我尝试了以下方法：

find . -type f -name '*[^[:ascii:]]*'

Run Code Online (Sandbox Code Playgroud)

它根本不起作用。

编辑：

我现在正在尝试利用

find . -type f -regex '.*[^[:ascii:]].*'

Run Code Online (Sandbox Code Playgroud)

它是一个 emacs 正则表达式并且有[:ascii:]类。但我试图使用的表达方式不起作用。

编辑2：

LC_COLLATE=C find . -type f -regex '.*[^!-~].*'

Run Code Online (Sandbox Code Playgroud)

匹配带有非 ASCII 字符的文件（一个完整的巫术......）。但也匹配名称中带有空格的文件。

find non-ascii-characters

0
推荐指数

1
解决办法

2923
查看次数

使用:before伪元素插入非ASCII字符

我在span中有一个输入字段,因此我可以在带有priceField类的span中的所有输入字段之前放置一个井号.但是,因为英镑符号是一个特殊字符,我无法正确呈现它.我已经尝试了ascii dec和hex值,html编号和名称以及实际符号.除符号外的所有内容都打印出实际代码,而符号则输出£.

这是我目前的css:

#productEditForm .priceField:before {
    position:relative;
    display: block;
    float: left;
    content: "£";
    margin: 9px 4px 9px 2px;
    color: #075946;
}?

Run Code Online (Sandbox Code Playgroud)

有任何想法吗？

css non-ascii-characters pseudo-element

0
推荐指数

1
解决办法

954
查看次数

美国/英国是否使用非 ASCII 字符？

我是一名正在使用汉字的开发人员。我正在尝试将我的项目的一部分转换为英语。我目前正在重写项目的国际化模块。

不熟悉英文的标准，不知道non-ascii是否广泛使用？如果是：告诉我一些他们经常使用的字符。

unicode internationalization non-ascii-characters

0
推荐指数

1
解决办法

450
查看次数

删除正则表达式PHP中允许重音词和中文的特殊字符

我需要一个解决方案,删除除字母数字和重音之外的所有特殊字符.我尝试了这个解决方案没有成功.

preg_replace('/[^a-zA-ZáéíóúÁÉÍÓÚâêîôÂÊÎÔãõÃÕçÇ0-9_ \.&-]/s', '', $string);

Run Code Online (Sandbox Code Playgroud)

此外,它需要正则表达式(或其他特定解决方案)允许中国和阿拉伯字符集.

任何帮助它真的很感激!

php regex special-characters non-ascii-characters

0
推荐指数

1
解决办法

2398
查看次数

Python：从csv中删除非ascii字符

我有一个 csv 文件，4000 条记录中只有 4 条包含一些非 ASCII 字符。例如

['com.manager', '2016012300', '16.1.23', 'en', 'kinzie', '2015-04-11T17:36:23Z', '1428773783781', '2016-03-11T09:53:45Z', 'df', '5', "\xa5\x06`'", '\xc0\x03"', '\xa2{\xac ===]\xa9}\xf7\xf7\xf7\xf7\xf7\xf7\xf7\xf7\xf7\xf7\xf7\xf7\xf7&gt;', '', '', '', 'https://play.google.com/apps/publish?account=sd#ReviewDetailsPlace:p=com.manager&reviewid=gp:AOqpTOEcQQGmjFcd-bFfU372DTrxh']

Run Code Online (Sandbox Code Playgroud)

我正在使用以下 python 代码来读取 csv

with open('/Users/duttaam/Downloads/test1.csv', 'rU') as csvfile:
    reader_obj = csv.reader(x.replace('\0', '') for x in csvfile)
    rownum=0
    for row in reader_obj:
        rownum += 1
        if len(row) != 16:
            print rownum
            print row

Run Code Online (Sandbox Code Playgroud)

对于四行，阅读器显示不一致的列号。但是当我计算这些行中的分隔符（，）时，它显示得很好。我能看到的唯一问题是非 ascii 字符，如上行所示的示例行。我猜这些是一些表情符号转换成一些字符。

我想出了一个从字符串中删除不可打印字符的函数，如何将其应用于整个 csv？（感谢以下帖子：Stripping non printable characters from a string in python）

def removeSpecialcahr(s):
        printable = set(string.printable)
        return …

Run Code Online (Sandbox Code Playgroud)

python csv non-ascii-characters

0
推荐指数

1
解决办法

3841
查看次数

在C中将非Ascii字符转换为int,额外的位由1而不是0补充

当用C编码时,我意外地发现,对于非Ascii字符,在它们从char(1字节)转换为int(4字节)之后,额外的比特(3字节)补充为1而不是0.(至于Ascii字符,额外的位由0补充.)例如:

char c[] = "?";
int i = c[0];
printf("%x\n", i);

Run Code Online (Sandbox Code Playgroud)

结果是ffffffc4,而不是c4自己.(ā的UTF-8代码\xc4\x81.)

另一个相关的问题是,当>>对非Ascii字符执行右移操作时,左端的额外位也补充为1而不是0,即使char变量显式转换为unsigned int(对于signed int也是如此) ,在我的操作系统中,额外的位补充为1).例如:

char c[] = "?";
unsigned int u_c;
int i = c[0];
unsigned int u_i = c[0];

c[0] = (unsigned int)c[0] >> 1; 
u_c = (unsigned int)c[0] >> 1;      
i = i >> 1;
u_i = u_i >> 1;
printf("c=%x\n", (unsigned int)c[0]); // result: ffffffe2. The same with the signed int i.
printf("u_c=%x\n", …

Run Code Online (Sandbox Code Playgroud)

c string utf-8 type-conversion non-ascii-characters

0
推荐指数

1
解决办法

369
查看次数

无法找出为什么 jmxRemoteURL 包含非 ASCII 字符

我正在尝试将 Tomcat (v: 9.0.12) 与 Intellij Idea (v: 2018.3) 结合使用来部署 Artifact（一个简单的 hello world javaEE Web 应用程序项目）。

这是我在构建和启动项目后的一些输出（我将把这些输出作为一些有用的信息。您也可以在我的问题末尾找到完整的输出）：

“C:\Program Files\Apache Software Foundation\Tomcat 9.0\bin\catalina.bat”运行
[2019-09-07 10:58:59,049] 工件测试：战争爆炸：正在等待服务器连接以启动工件部署...
使用CATALINA_BASE：“C：\ Users \ pcs \ .IntelliJIdea2018.3 \ system \ tomcat \ Tomcat_9_0_12_test”
使用CATALINA_HOME：“C：\ Program Files \ Apache Software Foundation \ Tomcat 9.0”
使用CATALINA_TMPDIR：“C：\ Program Files \ Apache Software Foundation \ Tomcat 9.0 \ temp”
使用 JRE_HOME：“C:\Program Files\Java\jdk-10.0.1”
使用 CLASSPATH：“C:\Program Files\Apache Software Foundation\Tomcat 9.0\bin\bootstrap.jar;C:\Program Files\Apache Software Foundation\Tomcat 9.0\bin\tomcat-juli.jar”
错误：代理抛出异常：java.net.MalformedURLException：服务 URL 包含非 ASCII 字符 0x6f1

之后，我遇到了JMX错误，如果我是对的，它会发生在：“jdk.management.agent/sun.management.jmxremote.ConnectorBootstrap.startRemoteConnectorServer”（ …

java tomcat jmx intellij-idea non-ascii-characters

0
推荐指数

1
解决办法

1234
查看次数

如何在 C++11 中将 std::string 转换为 std::u32string？

我正在 C++11 中使用 Unicode，现在无法将 std::string 转换为 std::u32string。

\n\n

我的代码如下：

\n\n

#include <iostream>\n#include <string>\n#include <locale>\n#include "unicode/unistr.h"\n#include "unicode/ustream.h"\n\nint main()\n{\n    constexpr char locale_name[] = "";\n    setlocale( LC_ALL, locale_name );\n    std::locale::global(std::locale(locale_name));\n    std::ios_base::sync_with_stdio(false);\n    std::wcin.imbue(std::locale());\n    std::wcout.imbue(std::locale());\n\n    std::string str="hello\xe2\x98\xba";\n\n    std::u32string s(str.begin(),str.end());\n\n    icu::UnicodeString ustr = icu::UnicodeString::fromUTF32(reinterpret_cast<const UChar32 *>(s.c_str()), s.size());\n    std::cout << "Unicode string is: " << ustr << std::endl;\n\n    std::cout << "Size of unicode string = " << ustr.countChar32() << std::endl;\n\n    std::cout << "Individual characters of the string are:" << std::endl;\n    for(int i=0; i < ustr.countChar32(); i++)\n      std::cout …

Run Code Online (Sandbox Code Playgroud)

c++ unicode non-ascii-characters icu c++11

0
推荐指数

1
解决办法

2718
查看次数

以任何方式终止十六进制条目而不使用空格

KEIL 9.55

这有效:

unsigned char code ID_Data_02[9]="\x02 1234567";

Run Code Online (Sandbox Code Playgroud)

但我真正想要的是:

unsigned char code ID_Data_02[8]="\x021234567";

Run Code Online (Sandbox Code Playgroud)

在第一种情况下,我只是使用传输*(p+0),然后*(p+2)忽略描述十六进制与ASCII组件的空白区域.

有人知道更整洁的东西吗？

K&R定义\x,表示1个或多个十六进制char秒-尝试\2x02-好像它承担的十六进制继续下去,直到和非0对F遇到.

c non-ascii-characters keil

作者

-1
推荐指数

1
解决办法

42
查看次数

在文字和标识符objective-c之外不允许使用非ASCII字符

我收到一个错误,因为" 不允许在文字和标识符之外使用非ASCII字符 ".以下是代码:

- (void)purchaseMyProduct:(SKProduct *)product {

    if ([self canMakePurchases]) {
        SKPayment *payment = [SKPayment paymentWithProduct:product];
        [[SKPaymentQueue defaultQueue] addTransactionObserver:self];
        [[SKPaymentQueue defaultQueue] addPayment:payment];
    }
    else{
        UIAlertView *alertView = [[UIAlertView alloc] initWithTitle: @"Purchases are disabled in your device" message:nil delegate: self cancelButtonTitle:@"Ok" otherButtonTitles: nil];

        [alertView show];
    }
}

Run Code Online (Sandbox Code Playgroud)

我在else块上遇到这个错误.我试过删除空格但没有用.我哪里错了？

objective-c identifier literals non-ascii-characters ios

-3
推荐指数

1
解决办法

2209
查看次数

标签统计

non-ascii-characters ×13

c ×2

php ×2

c++ ×1

character-encoding ×1

css ×1

csv ×1

find ×1

html ×1

icu ×1

intellij-idea ×1

internationalization ×1

ios ×1

java ×1

jmx ×1

keil ×1

objective-c ×1

pseudo-element ×1

special-characters ×1

type-conversion ×1

«
1
…
13
14
15
16
17
»