标签: character-encoding

在my.cnf中将MySQL默认字符集更改为UTF-8？

目前我们在PHP中使用以下命令在我们的应用程序中将字符集设置为UTF-8.

由于这有点开销,我们想将其设置为MySQL中的默认设置.我们可以在/etc/my.cnf或其他地方这样做吗？

SET NAMES 'utf8'
SET CHARACTER SET utf8

Run Code Online (Sandbox Code Playgroud)

我在/etc/my.cnf中找了一个默认的字符集,但是没有关于字符集的内容.

此时,我执行以下操作将MySQL字符集和校对变量设置为UTF-8:

skip-character-set-client-handshake
character_set_client=utf8
character_set_server=utf8

Run Code Online (Sandbox Code Playgroud)

这是处理这个问题的正确方法吗？

mysql character-encoding

Jor*_*rre

2014 08-01

328
推荐指数

12
解决办法

45万
查看次数

连字符后没有换行符

我希望在-与所有浏览器兼容的个案基础上阻止连字符后的换行符.

例:

我有这个文本: 3-3/8"在HTML中是这样的: 3-3/8”

问题是,在一行的末尾附近,由于连字符,它会断开并包裹到下一行而不是像完整的单词一样对待它...

3-
3/8"

Run Code Online (Sandbox Code Playgroud)

我试过插入"零宽度不中断字符",没有运气......

3-&#65279;3/8&rdquo;

Run Code Online (Sandbox Code Playgroud)

我在Safari中看到了这一点,并认为它在所有浏览器中都是一样的.

以下是我doctype和字符编码......

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
   "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

<html xmlns="http://www.w3.org/1999/xhtml">
    <meta http-equiv="Content-Type" content="text/html;charset=utf-8" />

Run Code Online (Sandbox Code Playgroud)

在连字符后我有什么方法可以防止这些断线？我不需要任何适用于整个页面的解决方案...只是我可以根据需要插入的内容,如"零宽度无中断字符",除了一个有效.

这是一个演示.只需将框架缩小,直到连字符处的线条断开.

http://jsfiddle.net/RagKH/

html css line-breaks character-encoding hyphenation

Spa*_*rky

2012 06-01

326
推荐指数

5
解决办法

16万
查看次数

MySQL中的utf8mb4和utf8字符集有什么区别？

MySQL中utf8mb4和utf8charsets有什么区别？

我已经知道ASCII,UTF-8,UTF-16和UTF-32编码; 但我很想知道utf8mb4编码组与MySQL服务器中定义的其他编码类型的区别.

是否有任何特殊利益/建议使用utf8mb4而不是utf8？

mysql encoding utf-8 character-encoding utf8mb4

Moj*_*ian

2018 09-15

294
推荐指数

5
解决办法

16万
查看次数

检测编码并使所有内容UTF-8

我正在从各种RSS源中读出大量文本并将它们插入到我的数据库中.

当然,在馈送中使用了几种不同的字符编码,例如UTF-8和ISO-8859-1.

不幸的是,有时文本的编码存在问题.例:

"Fußball"中的"ß"应该在我的数据库中看起来像这样:"ÂŸ".如果是"ÂŸ",则会正确显示.
有时,"Fußball"中的"ß"在我的数据库中看起来像这样:"ÃƒÂŸ".当然,它显示错误.
在其他情况下,"ß"保存为"ß" - 所以没有任何改变.然后它也显示错误.

我该怎么做才能避免案例2和3？

如何使所有内容编码相同,最好是UTF-8？我utf8_encode()什么时候必须使用,什么时候必须使用utf8_decode()(很清楚效果是什么,但什么时候必须使用这些功能？)什么时候我必须对输入什么都不做？

你能帮助我并告诉我如何使一切编码相同吗？也许有功能mb_detect_encoding()？我能为此写一个函数吗？所以我的问题是:

如何找出文本使用的编码？
如何将其转换为UTF-8 - 无论旧的编码是什么？

像这样的功能会起作用吗？

function correct_encoding($text) {
    $current_encoding = mb_detect_encoding($text, 'auto');
    $text = iconv($current_encoding, 'UTF-8', $text);
    return $text;
}

Run Code Online (Sandbox Code Playgroud)

我已经测试了它,但它不起作用.它出什么问题了？

php encoding utf-8 character-encoding

caw*_*caw

2019 07-09

293
推荐指数

7
解决办法

34万
查看次数

什么"内容类型:application/json; charset = utf-8"真的意味着什么？

当我使用JSON主体向我的REST服务发出POST请求时,我将其包含Content-type: application/json; charset=utf-8在邮件头中.没有这个标题,我从服务中得到一个错误.我也可以成功使用Content-type: application/json没有;charset=utf-8部分.

到底是charset=utf-8做什么的？我知道它指定了字符编码,但没有它,服务工作正常.此编码是否限制可以在邮件正文中的字符？

character-encoding mime-types

Den*_*ail

lucky-day

262
推荐指数

4
解决办法

43万
查看次数

是否有一个颠倒的插入符号？

我必须维护大量的经典ASP页面,其中许多都有表格数据,根本没有排序功能.无论数据库查询中使用的原始开发人员是什么顺序,您都会遇到困难.

我想对一些这些页面进行一些基本的排序,而我正在使用javascript完成所有客户端.我已经完成了基本脚本,以便在给定方向上对给定列的给定表进行排序,只要表格受到我们遵循的某些约定的限制,它就能正常工作.

我想为UI做的只是用插入符号(^)表示排序方向,然后......什么？是否有一个与插入符号直接相反的特殊字符？这封信v不会完全削减它.或者,我可以使用另一个角色配对吗？

html sorting user-interface character character-encoding

Joe*_*orn

2012 08-08

247
推荐指数

13
解决办法

29万
查看次数

为什么我们使用Base64？

维基百科说

当需要编码需要通过设计用于处理文本数据的媒体存储和传输的二进制数据时,通常使用Base64编码方案.这是为了确保数据在运输过程中保持完好无需修改.

但是,数据是否总是以二进制形式存储/传输,因为我们的机器存储二进制文件的内存只取决于你如何解释它？因此,无论您编码位模式010011010110000101101110为ManASCII或如TWFu为Base64,你最终将存储相同的位模式.

如果最终编码是零和1,并且每台机器和媒体都可以处理它们,那么如果数据表示为ASCII或Base64,这又如何重要？

什么是"旨在处理文本数据的媒体"？他们可以处理二元=>他们可以处理任何事情.

谢谢大家,我想我现在明白了.

当我们发送数据时,我们无法确定数据的解释格式是否与我们预期的相同.因此,我们发送以双方都理解的某种格式(如Base64)编码的数据.这样,即使发送方和接收方以不同方式解释相同的内容,但由于它们对编码格式达成一致,因此数据不会被错误地解释.

来自Mark Byers的例子

如果我想发送

Hello
world!

Run Code Online (Sandbox Code Playgroud)

一种方法是用ASCII发送它

72 101 108 108 111 10 119 111 114 108 100 33

Run Code Online (Sandbox Code Playgroud)

但是字节10可能无法正确解释为另一端的换行符.因此,我们使用ASCII的子集对此进行编码

83 71 86 115 98 71 56 115 67 110 100 118 99 109 120 107 73 61 61

Run Code Online (Sandbox Code Playgroud)

以相同数量的信息传输的更多数据为代价,确保接收器能够以预期的方式解码数据,即使接收器恰好对字符集的其余部分有不同的解释.

algorithm binary base64 ascii character-encoding

Laz*_*zer

2017 09-11

246
推荐指数

12
解决办法

8万
查看次数

如何在Java中将字符串转换为UTF8字节数组

在Java中,我有一个String,我想将其编码为字节数组(UTF8或其他编码).或者,我有一个字节数组(在一些已知的编码中),我想将其转换为Java字符串.我该如何进行这些转换？

java string encoding character-encoding

mch*_*erm

2013 01-10

225
推荐指数

7
解决办法

62万
查看次数

将Unicode文本写入文本文件？

我正在从Google文档中提取数据,处理数据并将其写入文件(最终我将粘贴到Wordpress页面).

它有一些非ASCII符号.如何将这些安全地转换为可以在HTML源中使用的符号？

目前我正在将所有内容转换为Unicode,在Python字符串中将它们连接在一起,然后执行:

import codecs
f = codecs.open('out.txt', mode="w", encoding="iso-8859-1")
f.write(all_html.encode("iso-8859-1", "replace"))

Run Code Online (Sandbox Code Playgroud)

最后一行有编码错误:

UnicodeDecodeError:'ascii'编解码器无法解码位置12286中的字节0xa0:序数不在范围内(128)

部分解决方案:

这个Python运行时没有错误:

row = [unicode(x.strip()) if x is not None else u'' for x in row]
all_html = row[0] + "<br/>" + row[1]
f = open('out.txt', 'w')
f.write(all_html.encode("utf-8"))

Run Code Online (Sandbox Code Playgroud)

但是如果我打开实际的文本文件,我会看到许多符号,如: