标签: character-encoding

是ASCII字符串端序安全吗?

我正在做数学,如果我将二进制表示(二进制模式中的二进制文件)中的每一点信息(变量的内容)保持在低于或等于1个字节,那么无论在哪个字节上实现,我都是安全的.平台,这意味着ASCII字符集是字节序安全的或双端的,因为它提供了2 ^ 8个排列?我认为UTF-8不是双端的结果.

encoding ascii utf-8 character-encoding

0
推荐指数
1
解决办法
315
查看次数

当我从SQL Server导入tinyint列到Oracle 10g时,为什么会得到负值?

我最近遇到了一个问题,我们正在运行一个数据迁移脚本,以通过Oracle DBLink将数据从SQL Server迁移到Oracle 10g。一切正常,直到我们在生产Oracle环境中运行脚本为止。对于在SQL Server中定义为tinyint的某些列,我们发现SQL Server数据库中大于127的值现在为负值(比原始值小256)。为什么该脚本在开发和测试数据库中起作用,而在生产中却不起作用?

sql-server dblink character-encoding oracle10g

0
推荐指数
1
解决办法
1427
查看次数

修复haskell中破坏的utf8编码

在SO人员的帮助下,我成功地在haskell中实现了一个简单的rss下载器.但仍有一个问题:如何修复Feed项标题的破碎编码?这是最小的工作示例:

import Control.Monad
import Control.Applicative
import Network.HTTP
import Text.Feed.Import
import Text.Feed.Query
import Text.Feed.Types
import Data.Maybe
import qualified Data.ByteString as B
import Network.URI (parseURI, uriToString)
import Codec.Binary.UTF8.String (decodeString, encodeString)

getTitleAndUrl :: Item -> (Maybe String, Maybe String)
getTitleAndUrl item = (getItemTitle item, getItemLink item)

downloadUri :: (Maybe String,Maybe String) -> IO ()
downloadUri (Just title,Just link) = do
  item <- get link
  B.writeFile title item
    where
      get url = let uri = case parseURI url of
                      Nothing …
Run Code Online (Sandbox Code Playgroud)

haskell utf-8 character-encoding

0
推荐指数
1
解决办法
430
查看次数

标头内容类型Charset UTF-8(带BOM)

我目前正在制作一些文件,必须下载和上传。该文件具有不同的编码,只有在使用带有BOM表的UTF-8打开文件时,该文件才有效。

目前我正在使用这个简单的头文件,header('Content-Type: text/html; charset=utf-8');但是我如何更改设置,因此文件文件将被视为带有BOM的UTF-8。

希望能有所帮助。谢谢!

php encode content-type header character-encoding

0
推荐指数
1
解决办法
2万
查看次数

将字符转换为UTF-8的逻辑

我有以下代码,代码中的注释表示它将任何大于7FUTF-8的字符转换为.我对此代码有以下问题:

if((const unsigned char)c > 0x7F)
  {
    Buffer[0] = 0xC0 | ((unsigned char)c >> 6);
    Buffer[1] = 0x80 | ((unsigned char)c & 0x3F);
    return Buffer;
  }
Run Code Online (Sandbox Code Playgroud)
  1. 这段代码是如何工作的?
  2. 我正在使用的当前Windows代码页是否对放置的字符有影响Buffer

c c++ utf-8 character-encoding mbcs

0
推荐指数
1
解决办法
278
查看次数

Javascript编码打破和组合多字节字符?

我打算为我的网络应用程序使用客户端AES加密.

现在,我一直在寻找方法将多字节字符分成一个字节 - '非字符',加密(具有相同的加密文本长度),

将它们解密,将这些单字节"非字符"转换回多字节字符.

我已经看过wiki for UTF-8(JS的默认编码?)和UTF-16,但我无法弄清楚如何检测"碎片"多字节字符以及如何将它们组合起来.

谢谢 : )

javascript unicode character-encoding

0
推荐指数
1
解决办法
2340
查看次数

编码到不同的charachter集Java时,数组中的随机字节

我正在尝试将文本写入字节但是当我打电话时:

Charset charset = Charset.forName("UTF-16");  
ByteBuffer bytes = charset.encode(toConvert.trim());
byte[] charsAsBytes = bytes.array();
Run Code Online (Sandbox Code Playgroud)

我得到一个以-2和-1开头的数组.这些价值来自哪里?他们是什么意思,或者我可以跳过这些.默认字符集是UTF-8.

java character-encoding

0
推荐指数
1
解决办法
89
查看次数

如何使用hashmap从java中的unicode字符串中删除重音?

我使用以下链接创建key = unicode字符值的hashmap,value是它应映射到的实际字符 - https://github.com/lmjabreu/solr-conftemplate/blob/master/mapping-ISOLatin1Accent.文本

到目前为止,我已经编写了以下代码来删除字符串中的重音符号

public class ACCENTS {

    public static void main(String[] args){

        // this is the hashmap that stores the mappings of the characters to their ascii equivalent
        HashMap<Character, Character> characterMappings = new HashMap<>();

        characterMappings.put('\u00C0', 'A');
        characterMappings.put('\u00C1', 'A');
        characterMappings.put('\u00C2', 'A');
        characterMappings.put('\u00C3', 'A');
        characterMappings.put('\u00C4', 'A');
        characterMappings.put('\u00C5', 'A');
        characterMappings.put('\u00C7','C');
        characterMappings.put('\u00C8', 'E');
        characterMappings.put('\u00C9','E');
        characterMappings.put('\u00CA', 'E');
        characterMappings.put('\u00CB', 'E');
        characterMappings.put('\u00CC', 'I');
        characterMappings.put('\u00CD', 'I');
        characterMappings.put('\u00CE', 'I');
        characterMappings.put('\u00CF', 'I');
        characterMappings.put('\u00D0', 'D');
        characterMappings.put('\u00D1', 'N');
        characterMappings.put('\u00D2', 'O');
        characterMappings.put('\u00D3', 'O');
        characterMappings.put('\u00D4', 'O');
        characterMappings.put('\u00D5', 'O');
        characterMappings.put('\u00D6', 'O');
        characterMappings.put('\u00D8', …
Run Code Online (Sandbox Code Playgroud)

java string hashmap character-encoding

0
推荐指数
1
解决办法
1429
查看次数

Java似乎无法识别正斜杠

我试图计算URL中正斜杠的数量.

但是Java和StringUtils似乎不想这样做.我怀疑它与编码有关,但使用URLDecoder似乎没有帮助.

我有:

p.rint("Product");
p.rint(url);
p.rint(StringUtils.countMatches(URLDecoder.decode("url", "UTF-8"), "/"));
Run Code Online (Sandbox Code Playgroud)

其中打印出的结果如下:

Product
http://stackoverflow.com/questions/ask
0
Run Code Online (Sandbox Code Playgroud)

如果一切按预期工作,那么打印输出的最后一行肯定应该4......

Note: p.rint() is my little hack for doing System.out.println()
Run Code Online (Sandbox Code Playgroud)

我没有使用URLDecoder.decode()也试过这个.

java string character-encoding

0
推荐指数
2
解决办法
586
查看次数

指定在iframe中加载的页面的charset

我想知道,是否可以为加载的iframe提供自定义字符集?例如,如果我有一个以www.example.com源代码命名的页面:

<meta charset=utf-7>
<html>
<body>
Test
</body>
</html>
Run Code Online (Sandbox Code Playgroud)

现在我有一个网站叫,www.example2.com我想要做的是负载www.example.comiframe并设置加载的字符集iframe页面utf-8,这可能吗?如果是这样的话?谢谢.

html browser iframe utf-8 character-encoding

0
推荐指数
1
解决办法
2万
查看次数