标签: iso-8859-1

utf-8到iso-8859-1编码问题

我正在尝试在另一个网站上预览来自rss feed的最新帖子.Feed是UTF-8编码的,而网站是ISO-8859-1编码的.在显示标题时,我正在使用;

 $post_title = 'Blogging – does it pay the bills?';

 echo mb_convert_encoding($post_title, 'iso-8859-1','utf-8');

 // returns: Blogging ? does it pay the bills?
 // expected: Blogging - does it pay the bills?
Run Code Online (Sandbox Code Playgroud)

请注意,我期待的连字符不是正常的减号,而是一些大笨钟.好吧,反正还要几个像素.:)不确定如何描述它,因为我的键盘无法生成该字符...

php rss encoding utf-8 iso-8859-1

1
推荐指数
2
解决办法
1万
查看次数

如何使用Perl将一堆文件从ISO-8859-1转换为UTF-8?

我有几个文件需要从ISO-8859-1转换为UTF-8(当然没有BOM).但这是个问题.我有这么多文件(实际上是文件的混合,一些UTF-8和一些ISO-8859-1)我需要一种自动转换方式.不幸的是,我只安装了ActivePerl,对该语言的编码知之甚少.我可能能够安装PHP,但我不确定,因为这不是我的个人电脑.

只是你知道,我使用Scite或Notepad ++,但两者都没有正确转换.例如,如果我在捷克语中打开包含字符"ž"的文档并转到Notepad ++中的"转换为UTF-8"选项,则会错误地将其转换为不可读的字符.

有一种方法可以转换它们,但它很乏味.如果我打开带有特殊字符的文档并将文档复制到Windows剪贴板,然后将其粘贴到UTF-8文档中并保存,就可以了.对于我拥有的文档数量而言,这太繁琐(打开每个文件并复制/粘贴到新文档中).

有任何想法吗?谢谢!!!

php perl utf-8 iso-8859-1

1
推荐指数
1
解决办法
2273
查看次数

什么样的键盘布局可以输入ISO 8859-1字符?

什么样的键盘布局可以输入ISO 8859-1字符?

需要输入的例子有: -

ÁnamàbìaèbèaÓgbuá

foreign-keys iso-8859-1 internationalization character-encoding

1
推荐指数
1
解决办法
2969
查看次数

转换"å" "ö" 正常的代表

我正在加载一个网页System.Net.WebClient.页面正在ISO-8859-1编码中.如果我将其写入文件然后打开,我可以正常看到所有字符.

但是如果我将这些内容放入HtmlAgilityPack然后提取innerText属性,我会得到一些特殊的字母编码为åö.

如何将它们转换为正常表示?

c# iso-8859-1 character-encoding html-agility-pack

1
推荐指数
1
解决办法
3809
查看次数

PHP CSV编码不是utf-8

我正在使用PHP生成CSV文件并将其保存在硬盘上(我不想下载).数据库字符集就是utf8_general_ci那里的字符,就像°degree sign()一样,在PHPmyadmin中完美显示.这些字符需要保存在CSV文件中.我所做的一切都是UTF-8,但文件会随编码一起保存ISO-8859-1.如果我开始使用该utf8_encode函数,Â当我将其转换回UTF-8excel或任何其他文本编辑器时,其他字符显示up().我不知道出了什么问题,我花了好几个小时跟踪它,没有成功.

我试过SET NAMES utf8确定它是UTF-8,但这只会导致更奇怪的字符和没有UTF-8编码.使用MySQLi也是set_charset如此.使用标题作为Content-type:text/html;charset=UTF-8CSV仍然没有utf-8作为默认编码,也没有任何这些组合.

一些代码:

header("Content-type:text/html;charset=UTF-8");
$rMysqli = new mysqli("localhost", "user", "pass", "database");
$rCSV = fopen("test_".time().".csv", 'w');

$aCSVdata = array($var1, $var2, $var3);
fputcsv($rCSV, $aCSVdata, ",", "\"");

fclose($rCSV);
Run Code Online (Sandbox Code Playgroud)

这几乎都在发生.只是普通的CSV数据,只有特殊的字符,如°Ø.

php csv utf-8 iso-8859-1 character-encoding

1
推荐指数
1
解决办法
3799
查看次数

检查字符串是否仅包含有效的ISO 8859-1字符

如何检查字符串是否只包含字符,可以在ISO 8859-1中成功编码?或换句话说 - 如何在字符串中找到"非法"/"非ISO 8859-1兼容"字符?

c# string encoding iso-8859-1 character-encoding

1
推荐指数
1
解决办法
5165
查看次数

使用ISO-8859-1进行Java快速流复制

我有以下代码,它将读入ISO-8859-1中的文件,因为这是本应用程序所需的,

private static String readFile(String filename) throws IOException {




String lineSep = System.getProperty("line.separator");
File f = new File(filename);
StringBuffer sb = new StringBuffer();
if (f.exists()) {
 BufferedReader br =
 new BufferedReader(
   new InputStreamReader(
              new FileInputStream(filename), "ISO-8859-1"));

 String nextLine = "";
 while ((nextLine = br.readLine()) != null) {
   sb.append(nextLine+ " ");
   // note:  BufferedReader strips the EOL character.
  // sb.append(lineSep);
 }
  br.close();
}

return sb.toString();
}
Run Code Online (Sandbox Code Playgroud)

问题是它很慢.我有这个功能,它更快,但我似乎无法找到如何放置字符编码:

private static String fastStreamCopy(String filename)
{
   String s = "";
FileChannel fc = null; …
Run Code Online (Sandbox Code Playgroud)

java iso-8859-1

1
推荐指数
1
解决办法
653
查看次数

如何将编码的替换字符设置为ISO-8859-1

Encode模块的文档说明了在编码时处理格式错误的字符:

CHECK = Encode :: FB_DEFAULT(== 0)

如果CHECK为0,则编码和解码将替换任何格式错误的字符替换为替换字符.编码时,使用SUBCHAR.

如何指定或至少查询特定编码的替换字符.我很感兴趣iso-8859-1.

perl iso-8859-1 character-encoding

1
推荐指数
1
解决办法
257
查看次数

如何在Notepad ++中将文件的编码转换为ISO-8859-1?

我有一个UTF-8文件,我需要将其转换为iso-8859-1.我知道notepad ++可以转换编码,你点击转换为ANSI,例如,你修改了你的文件,你可以通过变为红色的保存按钮看到它.我知道转换是改变字节,这就是我想要的!但我不知道如何在notepad ++中选择我想要的编码.只有5种编码可供选择:ANSI; UTF-8无BOM; UTF-8; UCS-2 Big Endian; UCS-2 Little Endian.我该如何选择另一个?

encoding notepad++ iso-8859-1

1
推荐指数
1
解决办法
2万
查看次数

在python中使用表情符号读取.txt

我尝试读取其中带有笑脸的聊天记录,但出现以下错误:

UnicodeDecodeError:“ charmap”编解码器无法解码位置38的字节0x9d:字符映射到

我的代码如下所示:

file_name = "chat_file.txt"
chat = open(chat_file)
chatText = chat.read() # read data
chat.close()
print(chatText)
Run Code Online (Sandbox Code Playgroud)

我可以肯定这是由于诸如以下的元素:

如何实现正确的转换格式//什么是正确的文件编码,以便python可以读取这些元素?

text iso-8859-1 python-3.x

1
推荐指数
1
解决办法
377
查看次数