标签: turkish

Java:土耳其语编码Mac/Windows

我在不同的机器上有土耳其特殊字符的问题.以下代码:

String turkish = "?ü?ç?Ü?Ç?";

String test1 = new String(turkish.getBytes());
String test2 = new String(turkish.getBytes("UTF-8"));
String test3 = new String(turkish.getBytes("UTF-8"), "UTF-8");

System.out.println(test1);
System.out.println(test2);
System.out.println(test3);

Run Code Online (Sandbox Code Playgroud)

在Mac上,三个字符串与原始字符串相同.在Windows机器上,三行是(使用Netbeans 6.7控制台打印):

?ü?ç?Ü?Ç?
ÄŸÃ¼ÅŸÃ§ÄžÃœÅžÃ‡Ä±
?ü?ç?Ü?Ç?

Run Code Online (Sandbox Code Playgroud)

我没有遇到问题.

java turkish encoding

Jur*_*ass

2009 12-15

2
推荐指数

2
解决办法

4044
查看次数

R 中的土耳其语字符编码

有没有办法根据土耳其语更改R中的字符编码系统？

\n\n

我尝试在将 R 脚本保存为 iso-8859-9、windows-1254 或 latin5 时更改编码。最后的编码给了我最好的结果，但是当我重新加载 R 脚本时，并非所有字符都被正确保存。例如：

\n\n

原来的：

\n\n

h\xc3\xa2kimiyetinin\n\xc3\xa7\xc4\xb1k\xc4\xb1yor\n

Run Code Online (Sandbox Code Playgroud)\n\n

重新加载（第二个示例中的角色已被破坏）：

\n\n

h\xc3\xa2kimiyetinin\n\xc3\xa7\xc3\xbdk\xc3\xbdyor\n

Run Code Online (Sandbox Code Playgroud)\n\n

有人有想法吗？先感谢您！

turkish encoding r

OAM*_*OAM

lucky-day

2
推荐指数

1
解决办法

4190
查看次数

我如何将Java Regex用于土耳其语字符到UTF-8

我正在尝试用Java进行正则表达式操作.但是当我搜索土耳其文本时,我遇到了麻烦.例如;

Search Text = "Ahmet Y?ld?r?m" or "Esin AYDEM?R" 

//The e-mail stated in part(Ex: yildirim@example.com) , trying to look in name.
Regex Strings = "yildirim" or  "aydemir".

Run Code Online (Sandbox Code Playgroud)

搜索的文本是动态变化的.因此,如何通过使用java正则表达式模式来解决这个问题.或者如何转换土耳其语字符(Ex: AYDEM?R convert to AYDEMIR 或Y?ld?r?m -> Yildirim).

对不起,关于我的语法错误!...

java regex unicode turkish

Jun*_*por

2015 08-20

2
推荐指数

2
解决办法

3111
查看次数

PHP mb_strtoupper 函数中的土耳其语字符错误

我的问题是对那些对我们有趣的角色有问题的土耳其大学的解释。

通过大写并因此整理它们，PHP 5 肯定有一个错误。

echo mb_strtoupper('土耳其大写为 ?, i, ?, ? 大写', 'UTF-8');

给出结果：“土耳其大写为？，我，我，？大写”。

但这是错误的。正确的输出应该是“TURK?SH CAP?TALS FOR ?, ?, I, ? ?N UPPERCASE”

在我们的语言中，我们有大写字母“i”的问题？和 ”？” 大写字母“我”。

我想你看到了问题所在。

我们应该向谁报告PHP 中的这个错误，有人知道吗？请告知，如果您编写一个子程序来暂时解决此问题，将不胜感激。先谢谢了。

php turkish character utf-8

Meh*_*zer

2017 08-05

2
推荐指数

2
解决办法

2771
查看次数

修复土耳其字符集问题Html/PHP(iconv？)

我有显示土耳其人物的麻烦,他们在html中以背景中的钻石出现的小问号.

我如何使用iconv来解决这个问题？既然我认为那是最好的选择吧？现在我的页面是utf-8编码的.

我需要支持像这样的人物

ıñş

以及能够将它们插入我的数据库.

谢谢

php turkish character-encoding iconv

Bel*_*ish

2011 02-26

1
推荐指数

2
解决办法

1万
查看次数

Javascript非UTF-8字符搜索Google Chrome扩展程序

编辑:

我正在创建Chrome扩展程序,文件必须采用UTF-8编码.我使用JQuery从页面获取内容,并检查是否包含包含Ö,ı和İ的特定字符串.但是,因为Chrome强制文件必须编码为UTF-8; 我无法搜索"İ,ı,Ö".

var p = txt.indexOf("?");

Run Code Online (Sandbox Code Playgroud)

不能正常工作,因为我无法使用İ,Ö或ı保存文件.

javascript turkish utf-8 google-chrome-extension

Mus*_*afa

2011 06-05

1
推荐指数

1
解决办法

2467
查看次数

Unicode 字符到土耳其语字符

（编辑：我的原始问题已发布在此处，但问题已解决并且下面的代码是正确的）。我正在寻找有关如何将 Unicode 字符转换为土耳其语字符的建议。以下代码（在线发布）为单个用户抓取推文并输出一个 csv 文件，但土耳其语字符以 Unicode 字符形式出现，即 \xc4。我在 Mac 上使用 Python 3。

import sys

default_encoding = 'utf-8'
if sys.getdefaultencoding() != default_encoding:
    reload(sys)
    sys.setdefaultencoding(default_encoding)

import tweepy #https://github.com/tweepy/tweepy
import csv
import string
import print

#Twitter API credentials
consumer_key = ""
consumer_secret = ""
access_key = ""
access_secret = ""

def get_all_tweets(screen_name):
#Twitter only allows access to a users most recent 3240 tweets with this method

#authorize twitter, initialize tweepy
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_key, access_secret)
api = tweepy.API(auth)

#initialize a list to …

Run Code Online (Sandbox Code Playgroud)

unicode turkish python-3.x

bay*_*rah

2016 09-14

1
推荐指数

1
解决办法

1724
查看次数

在 Python 中使用 Snowballstemmer 获取土耳其语单词列表时出现问题

我正在尝试在 Python 中使用一个名为 Snowballstemmer 的库，但它似乎没有按预期工作。原因可能是什么？请参阅下面我的代码。

\n\n

我的数据集：

\n\n

df=[[\'musteri\', \'hizmetlerine\', \'cabuk\', \'baglaniyorum\'],[\'konuda\', \'yard\xc4\xb1mc\xc4\xb1\', \'oluyorlar\', \n   \'islemlerimde\']]\n

Run Code Online (Sandbox Code Playgroud)\n\n

我已经应用了snowballstemmer包并导入TurkishStemmer

\n\n

  from snowballstemmer import TurkishStemmer\n  turkStem=TurkishStemmer()\n  data_words_nostops=[turkStem.stemWord(word) for word in df]\n  data_words_nostops\n\n  [[\'musteri\', \'hizmetlerine\', \'cabuk\', \'baglaniyorum\'],\n   [\'konuda\', \'yard\xc4\xb1mc\xc4\xb1\', \'oluyorlar\', \'islemlerimde\']]\n

Run Code Online (Sandbox Code Playgroud)\n\n

不幸的是它没有起作用。但是当我将它应用于单个单词时，它按预期工作：

\n\n

 turkStem.stemWord("islemlerimde")\n \'islem\'\n

Run Code Online (Sandbox Code Playgroud)\n\n

可能是什么问题呢？任何帮助将不胜感激。

\n\n

谢谢。

python turkish nlp list

mel*_*lik

2020 05-03

1
推荐指数

1
解决办法

2426
查看次数

标签统计

turkish ×8

encoding ×2

java ×2

php ×2

unicode ×2

utf-8 ×2

character ×1

character-encoding ×1

google-chrome-extension ×1

iconv ×1

javascript ×1

list ×1

nlp ×1

python ×1

python-3.x ×1

r ×1

regex ×1

标签 统计

标签统计