标签: turkish

Java:土耳其语编码Mac/Windows

我在不同的机器上有土耳其特殊字符的问题.以下代码:

String turkish = "?ü?ç?Ü?Ç?";

String test1 = new String(turkish.getBytes());
String test2 = new String(turkish.getBytes("UTF-8"));
String test3 = new String(turkish.getBytes("UTF-8"), "UTF-8");

System.out.println(test1);
System.out.println(test2);
System.out.println(test3);
Run Code Online (Sandbox Code Playgroud)

在Mac上,三个字符串与原始字符串相同.在Windows机器上,三行是(使用Netbeans 6.7控制台打印):

?ü?ç?Ü?Ç?
ğüşçĞÜŞÇı
?ü?ç?Ü?Ç?
Run Code Online (Sandbox Code Playgroud)

我没有遇到问题.

java turkish encoding

2
推荐指数
2
解决办法
4044
查看次数

R 中的土耳其语字符编码

有没有办法根据土耳其语更改R中的字符编码系统?

\n\n

我尝试在将 R 脚本保存为 iso-8859-9、windows-1254 或 latin5 时更改编码。最后的编码给了我最好的结果,但是当我重新加载 R 脚本时,并非所有字符都被正确保存。例如:

\n\n

原来的:

\n\n
h\xc3\xa2kimiyetinin\n\xc3\xa7\xc4\xb1k\xc4\xb1yor\n
Run Code Online (Sandbox Code Playgroud)\n\n

重新加载(第二个示例中的角色已被破坏):

\n\n
h\xc3\xa2kimiyetinin\n\xc3\xa7\xc3\xbdk\xc3\xbdyor\n
Run Code Online (Sandbox Code Playgroud)\n\n

有人有想法吗?先感谢您!

\n

turkish encoding r

2
推荐指数
1
解决办法
4190
查看次数

我如何将Java Regex用于土耳其语字符到UTF-8

我正在尝试用Java进行正则表达式操作.但是当我搜索土耳其文本时,我遇到了麻烦.例如;

Search Text = "Ahmet Y?ld?r?m" or "Esin AYDEM?R" 

//The e-mail stated in part(Ex: yildirim@example.com) , trying to look in name.
Regex Strings = "yildirim" or  "aydemir". 
Run Code Online (Sandbox Code Playgroud)

搜索的文本是动态变化的.因此,如何通过使用java正则表达式模式来解决这个问题.或者如何转换土耳其语字符(Ex: AYDEM?R convert to AYDEMIRY?ld?r?m -> Yildirim).

对不起,关于我的语法错误!...

java regex unicode turkish

2
推荐指数
2
解决办法
3111
查看次数

PHP mb_strtoupper 函数中的土耳其语字符错误

我的问题是对那些对我们有趣的角色有问题的土耳其大学的解释。

通过大写并因此整理它们,PHP 5 肯定有一个错误

echo mb_strtoupper('土耳其大写为 ?, i, ?, ? 大写', 'UTF-8');

给出结果:“土耳其大写为?,我,我,?大写”。

但这是错误的。正确的输出应该是“TURK?SH CAP?TALS FOR ?, ?, I, ? ?N UPPERCASE”

在我们的语言中,我们有大写字母“i”的问题?和 ”?” 大写字母“我”。

我想你看到了问题所在。

我们应该向谁报告PHP 中的这个错误,有人知道吗?请告知,如果您编写一个子程序来暂时解决此问题,将不胜感激。先谢谢了。

php turkish character utf-8

2
推荐指数
2
解决办法
2771
查看次数

修复土耳其字符集问题Html/PHP(iconv?)

我有显示土耳其人物的麻烦,他们在html中以背景中的钻石出现的小问号.

我如何使用iconv来解决这个问题?既然我认为那是最好的选择吧?现在我的页面是utf-8编码的.

我需要支持像这样的人物

ıñş

以及能够将它们插入我的数据库.

谢谢

php turkish character-encoding iconv

1
推荐指数
2
解决办法
1万
查看次数

Javascript非UTF-8字符搜索Google Chrome扩展程序

编辑:

我正在创建Chrome扩展程序,文件必须采用UTF-8编码.我使用JQuery从页面获取内容,并检查是否包含包含Ö,ı和İ的特定字符串.但是,因为Chrome强制文件必须编码为UTF-8; 我无法搜索"İ,ı,Ö".

var p = txt.indexOf("?"); 
Run Code Online (Sandbox Code Playgroud)

不能正常工作,因为我无法使用İ,Ö或ı保存文件.

javascript turkish utf-8 google-chrome-extension

1
推荐指数
1
解决办法
2467
查看次数

Unicode 字符到土耳其语字符

(编辑:我的原始问题已发布在此处,但问题已解决并且下面的代码是正确的)。我正在寻找有关如何将 Unicode 字符转换为土耳其语字符的建议。以下代码(在线发布)为单个用户抓取推文并输出一个 csv 文件,但土耳其语字符以 Unicode 字符形式出现,即 \xc4。我在 Mac 上使用 Python 3。

import sys

default_encoding = 'utf-8'
if sys.getdefaultencoding() != default_encoding:
    reload(sys)
    sys.setdefaultencoding(default_encoding)

import tweepy #https://github.com/tweepy/tweepy
import csv
import string
import print

#Twitter API credentials
consumer_key = ""
consumer_secret = ""
access_key = ""
access_secret = ""

def get_all_tweets(screen_name):
#Twitter only allows access to a users most recent 3240 tweets with this method

#authorize twitter, initialize tweepy
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_key, access_secret)
api = tweepy.API(auth)

#initialize a list to …
Run Code Online (Sandbox Code Playgroud)

unicode turkish python-3.x

1
推荐指数
1
解决办法
1724
查看次数

在 Python 中使用 Snowballstemmer 获取土耳其语单词列表时出现问题

我正在尝试在 Python 中使用一个名为 Snowballstemmer 的库,但它似乎没有按预期工作。原因可能是什么?请参阅下面我的代码。

\n\n

我的数据集:

\n\n
df=[[\'musteri\', \'hizmetlerine\', \'cabuk\', \'baglaniyorum\'],[\'konuda\', \'yard\xc4\xb1mc\xc4\xb1\', \'oluyorlar\', \n   \'islemlerimde\']]\n
Run Code Online (Sandbox Code Playgroud)\n\n

我已经应用了snowballstemmer包并导入TurkishStemmer

\n\n
  from snowballstemmer import TurkishStemmer\n  turkStem=TurkishStemmer()\n  data_words_nostops=[turkStem.stemWord(word) for word in df]\n  data_words_nostops\n\n  [[\'musteri\', \'hizmetlerine\', \'cabuk\', \'baglaniyorum\'],\n   [\'konuda\', \'yard\xc4\xb1mc\xc4\xb1\', \'oluyorlar\', \'islemlerimde\']]\n
Run Code Online (Sandbox Code Playgroud)\n\n

不幸的是它没有起作用。但是当我将它应用于单个单词时,它按预期工作:

\n\n
 turkStem.stemWord("islemlerimde")\n \'islem\'\n
Run Code Online (Sandbox Code Playgroud)\n\n

可能是什么问题呢?任何帮助将不胜感激。

\n\n

谢谢。

\n

python turkish nlp list

1
推荐指数
1
解决办法
2426
查看次数