我在不同的机器上有土耳其特殊字符的问题.以下代码:
String turkish = "?ü?ç?Ü?Ç?";
String test1 = new String(turkish.getBytes());
String test2 = new String(turkish.getBytes("UTF-8"));
String test3 = new String(turkish.getBytes("UTF-8"), "UTF-8");
System.out.println(test1);
System.out.println(test2);
System.out.println(test3);
Run Code Online (Sandbox Code Playgroud)
在Mac上,三个字符串与原始字符串相同.在Windows机器上,三行是(使用Netbeans 6.7控制台打印):
?ü?ç?Ü?Ç?
ğüşçĞÜŞÇı
?ü?ç?Ü?Ç?
Run Code Online (Sandbox Code Playgroud)
我没有遇到问题.
有没有办法根据土耳其语更改R中的字符编码系统?
\n\n我尝试在将 R 脚本保存为 iso-8859-9、windows-1254 或 latin5 时更改编码。最后的编码给了我最好的结果,但是当我重新加载 R 脚本时,并非所有字符都被正确保存。例如:
\n\n原来的:
\n\nh\xc3\xa2kimiyetinin\n\xc3\xa7\xc4\xb1k\xc4\xb1yor\nRun Code Online (Sandbox Code Playgroud)\n\n重新加载(第二个示例中的角色已被破坏):
\n\nh\xc3\xa2kimiyetinin\n\xc3\xa7\xc3\xbdk\xc3\xbdyor\nRun Code Online (Sandbox Code Playgroud)\n\n有人有想法吗?先感谢您!
\n我正在尝试用Java进行正则表达式操作.但是当我搜索土耳其文本时,我遇到了麻烦.例如;
Search Text = "Ahmet Y?ld?r?m" or "Esin AYDEM?R"
//The e-mail stated in part(Ex: yildirim@example.com) , trying to look in name.
Regex Strings = "yildirim" or "aydemir".
Run Code Online (Sandbox Code Playgroud)
搜索的文本是动态变化的.因此,如何通过使用java正则表达式模式来解决这个问题.或者如何转换土耳其语字符(Ex: AYDEM?R convert to AYDEMIR 或Y?ld?r?m -> Yildirim).
对不起,关于我的语法错误!...
我的问题是对那些对我们有趣的角色有问题的土耳其大学的解释。
通过大写并因此整理它们,PHP 5 肯定有一个错误。
echo mb_strtoupper('土耳其大写为 ?, i, ?, ? 大写', 'UTF-8');
给出结果:“土耳其大写为?,我,我,?大写”。
但这是错误的。正确的输出应该是“TURK?SH CAP?TALS FOR ?, ?, I, ? ?N UPPERCASE”
在我们的语言中,我们有大写字母“i”的问题?和 ”?” 大写字母“我”。
我想你看到了问题所在。
我们应该向谁报告PHP 中的这个错误,有人知道吗?请告知,如果您编写一个子程序来暂时解决此问题,将不胜感激。先谢谢了。
我有显示土耳其人物的麻烦,他们在html中以背景中的钻石出现的小问号.
我如何使用iconv来解决这个问题?既然我认为那是最好的选择吧?现在我的页面是utf-8编码的.
我需要支持像这样的人物
ıñş
以及能够将它们插入我的数据库.
谢谢
编辑:
我正在创建Chrome扩展程序,文件必须采用UTF-8编码.我使用JQuery从页面获取内容,并检查是否包含包含Ö,ı和İ的特定字符串.但是,因为Chrome强制文件必须编码为UTF-8; 我无法搜索"İ,ı,Ö".
var p = txt.indexOf("?");
Run Code Online (Sandbox Code Playgroud)
不能正常工作,因为我无法使用İ,Ö或ı保存文件.
(编辑:我的原始问题已发布在此处,但问题已解决并且下面的代码是正确的)。我正在寻找有关如何将 Unicode 字符转换为土耳其语字符的建议。以下代码(在线发布)为单个用户抓取推文并输出一个 csv 文件,但土耳其语字符以 Unicode 字符形式出现,即 \xc4。我在 Mac 上使用 Python 3。
import sys
default_encoding = 'utf-8'
if sys.getdefaultencoding() != default_encoding:
reload(sys)
sys.setdefaultencoding(default_encoding)
import tweepy #https://github.com/tweepy/tweepy
import csv
import string
import print
#Twitter API credentials
consumer_key = ""
consumer_secret = ""
access_key = ""
access_secret = ""
def get_all_tweets(screen_name):
#Twitter only allows access to a users most recent 3240 tweets with this method
#authorize twitter, initialize tweepy
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_key, access_secret)
api = tweepy.API(auth)
#initialize a list to …Run Code Online (Sandbox Code Playgroud) 我正在尝试在 Python 中使用一个名为 Snowballstemmer 的库,但它似乎没有按预期工作。原因可能是什么?请参阅下面我的代码。
\n\n我的数据集:
\n\ndf=[[\'musteri\', \'hizmetlerine\', \'cabuk\', \'baglaniyorum\'],[\'konuda\', \'yard\xc4\xb1mc\xc4\xb1\', \'oluyorlar\', \n \'islemlerimde\']]\nRun Code Online (Sandbox Code Playgroud)\n\n我已经应用了snowballstemmer包并导入TurkishStemmer
\n\n from snowballstemmer import TurkishStemmer\n turkStem=TurkishStemmer()\n data_words_nostops=[turkStem.stemWord(word) for word in df]\n data_words_nostops\n\n [[\'musteri\', \'hizmetlerine\', \'cabuk\', \'baglaniyorum\'],\n [\'konuda\', \'yard\xc4\xb1mc\xc4\xb1\', \'oluyorlar\', \'islemlerimde\']]\nRun Code Online (Sandbox Code Playgroud)\n\n不幸的是它没有起作用。但是当我将它应用于单个单词时,它按预期工作:
\n\n turkStem.stemWord("islemlerimde")\n \'islem\'\nRun Code Online (Sandbox Code Playgroud)\n\n可能是什么问题呢?任何帮助将不胜感激。
\n\n谢谢。
\n