好的,
所以我的问题是我有一个XML Tamil(unicode)feed,我想把它拿出来并在Android应用程序中显示它.
当我尝试这样做时,由于Android没有泰米尔语的本机支持,必须使用自定义字体.
但随后出现了问题,因为unicode中的渲染完全不同.我该如何解决这个问题?
我有一个TextView,其间有一个巨大的文本我有一个泰米尔语单词,我知道如何在单独的textview中嵌入泰米尔字体.但我需要英语单词之间的泰米尔语请提前帮助谢谢
我在textview中的部分文字:
Kolam使用了欢迎(நல்வரவு)等季节性消息.当一个奉献者的时候,有时候会在寺庙里做志愿者去画kolam
我在Android版本中开发了一个泰米尔语新闻应用程序2.3.3
.但是,泰米尔语字体只能在Android 4.0及更高版本中正确开发.我想在所有版本的Android手机中显示它们.
我试图解决一些泰米尔语字体的问题,比如bamini
和mylai
,但它们只适用于较高的Android版本.
如何在字符串中拆分泰米尔语字符?
当我使用时preg_match_all('/./u', $str, $results)
,
我得到的字符是"த","ம","ி","ழ"和"்".
如何获得组合字符"த","மி"和"ழ்"?
我需要将unicode字符串转换为unicode字符.
例如:语言泰米尔语
"கமலி"> 'க', 'ம', 'லி'
我能够剥离unicode字节,但生成unicode字符成为问题.
byte[] stringBytes = Encoding.Unicode.GetBytes("????");
char[] stringChars = Encoding.Unicode.GetChars(stringBytes);
foreach (var crt in stringChars)
{
Trace.WriteLine(crt);
}
Run Code Online (Sandbox Code Playgroud)
它给出了结果:
'க'=> 0 x0b95
'ம'=> 0 x0bae
'ல'=> 0 x0bb2
'ி'=> 0 x0bbf
所以这里的问题是如何将字符'லி'剥离为'லி'而不像'ல','ி'那样分裂.
因为它通过将辅音和元音表示为单个字符而使用c#解析而使用印度语是很自然的.
所有我需要分成3个字符.
我正在实施泰米尔语的词法分析.我需要通过以下条件替换Text Element值
string[] ugaramStrings = { "??", "??", "??", "??", "??", "??" };
string[] tamilvowels =
{
"?",// "\u0b85"
"?",//"\u0b86"
"?",//"\u0b87"
"?",//"\u0b88"
"?",//"\u0b89"
"?",//"\u0b8A"
"?",// "\u0b8E"
"?",//"\u0b8F"
"?",//"\u0b90"
"?",//"\u0b92"
"?",//"\u0b93"
"?"//"\u0b94"
};
Run Code Online (Sandbox Code Playgroud)
如果任何单词具有来自ugaramStrings和tamil元音元素的元素连续.是需要替换ugaram字符串并返回值.
例如,அமர்ந்*துஇ*னிது被替换为அமர்ந்*இ*னிது.即துஇ=>இ
我通过使用TextElementEnumerator Class 检查下一个字符串元素来完成它.是否有可能使用RegularExpression替换它
在我的桌面应用程序中,我在ComboBox Font属性中使用tamil字体(不是unicode,而是字形).
当我输入它时它显示得很好.但是我在DropDown框中的自动建议显示为默认字体.如何更改该字体?
Private Sub Billing_Shown(ByVal sender As Object, ByVal e As System.EventArgs) Handles Me.Shown
If My.Settings.Options_Display_UseOtherLanguage Then
CustomerNameCombo.Font = My.Settings.Options_Display_OtherLanguageFont
End If
End Sub
Run Code Online (Sandbox Code Playgroud)
我使用的是.NET Framework v4.0
这是泰米尔语unicode代码点列表
[u'\ u0b9a',u'\ u0b9f',u'\ u0bcd',u'\ u0b9f',u'\ u0b9a',u'\ u0baa',u'\ u0bc8',u'\ u0baf',u '\ u0bbf',u'\ u0bb2',u'\ u0bcd',u'\ u0ba8',u'\ u0bc'',u'\ u0bb1',u'\ u0bcd',u'\ u0bb1',u'\ u0bc1]
如何将其转换为可读字符串?
我正在使用JSTL fmt
taglib来显示泰米尔语字符.但我无法显示任何泰米尔人的角色.它没有显示泰米尔语字符,而是显示问号字符??????
.我试过印地语,它也显示了问号.我现在应该怎么做?
这是我的代码.我只是尝试在泰米尔语中打印Hello World.
fileproperty.properties
:
helloworld=??????? ?????
Run Code Online (Sandbox Code Playgroud)
Hello.jsp
:
<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%>
<%@ taglib prefix="fmt" uri="http://java.sun.com/jsp/jstl/fmt" %>
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org /TR/html4/loose.dtd">
<html>
<fmt:setLocale value="ta-IN"/>
<fmt:setBundle basename="fileproperty"/>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<title>Home</title>
</head>
<body>
<fmt:message key="helloworld"/>
</body>
</html>
Run Code Online (Sandbox Code Playgroud)