在我正在制作的网站上,我在IE8中调整日文字符时遇到了一些问题.
我有类似的东西<span>Label</span><span>Some value</span>
.当"标签"和"某些值"都是日语或英语时,它们对齐很好,但当它们混合时("标签"总是日语,但"某些值"可能不是),则对齐关闭.如下图所示:
令人惊讶的是,它在其他浏览器中运行良好,例如来自Chrome的相同图像:
我无法弄清楚如何解决这个问题.有没有人遇到过这个问题或知道解决方法呢?我的公司仍然主要使用IE7,所以一些可行的技巧将是最有用的.
编辑1:我忘了添加我正在使用的CSS.对于我有的标签:
display: inline-block;
color: Gray;
vertical-align: text-top;
/*For IE7*/
zoom: 1;
*display: inline;
Run Code Online (Sandbox Code Playgroud)
对于我正在使用类似的值的值:
display: inline-block;
margin: 0x 0px 0px 0px;
padding: 0px 0px 0px 0px;
vertical-align: text-top;
/*For IE7*/
zoom: 1;
*display: inline;
Run Code Online (Sandbox Code Playgroud)
编辑2:我确定这与这个问题有关.我的表格中有输入框,完全对齐,直到输入一些日文字符.对于罗马字符再没有问题.见下文:
再次,在其他浏览器中没有任何问题......
编辑3:
今天再看看这个(我提出这个问题后一年多了......).在IE9中,字符显示就像在Chrome和其他浏览器中一样,基本上罗马语和日语单词都正确排列.我使用IETester检查了它,对于同一页面,日语字体在IE8中比IE9"更高".
在IE8中:
在IE9中:
我当时没有检查这个,因为我没有IE9.字体看起来完全相同,所以它必须是一个IE问题,我猜是没有什么可以做的呢?
这里有一个sentiment analysis
带有NLTK
(python)的演示http://text-processing.com/demo/sentiment/.
还有关于情绪分析部分的教程
在亚洲语言的情绪分析中是否有任何完整的代码示例或使用python NLTK的工作项目?(特别是中文,日文,韩文或阿拉伯文,希伯来文和波斯文)
使用Ruby,我必须以列式格式输出字符串到终端.像这样的东西:
| row 1 | a string here | etc
| row 2 | another string | etc
Run Code Online (Sandbox Code Playgroud)
我可以使用String#ljust和%s对拉丁文UTF8字符做得很好.
但是当字符是韩文,中文等时出现问题.当有英文行穿插包含韩文等的行时,列不会对齐.
我怎样才能在这里获得列对齐?有没有办法输出相当于固定宽度字体的亚洲字符?如何在Vim中显示和编辑文档?
我的Java应用程序使用iText创建PDF.有时内容是亚洲的,这是行不通的.亚洲人物不可见.
我iTextAsian.jar
在iText下载页面上找到了,但不知道如何使用它.
目标是使用我喜欢的字体作为默认字体.但是当一个角色不可用时,该角色将使用其他字体.我看过,iText可以自动选择字体,但是如何配置?
我还希望所有必需的字体都包含在PDF中,因此用户无需在其计算机上安装亚洲字体.
我正在开发一个项目,需要输入旧的韩文音节块(即使用过时字符的韩文音节块,例如 \xe3\x86\x85 和 \xe3\x85\xbf,位于 Hangul Compatibility Jamo 中unicode 块),但我一直很难将这些块显示为整个块(如 \xeb\xa3\xb0),而不是一串分隔的字形(如 \xe1\x85\x98\xe1\x86\ x87\xe1\x87\x88)。显然,字符串 \xe3\x84\xb1\xe3\x85\x8f\xe3\x85\x81、\xea\xb0\x80\xe3\x85\x81 和 \xea\xb0\x90 彼此等效,但是韩文字体的“GSUB 特征”在不同程度上将它们联系在一起。根据我收集的信息,类似的过程也适用于 Hangul Jamo,其中猜测元音后面的块将如何形成(就像 \xe3\x84\xb1 之间的区别) xea\xb5\xac 和 \xea\xb8\xb0) 以及它是否有结尾辅音(如 \xea\xb0\x80 和 \xea\xb0\x88 中的 \xe3\x84\xb1 之间的区别)。
\n\n我想这类似于组合变音符号的工作方式,其中它会猜测大写 A\xcc\x81 和小写 a\xcc\x81 的高度差。有很多拉丁字体不支持组合字符,考虑到虽然 \xe3\x84\xb1\xe3\x85\x8f\xe3\x85\x81、\xea\xb0\x80\xe3\x85\x81、和 \xea\xb0\x90 是相等的,最后 \xea\xb0\x90 是一个预组合字符,Hangul Jamo unicode 块的整个目的是(根据维基百科上的文章)“动态地用于组成在 Unicode 中无法作为预先组成的韩文音节使用的音节,特别是包含后来在现代发音中与其他声音在语音上合并的声音的古老音节。” 这让我想知道 Hangul Jamo 的行为是否更像空间修改字符,需要 { EQ \\o(X1,X2) } 与各自的字符组合。
\n\n我读过的大部分内容都是关于字体设计和命令行的,这使得作者所做的不仅仅是在文字处理器上输入过时的字符,但你看: https: //github.com/adobe -fonts/source-han-sans/issues/34。发帖者和评论员正在尝试找出垂直形式的韩文字字组成,但他们已经在文字处理程序中水平组成了音节块,但无处可寻。
\n由DynamicJasper生成的我的PDF现在看起来完全符合预期,我只面临一个问题:在生成的PDF中根本不显示亚洲字符.任何其他角色都可以.我可以在调试器中验证字符串是否正确放置在JRDataSource中,而Jasper确实在报告中为它们生成了行,但文本本身完全缺失.
将DynamicJasper与亚洲文本元素一起使用时,是否还需要考虑其他一些编码设置?
感谢您的任何建议和最好的问候
self.logger.info(msg)
popinstance=poplib.POP3(self.account[0])
self.logger.info(popinstance.getwelcome())
popinstance.user(self.account[1])
popinstance.pass_(self.account[2])
try:
(numMsgs, totalSize)=popinstance.stat()
self.logger.info("POP contains " + str(numMsgs) + " emails")
for thisNum in xrange(1, numMsgs + 1):
try:
(server_msg, body, octets)=popinstance.retr(thisNum)
except:
self.logger.error("Could not download email")
raise
text="\n".join(body)
mesg=StringIO.StringIO(text)
msg=rfc822.Message(mesg)
MessageID=email.Utils.parseaddr(msg["Message-ID"])[1]
self.logger.info("downloading email " + MessageID)
emailpath=os.path.join(self._emailpath + self._inboxfolder + "\\" + self._sanitize_string(MessageID + ".eml"))
emailpath=self._replace_whitespace(emailpath)
try:
self._dual_dump(text,emailpath)
except:
pass
self.logger.info(popinstance.dele(thisNum))
finally:
self.logger.info(popinstance.quit())
Run Code Online (Sandbox Code Playgroud)
(server_msg,body,octets)= popinstance.retr(thisNum)在电子邮件包含中文字符时在电子邮件正文中返回= 20.
我该如何处理?
电子邮件的原始文本:
主题:(提单:4363-0192-809.015)SI FOR 15680XXXX436
= 20
亲
= 20
SI封闭
PLS向我们发送BL草案和债务说明
= 20
TKS
= 20
肉豆蔻酸 …