我正在处理PDF文件,并希望尽可能将字符转换为Unicode.MathematicalPI系列字符集似乎使用自己的符号名称(例如"H11001").通过探索,我构建了一个表(对于MathematicalPI-One),如:
<chars>
<char charname="H11001" codepoint16="0X2B" codepoint="43" unicodeName="PLUS"/>
<char charname="H11002" codepoint16="0x2D" codepoint="45" unicodeName="MINUS"/>
<char charname="H11003" codepoint16="0XD7" codepoint="215" unicodeName="MULTIPLICATION SIGN"/>
<char charname="H11005" codepoint16="0X3D" codepoint="61" unicodeName="EQUALS"/>
</char>
Run Code Online (Sandbox Code Playgroud)
任何人都可以指向我这样的现有翻译表(理想情况下适用于所有MathematicalPI集).[我不想要字形的图形显示,因为这意味着每个字母必须被查找为Unicode等价物.]
此外,似乎有一个类似的符号资源,其中的charnames的形式为C223(版权所有).任何有关这方面的信息将不胜感激.
更新:我需要的东西远远超出@ user1808924的答案 - 我已经编译了自己的(部分)转换表,所以它当然可以构建一个.可以下载并显示MathematicalPI中的字形列表(可能数百个),并通过Unicode规范进行等效(对于大多数人,我认为有明确的等价).一个令人满意的答案可能包括一个包含数百个等价的表格或一个明确的声明,这将违反字体创建者的版权.
更新:在@minopret和@Miguel之间,当然可以构建映射.MathPi集很好地定义了 - 几百个 - 并且shapecatcher可以很容易地以图形方式找到最好的字形.映射不是确定的(即使用Adobe的标记),但它是值得的.我怀疑会出现两种不同的字形基本相同的情况,因此视觉映射不起作用 - 例如是等边三角形INCREMENT还是GREEK CAPITAL LETTER DELTA?
我怀疑我个人会完成一个完整的表 - 我不知道一些符号是什么意思.但我希望生成一个用于科学技术医学(STM)出版的子集.
@ user1808924我注意到你在SO的第一天回答了这个问题.通常会提供赏金问题(如本例所示),以解决难以解决的问题,但很难找到答案.除非您具备该领域的专业知识,否则提供意见或猜测通常没有用.
以下是 Adobe 的 Miguel Sousa 在其版式论坛消息中提供的最佳信息:
对于它的价值并总结我在这个答案的评论中添加的信息,以下是我之前能够找到的内容。
CTAN包“mathalfa”的创建者和 UCSD 数学成员 Michael Sharpe 在这个存档文件中提供了数学 Pi 的 TeX 定义。我成功猜到了 me.com 上过时的记录位置已移至他的大学网站。“.vf”文件将Mathematical Pi 的字符映射到TeX 数学代码点。它们是二元的。映射数据是使用 TeX 发行版中的“vftovp”工具转储为可读文本的一部分。执行转储后,我们发现映射的字符是:
mathpibb: 'hyphen-minus' 0-9 A-Z a-z
mathpical: percent 'hyphen-minus' A-Z
mathpifrak: 'hyphen-minus' 0-9 A-Z a-z
mh2s: A-Z
Run Code Online (Sandbox Code Playgroud)
这解释了包名称“mathalfa”。他只承担了使用字母和数字的任务,但几乎没有其他任何事情。我们必须查看上面的文件以获取符号的映射。
我认为 MathPi 的某些部分(例如 MathPi 1 的希腊字母)使用与 Adobe Symbol 相同的编码,记录如下:http ://unicode.org/Public/MAPPINGS/VENDORS/ADOBE/symbol.txt
当尝试将符号自身映射到 Unicode 时,找到 Unicode 点的一个好方法是在屏幕上绘制字形: http: //shapecatcher.com
| 归档时间: |
|
| 查看次数: |
1114 次 |
| 最近记录: |