如何从 .png 文件中提取 Unicode 字符？

语言

目前有适用于以下语言的语言包：

ara（阿拉伯语）、aze（阿塞拜疆语）、bul（保加利亚语）、cat（加泰罗尼亚语）、ces（捷克语）、chi_sim（简体中文）、chi_tra（繁体中文）、chr（切诺基语）、dan（丹麦语）、dan-frak （丹麦语（Fraktur））、deu（德语）、ell（希腊语）、eng（英语）、enm（古英语）、epo（世界语）、est（爱沙尼亚语）、fin（芬兰语）、fra（法语）、frm（古法语）、glg（加利西亚语）、heb（希伯来语）、hin（印地语）、hrv（克罗地亚语）、hun（匈牙利语）、ind（印度尼西亚语）、ita（意大利语）、jpn（日语）、kor（韩语）、lav （拉脱维亚语）、lit（立陶宛语）、nld（荷兰语）、nor（挪威语）、pol（波兰语）、por（葡萄牙语）、ron（罗马尼亚语）、rus（俄语）、slk（斯洛伐克语）、slv（斯洛文尼亚语）、sqi （阿尔巴尼亚语）、spa（西班牙语）、srp（塞尔维亚语）、swe（瑞典语）、tam（泰米尔语）、tel（泰卢固语）、tgl（他加禄语）、tha（泰语）、tur（土耳其语）、ukr（乌克兰语）、vie （越南语）

要使用名为 foo.traineddata 的非标准语言包，请设置 TESSDATA_PREFIX 环境变量，以便可以在 TESSDATA_PREFIX/tessdata/foo.traineddata 中找到该文件，并为 Tesseract 提供参数 -l foo。

源TESERACT(1) 手册页

归档时间：	10 年，4 月前
查看次数：	1544 次
最近记录：	10 年，4 月前