我正在开发一个项目,我必须开发OCR算法(我必须从Image中读取文本,然后将其转换为不同的语言).所以我的第一个任务是从图像中获取文本.
完成第一项任务的步骤.
结果


检测分辨率和反转等图像特征.这样我们最终可以将其转换为拉直图像以进行进一步处理.(完成了Image的旋转代码但是无法检测到我们必须旋转Image的Image角度,所以仍然在角度检测部分工作)
线路检测和删除.此步骤需要改进页面布局分析,以获得更好的下划线文本识别质量,检测表格等.(决定完成该部分的结束)
页面布局分析.在此步骤中,我尝试识别图像中存在的文本区域.因此,只有那部分用于识别,并且省略了该区域的其余部分.
检测文本行和单词.在这里,我们还需要处理不同的字体大小和单词之间的小空格.
识别人物.这是OCR的主要算法; 必须将每个字符的图像转换为适当的字符代码.有时,该算法会为不确定图像生成多个字符代码.例如,识别"I"字符的图像可以产生"I","|" 稍后将选择"1","l"代码和最终字符代码.
将结果保存为选定的输出格式,例如,可搜索的PDF,DOC,RTF,TXT.保存原始页面布局非常重要:列,字体,颜色,图片,背景等.
所以我在part6中需要帮助.我已经完成了行检测部分(从包含n行的段落中获取n个图像)但是在下一部分中卡住了单词和字符识别.如果您知道与OCR和字符识别部分相关的良好链接,那么请发布这里.
对于字符识别我想使用asprise(Java库)http://asprise.com/product/ocr/index.php?lang=java
我想禁用一个滚动条QGraphicsWebView.它在文档中说:
"......如果网页内容大于此值,如果未明确禁用,则会显示滚动条."
我似乎找不到禁用滚动条的方法.
我需要禁用滚动条,因为我想在拖动时实现滚动,我不希望它们被显示.
我安装了JDK 1.7,我需要创建一个Java Web Start应用程序.我搜索了互联网,发现你需要在项目构建路径中使用jnlp.jar.
有一个类似的问题(http://stackoverflow.com/questions/7593029/where-can-i-download-jnlp-jar)用户说它在jdk文件夹中,特别是在C:\ Program Files\Java \中jdk1.6.0_27 \样品\ JNLP \的servlet.
但那是JDK 1.6.在1.7中没有示例文件夹,我找不到任何jnlp.jar与Windows搜索.
如果还有其他方法可以使用JNLP API请告诉我.