我有成千上万的页面需要扫描和记录

l--*_*''' 1 .net mysql database pdf

我有很多想要扫描的文件.每个文档都有大约10个不同的元数据标签,我希望能够通过它来搜索.

所以也许我想要一个巨大的扫描仪,扫描所有内容,但那么我如何标记evverything?我想我会把它们变成pdf文件,我会把它们放在一个mysql数据库中?做这个的最好方式是什么.我还想制作一个GUI来搜索这个数据库.我不想OCR我想附加的所有文件,如每个文件的10个关键字.

请向我建议一个系统或如何执行此操作的程序.我想这可能是从多台计算机上搜索到的

需要什么样的编程?

Bil*_*win 5

我最近帮助我的妻子为她30年的创作写作做了数字备份.她在数百个小型笔记本中手写了大约15,000页.

我们尝试使用平板扫描仪,但笔记本电脑不平放,扫描仪扫描页面需要60秒,有些笔记本电脑更大,而且不适合她的信纸尺寸平板扫描仪.我知道存在更大,更快的扫描仪,但它仍然太笨拙和耗时.

我们最终安装在一个小型三脚架上的数码相机,直接指向书本打开的桌子.使用相机的AC适配器,这样您就可以连续工作数小时而无需更换电池.有些相机甚至可以通过计算机上的GUI进行操作,因此您不必冒按控制器的风险.如果你方便地设置了这一切,你可以快速翻页并每隔几秒拍一张照片.这个解决方案要快得多.

我们发现最好拍摄一本书的所有照片,然后作为一项单独的任务,将它们卸载到计算机上并对它们进行分类和归档.只是因为它会减慢我们从每个页面的相机UI更改为编目UI.

大多数人都不愿意在RDBMS中存储大图像,他们只是将图像的文件名存储为字符串,然后为标题,日期和关键字等其他属性添加列.例外情况是您需要图像遵守ACID交易等,这可能不适用于您的情况.

如果你不打算做OCR,我想不出自动检测关键字的方法.您必须手动输入或从列表中选择它们.但同样,在捕获图像后,最好将其作为"后处理"任务完成.