我正在寻找一种对主要由文本组成的扫描页面进行分类的方法.
这是我的问题的细节.我有大量扫描文档,需要检测这些文档中是否存在某些类型的页面.我计划将文档"破解"到它们的组件页面(每个页面都是一个单独的图像),并将这些图像中的每一个分类为"A"或"B".但我无法弄清楚这样做的最佳方法.
更多细节:
编辑:
python opencv machine-learning image-processing barcode-scanner
我有一个包含iterables的python字典,其中一些是列表,但大多数是其他字典.我想做类似以下的glob-style赋值:
myiter['*']['*.txt']['name'] = 'Woot'
Run Code Online (Sandbox Code Playgroud)
也就是说,对于myiter中的每个元素,使用以".txt"结尾的键查找所有元素,然后将"name"项设置为"Woot".
我已经考虑过对dict进行子类化和使用fnmatch模块.但是,我不清楚实现这一目标的最佳方法是什么.