小编Kyl*_*yle的帖子

python中的图像分类

我正在寻找一种对主要由文本组成的扫描页面进行分类的方法.

这是我的问题的细节.我有大量扫描文档,需要检测这些文档中是否存在某些类型的页面.我计划将文档"破解"到它们的组件页面(每个页面都是一个单独的图像),并将这些图像中的每一个分类为"A"或"B".但我无法弄清楚这样做的最佳方法.

更多细节:

  • 我有很多"A"和"B"图像(页面)的例子,所以我可以做有监督的学习.
  • 我不清楚如何最好地从这些图像中提取特征以进行训练.例如,这些功能是什么?
  • 页面偶尔会略微旋转,因此如果分类对旋转和(在较小程度上)缩放有些不敏感,那将会很棒.
  • 我想要一个跨平台的解决方案,理想情况下是纯Python或使用公共库.
  • 我考虑过使用OpenCV,但这似乎是一个"重量级"的解决方案.

编辑:

  • "A"和"B"页面的不同之处在于"B"页面上具有相同的一般结构形式,包括条形码的存在."A"页面是自由文本.

python opencv machine-learning image-processing barcode-scanner

16
推荐指数
2
解决办法
7126
查看次数

如何对可迭代元素进行glob

我有一个包含iterables的python字典,其中一些是列表,但大多数是其他字典.我想做类似以下的glob-style赋值:

myiter['*']['*.txt']['name'] = 'Woot'
Run Code Online (Sandbox Code Playgroud)

也就是说,对于myiter中的每个元素,使用以".txt"结尾的键查​​找所有元素,然后将"name"项设置为"Woot".

我已经考虑过对dict进行子类化和使用fnmatch模块.但是,我不清楚实现这一目标的最佳方法是什么.

python

5
推荐指数
1
解决办法
1390
查看次数