机器学习笔记-16(应用范例:照片OCR)

这里是第十八部分,应用范例:照片OCR。

OCR是啥? 全称为Optical character recognition(光学字符识别),也就是一项从图像的光学信息进行字符识别的技术。

那么,就直接进行问题描述吧。咱们现在的问题是如果从一个照片中提取出含字符的区域,并进行识别。

The Photo OCR problem

照片OCR问题

为了解决这个问题,咱构建了一个流水线结构。把整个处理过程依次分为了 文本检测->字符切分->字符分类 三个部分。每一模块的输出作为下一个模块的输入,也就形成了流水线一般的处理结构。下图给出了每一模块的具体处理任务。 继续阅读“机器学习笔记-16(应用范例:照片OCR)”