用Python實現人臉檢測-1(滑動窗口)

那就接著剛剛折騰的課程,來實現個小項目(face detection)吧。

代碼神馬的都放到github上了,應該會接著不斷優化,因為個人覺得這個東西,性能堪憂,只能作為實驗性質,基本沒有實用意義。

大家需要注意下,face detection跟face recognition的區別。

具體實現的思想,大部份可以參考上一篇博文噢。

但是還是扯一下吧,咱是這麼想的,用滑動窗口技術劃出一個個圖塊,然後用BP-ANN分類器進行人臉檢測。

當然說起來是挺簡單的,但是這其中還要涉及獲取訓練樣本(咱只能人工折騰這個了。。),各種預處理,然後還需要對BP-ANN分類器進行訓練,調整神馬的。

因為自己是個新手,所以代碼寫得不好看,也不優雅。但是’make it works,keep it simple’,咱還是基本做到了,雖然聽起來很像是借口的樣子。 继续阅读“用Python實現人臉檢測-1(滑動窗口)”

机器学习笔记-16(应用范例:照片OCR)

这里是第十八部分,应用范例:照片OCR。

OCR是啥? 全称为Optical character recognition(光学字符识别),也就是一项从图像的光学信息进行字符识别的技术。

那么,就直接进行问题描述吧。咱们现在的问题是如果从一个照片中提取出含字符的区域,并进行识别。

The Photo OCR problem

照片OCR问题

为了解决这个问题,咱构建了一个流水线结构。把整个处理过程依次分为了 文本检测->字符切分->字符分类 三个部分。每一模块的输出作为下一个模块的输入,也就形成了流水线一般的处理结构。下图给出了每一模块的具体处理任务。 继续阅读“机器学习笔记-16(应用范例:照片OCR)”