AI入门:实现图片人脸识别

AI领域非常广泛,从信息的载体可分为文字、图片、声音、视频等,当我真的想要学习AI的时候,有点无从下手。从什么方向入门,学习什么库?

前几天逛github,发现了一个识别人脸的教程:

https://github.com/vipstone/faceai

看了一个入门还是非常简单的。

安装:

安装包都比较大,可以使用豆瓣源:

-i https://pypi.douban.com/simple

> pip install numpy
> pip install opencv-python

备注:dlib 库非难安装

首先,使用 opencv 打开一张图

import cv2

img = cv2 . imread ( d:/tc/faceai/meinv.jpg )

cv2 . namedWindow ( Image )

cv2 . imshow ( Image , img )

cv2 . waitKey ( 0 )

cv2 . destroyAllWindows ()

人脸识别

要想识别一张图片上的人脸分三步:

  1. 将彩色图片转换为灰色,转为一维的灰度,降低计算强度。

import cv2

img = cv2 . imread ( d:/tc/faceai/meinv.jpg )

# 转换灰色

gray = cv2 . cvtColor ( img , cv2 . COLOR_BGR2GRAY )

cv2 . imshow ( Image , gray )

cv2 . waitKey ( 0 )

cv2 . destroyAllWindows ()

  1. 通过矩形画出人脸位置。

import cv2

img = cv2 . imread ( d:/tc/faceai/meinv.jpg )

gray = cv2 . cvtColor ( img , cv2 . COLOR_BGR2GRAY )

# 绘制矩形

x = y = 10   # 坐标

w = 100   # 矩形大小(宽、高)

color = ( 0 , 0 , 255 )   # 定义绘制颜色

cv2 . rectangle ( img , ( x , y ), ( x + w , y + w ), color , 1 )   # 绘制矩形

cv2 . imshow ( Image , img )   # 显示图像

cv2 . waitKey ( 0 )

cv2 . destroyAllWindows ()   # 释放所有的窗体资源

  1. 使用训练分类器查找人脸。

这一步的核心是使用 opencv 的人脸训练模型,下载地址:

https://github.com/opencv/opencv/tree/master/data/haarcascades

这里选择 haarcascade_frontalface_default.xml 文件,你可以下载到本地。

import cv2

img = cv2 . imread ( d:/tc/faceai/meinv.jpg )

gray = cv2 . cvtColor ( img , cv2 . COLOR_BGR2GRAY )

# OpenCV人脸识别分类器

classifier = cv2 . CascadeClassifier ( d:/tc/faceai/haarcascade_frontalface_default.xml )

color = ( 0 , 255 , 0 )   # 定义绘制颜色

# 调用识别人脸

faceRect = classifier . detectMultiScale ( gray , scaleFactor = 1.2 , minNeighbors = 3 , minSize = ( 32 , 32 ))

if len ( faceRect ):   # 大于0则检测到人脸

for faceRect in faceRect :   # 单独框出每一张人脸

x , y , w , h = faceRect

# 框出人脸

cv2 . rectangle ( img , ( x , y ), ( x + h , y + w ), color , 2 )

# 左眼

cv2 . circle ( img , ( x + w // 4 , y + h // 4 + 30 ), min ( w // 8 , h // 8 ),

color )

# 右眼

cv2 . circle ( img , ( x + 3 * w // 4 , y + h // 4 + 30 ), min ( w // 8 , h // 8 ),

color )

# 嘴巴

cv2 . rectangle ( img , ( x + 3 * w // 8 , y + 3 * h // 4 ),

( x + 5 * w // 8 , y + 7 * h // 8 ), color )

cv2 . imshow ( image , img )   # 显示图像

c = cv2 . waitKey ( 10 )

cv2 . waitKey ( 0 )

cv2 . destroyAllWindows ()

那么,我们已经识别出美女的五官了。

我们可以使用opencv训练自己的分类器,比如识别页面上的按钮、输入框等,那么是不是就可以通过AI来定位元素了。