學(xué)習(xí)使用計(jì)算機(jī)視覺(jué)進(jìn)行人臉檢測(cè)
概述
在本文中,我們將制作一個(gè)人臉檢測(cè)應(yīng)用程序,它將檢測(cè)圖像中的單個(gè)人臉并同時(shí)檢測(cè)多個(gè)人臉,因此,整篇文章將重點(diǎn)介紹使用計(jì)算機(jī)視覺(jué)進(jìn)行人臉檢測(cè)。在這里,我們將使用 HAAR 級(jí)聯(lián)分類器進(jìn)行檢測(cè);出于檢測(cè)目的,我們將學(xué)習(xí)檢測(cè)圖像中人臉?biāo)婕暗乃屑夹g(shù)和過(guò)程。
人臉檢測(cè)的應(yīng)用
1. 人臉識(shí)別:人臉識(shí)別是進(jìn)一步做的事情,即在人臉檢測(cè)之后,進(jìn)行人臉識(shí)別。
2. 濾鏡:如今,我們生活在社交媒體的世界里,我們可以看到全球市場(chǎng)上有各種各樣的濾鏡和有趣的應(yīng)用程序;要進(jìn)行此類應(yīng)用,我們還需要先檢測(cè)人臉,然后應(yīng)用濾鏡。
3. 人臉解鎖應(yīng)用程序:我們經(jīng)常在手機(jī)中使用此功能,但我們知道,這也需要檢測(cè)人臉。
所以讓我們開(kāi)始吧!
加載必要的庫(kù)
# Import the necessary libraries
import numpy as np
import cv2
import matplotlib.pyplot as plt
%matplotlib inline
加載圖像
# Loading the image to be tested
test_image = cv2.imread('data/baby1.png')
# Here we are converting the colored image into gray image
if(test_image is not None):
test_image_gray = cv2.cvtColor(test_image, cv2.COLOR_BGR2GRAY)
test_image_gray
# Displaying grayscale image
plt.imshow(test_image_gray, cmap='gray')
輸出:
我們很清楚 OpenCV 的檢測(cè)器功能默認(rèn)讀取 BGR 格式的現(xiàn)有圖像,但最終用戶通常不會(huì)考慮 BGR 格式;因此我們需要將 BGR 格式的圖像轉(zhuǎn)換為 RGB 格式,即彩色圖像,它具有負(fù)責(zé)創(chuàng)建彩色圖像的所有 3 個(gè)通道(R-Red、G-Green、B-Blue)。
因此,我們將創(chuàng)建一個(gè)函數(shù)來(lái)將 BGR 圖像轉(zhuǎn)換為 RGB 圖像。
def convertToRGB(image):
return cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
HAAR 級(jí)聯(lián)文件
HAAR 級(jí)聯(lián)是計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)很好的術(shù)語(yǔ)。當(dāng)我們談?wù)?HAAR 級(jí)聯(lián)分類器時(shí),不僅僅是人臉預(yù)訓(xùn)練分類器,我們可以得到經(jīng)過(guò)訓(xùn)練來(lái)檢測(cè)微笑、汽車、公共汽車的分類器,這些級(jí)聯(lián)文件總是采用 XML 文件格式,通常我們使用現(xiàn)有的級(jí)聯(lián)文件,但事實(shí)上我們也可以在這里創(chuàng)建它們,為了簡(jiǎn)單起見(jiàn),我們將使用 HAAR 級(jí)聯(lián)正面人臉?lè)诸惼鱽?lái)檢測(cè)圖像中人臉的位置。
加載正面分類器
haar_cascade_face = cv2.CascadeClassifier('data/haarcascades/haarcascade_frontalface_alt2.xml')
人臉檢測(cè)
對(duì)于人臉檢測(cè),我們需要從坐標(biāo)中獲取人臉的坐標(biāo),我的意思是 X、Y 坐標(biāo)以及人臉的高度和寬度,然后我們可以在給定的坐標(biāo)下在圖像上繪制一個(gè)矩形,我們有detectMultiScale函數(shù),它將為我們提供所有需要的坐標(biāo)來(lái)規(guī)劃矩形。
face_coordinate = haar_cascade_face.detectMultiScale(test_image_gray, scaleFactor = 1.2, minNeighbors = 5);
# Let us print the no. of faces found
print('Faces found: ', len(face_coordinate))
輸出:
Faces found: 1
所以之前,在使用 detectMultiScale 函數(shù)時(shí),我們獲取了圖像的 x 坐標(biāo)和 y 坐標(biāo)以及高度和寬度,現(xiàn)在我們將使用這些點(diǎn)循環(huán)遍歷圖像的每個(gè)點(diǎn)并在臉部上繪制厚度為 2 個(gè)像素的矩形。
for (x_face,y_face,w_face,h_face) in face_coordinate:
cv2.rectangle(test_image, (x_face, y_face), (x_face+w_face, y_face+h_face), (0, 255, 0), 2)
由于現(xiàn)在已經(jīng)完成了完整的過(guò)程,是時(shí)候檢查我們到目前為止執(zhí)行的所有步驟是否正確,在Matplotlib 的 show 函數(shù)的幫助下,我們將看到處理后的圖像,看看它是否可以檢測(cè)到圖像中的人臉。
#convert image to RGB and show image
plt.imshow(convertToRGB(test_image))
輸出:
自動(dòng)人臉檢測(cè)過(guò)程的函數(shù)
def detect_faces(cascade, test_image, scaleFactor = 1.1):
# Here with the help of copy() function we will hold the copy of the original image
image_copy = test_image.copy()
# Here with the help of cvtColor function we are converting the image from BGR format to gray image
gray_image = cv2.cvtColor(image_copy, cv2.COLOR_BGR2GRAY)
# Finally we are using the haar cascade function with detectMultiscale to get the coordiates of the faces in the given image
faces_rect = cascade.detectMultiScale(gray_image, scaleFactor=scaleFactor, minNeighbors=1)
for (x_face, y_face, w_face, h_face) in faces_rect:
cv2.rectangle(image_copy, (x_face, y_face), (x_face+w_face, y_face+h_face), (0, 255, 0), 2)
return image_copy
代碼分解:在這里,我們構(gòu)建了檢測(cè)人臉的函數(shù);讓我們看看這里發(fā)生了什么:
1. 首先,我們使用copy函數(shù)來(lái)存儲(chǔ)原始圖像,這樣任何不需要的更改都不應(yīng)該存在于原始圖像中
2. 然后我們將BGR 格式的圖像轉(zhuǎn)換為灰度圖像,因?yàn)?cv2 以灰度格式讀取圖像只是為了更好的可讀性。
3. 然后,在 detectMultiScale 函數(shù)的幫助下, 評(píng)論中已經(jīng)提到了這一點(diǎn)。
4. 最后,利用 detectMultiScale 函數(shù)得到的坐標(biāo),繪制出 2 像素厚的綠色矩形
在新圖像上測(cè)試
#loading image
test_image2 = cv2.imread('data/baby2.png')
#call the function to detect faces
faces = detect_faces(haar_cascade_face, test_image2)
#convert to RGB and display image
plt.imshow(convertToRGB(faces))
輸出:
檢測(cè)多個(gè)人臉的測(cè)試
#loading image
test_image2 = cv2.imread('data/group.png')
#call the function to detect faces
faces = detect_faces(haar_cascade_face, test_image2)
#convert to RGB and display image
plt.imshow(convertToRGB(faces))
輸出:
保存圖像
cv2.imwrite('image1.png',faces)
輸出:
True
結(jié)論
1. 因此,在使用計(jì)算機(jī)視覺(jué)進(jìn)行人臉檢測(cè)時(shí),我們首先導(dǎo)入必要的庫(kù)并加載我們需要執(zhí)行人臉檢測(cè)的圖像。
2. 然后我們了解了 HAAR 級(jí)聯(lián)文件和正面分類器。除此之外,還學(xué)習(xí)了 detectMultiScale 函數(shù)的使用。
3. 當(dāng)我們意識(shí)到整個(gè)檢測(cè)過(guò)程非常耗時(shí)的時(shí)候,我們嘗試構(gòu)建一個(gè)函數(shù)來(lái)自動(dòng)化這個(gè)過(guò)程。
4. 然后使用函數(shù),我們可以檢測(cè)到圖像的多張人臉。
5. 最后,我們保存了檢測(cè)到的人臉圖像。
因此,以上是使用計(jì)算機(jī)視覺(jué)準(zhǔn)備人臉檢測(cè)應(yīng)用程序時(shí)必須遵循的步驟
原文標(biāo)題 : 學(xué)習(xí)使用計(jì)算機(jī)視覺(jué)進(jìn)行人臉檢測(cè)

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?