123,123

<strike id="ascip"></strike><table id="ascip"></table>

<font id="ascip"></font>

當(dāng)前位置： OFweek 人工智能網(wǎng) > 計(jì)算機(jī)視覺(jué) > 正文

如何創(chuàng)建一個(gè)能夠區(qū)分或識(shí)別圖像的系統(tǒng)？

2021-03-25 08:57

磐創(chuàng)AI

介紹你是否曾經(jīng)偶然發(fā)現(xiàn)一個(gè)數(shù)據(jù)集或圖像，并想知道是否可以創(chuàng)建一個(gè)能夠區(qū)分或識(shí)別圖像的系統(tǒng)？圖像分類(lèi)的概念將幫助我們解決這個(gè)問(wèn)題。圖像分類(lèi)是計(jì)算機(jī)視覺(jué)最熱門(mén)的應(yīng)用之一，是任何想在這個(gè)領(lǐng)域工作的人都必須知道的概念。

在本文中，我們將看到一個(gè)非常簡(jiǎn)單但使用頻率很高的應(yīng)用程序，那就是圖像分類(lèi)。我們不僅將看到如何使一個(gè)簡(jiǎn)單和有效的模型分類(lèi)數(shù)據(jù)，而且還將學(xué)習(xí)如何實(shí)現(xiàn)一個(gè)預(yù)先訓(xùn)練的模型，并比較兩者的性能。在本文結(jié)束時(shí)，你將能夠找到自己的數(shù)據(jù)集并輕松實(shí)現(xiàn)圖像分類(lèi)。先決條件：Python編程Keras及其模塊基本了解圖像分類(lèi)卷積神經(jīng)網(wǎng)絡(luò)及其實(shí)現(xiàn)遷移學(xué)習(xí)的基本認(rèn)識(shí)聽(tīng)起來(lái)有趣嗎？準(zhǔn)備創(chuàng)建你自己的圖像分類(lèi)器吧！目錄圖像分類(lèi)理解問(wèn)題陳述設(shè)置圖像數(shù)據(jù)讓我們構(gòu)建我們的圖像分類(lèi)模型數(shù)據(jù)預(yù)處理數(shù)據(jù)擴(kuò)充模型定義和訓(xùn)練評(píng)估結(jié)果遷移學(xué)習(xí)的藝術(shù)導(dǎo)入基礎(chǔ)MobileNetV2模型微調(diào)訓(xùn)練評(píng)估結(jié)果下一步是什么？什么是圖像分類(lèi)？圖像分類(lèi)是分配輸入圖像（一組固定類(lèi)別中的一個(gè)標(biāo)簽）的任務(wù)。這是計(jì)算機(jī)視覺(jué)的核心問(wèn)題之一，盡管它很簡(jiǎn)單，卻有各種各樣的實(shí)際應(yīng)用。讓我們舉個(gè)例子來(lái)更好地理解。當(dāng)我們進(jìn)行圖像分類(lèi)時(shí)，我們的系統(tǒng)將接收?qǐng)D像作為輸入，例如，一只貓�，F(xiàn)在，系統(tǒng)將已知一組類(lèi)別，它的目標(biāo)是為圖像分配一個(gè)類(lèi)別。這個(gè)問(wèn)題似乎很簡(jiǎn)單，但對(duì)于計(jì)算機(jī)來(lái)說(shuō)卻是一個(gè)很難解決的問(wèn)題。你可能知道，電腦看到的是一組數(shù)字，而不是我們看到的貓的圖像。圖像是由0到255的整數(shù)組成的三維數(shù)組，大小為寬x高x 3。3代表紅色、綠色、藍(lán)色三個(gè)顏色通道。那么我們的系統(tǒng)如何學(xué)習(xí)識(shí)別這幅圖像呢？通過(guò)卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)（CNN）是深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的一種，是圖像識(shí)別領(lǐng)域的巨大突破。到目前為止，你可能已經(jīng)對(duì)CNN有了一個(gè)基本的了解，我們知道CNN由卷積層、Relu層、池化層和全連接層組成。

要閱讀關(guān)于圖像分類(lèi)和CNN的詳細(xì)信息，你可以查看以下資源：https：／／www．a(chǎn)nalyticsvidhya．com／blog／2020／02／learn－image－classification－cnn－convolutional－neural－networks－3－datasets／

https：／／www．a(chǎn)nalyticsvidhya．com／blog／2019／01／build－image－classification－model－10－minutes／

現(xiàn)在我們已經(jīng)理解了這些概念，讓我們深入了解如何構(gòu)建和實(shí)現(xiàn)圖像分類(lèi)模型。理解問(wèn)題陳述考慮下面的圖像：

一個(gè)精通體育運(yùn)動(dòng)的人可以認(rèn)出橄欖球的形象。圖像的不同方面可以幫助你識(shí)別它是橄欖球，它可以是球的形狀或球員的服裝。但你有沒(méi)有注意到，這張照片很可能是一個(gè)足球形象？讓我們考慮另一張圖片：

你認(rèn)為這個(gè)圖像代表什么？很難猜對(duì)吧？對(duì)于沒(méi)有受過(guò)訓(xùn)練的人來(lái)說(shuō)，這幅圖像很容易被誤認(rèn)為是足球，但實(shí)際上，這是橄欖球的圖像，因?yàn)槲覀兛梢钥吹胶竺娴那蜷T(mén)柱不是網(wǎng)，而且尺寸更大�，F(xiàn)在的問(wèn)題是，我們能否建立一個(gè)能夠正確分類(lèi)圖像的系統(tǒng)。這就是我們項(xiàng)目背后的想法，我們想要建立一個(gè)系統(tǒng)能夠識(shí)別圖像中所代表的運(yùn)動(dòng)。這里分為橄欖球和足球兩大類(lèi)。問(wèn)題陳述可能有點(diǎn)棘手，因?yàn)轶w育運(yùn)動(dòng)有很多共同的方面，盡管如此，我們將學(xué)習(xí)如何解決問(wèn)題，并創(chuàng)建一個(gè)良好的表現(xiàn)系統(tǒng)。設(shè)置我們的圖像數(shù)據(jù)由于我們正在處理一個(gè)圖像分類(lèi)問(wèn)題，我使用了兩個(gè)最大的圖像數(shù)據(jù)源，即ImageNet和谷歌OpenImages。我實(shí)現(xiàn)了兩個(gè)python腳本，我們可以輕松地下載圖像。一共下載了3058張圖片，分為train和test兩部分。我用訓(xùn)練文件夾有2448張圖片，測(cè)試文件夾有610張圖片，進(jìn)行了80－20的分割。橄欖球和足球兩個(gè)類(lèi)別各有1224張圖片。我們的數(shù)據(jù)結(jié)構(gòu)如下：輸入 3058橄欖球－ 310足球－ 310橄欖球－ 1224足球－ 1224訓(xùn)練－ 2048測(cè)試－ 610我們來(lái)建立我們的圖像分類(lèi)模型！步驟1：導(dǎo)入所需的庫(kù)這里，我們將使用Keras庫(kù)來(lái)創(chuàng)建模型并對(duì)其進(jìn)行訓(xùn)練。我們還使用Matplotlib和Seaborn來(lái)可視化我們的數(shù)據(jù)集，以便更好地理解我們將要處理的圖像。另一個(gè)處理圖像數(shù)據(jù)的重要庫(kù)是Opencv。import matplotlib．pyplot as plt
import seaborn as sns
import keras
from keras．models import Sequential
from keras．layers import Dense， Conv2D ， MaxPool2D ， Flatten ， Dropout
from keras．preprocessing．image import ImageDataGenerator
from keras．optimizers import Adam
from sklearn．metrics import classification＿report，confusion＿matrix
import tensorflow as tf
import cv2
import os
import numpy as np
步驟2：加載數(shù)據(jù)接下來(lái)，讓我們定義數(shù)據(jù)的路徑。讓我們定義一個(gè)名為get＿data（）的函數(shù)，它使我們更容易創(chuàng)建我們的訓(xùn)練和驗(yàn)證數(shù)據(jù)集。我們定義了我們將要使用的兩個(gè)標(biāo)簽“Rugby”和“Soccer”。我們使用Opencv imread函數(shù)讀取RGB格式的圖像，并將圖像大小調(diào)整到我們想要的寬度和高度（在本例中都是224）。labels ＝［＇rugby＇，＇soccer＇］
img＿size ＝ 224
def get＿data（data＿dir）：
data ＝［］
for label in labels：
path ＝ os．path．join（data＿dir， label）
class＿num ＝ labels．index（label）
for img in os．listdir（path）：
try：
img＿arr ＝ cv2．imread（os．path．join（path， img））［．．．，：：－1］＃convert BGR to RGB format
resized＿arr ＝ cv2．resize（img＿arr，（img＿size， img＿size））＃ Reshaping images to preferred size
data．a(chǎn)ppend（［resized＿arr， class＿num］）
except Exception as e：
print（e）
return np．a(chǎn)rray（data）
Now we can easily fetch our train and validation data．
train ＝ get＿data（＇．．／input／traintestsports／Main／train＇）
val ＝ get＿data（＇．．／input／traintestsports／Main／test＇）
步驟3：可視化數(shù)據(jù)讓我們可視化我們的數(shù)據(jù)，看看我們到底在使用什么。我們使用seaborn來(lái)繪制這兩個(gè)類(lèi)中的圖像數(shù)量，你可以看到輸出是什么樣的。l ＝［］
for i in train：
if（i［1］＝＝ 0）：
l．a(chǎn)ppend（＂rugby＂）
else
l．a(chǎn)ppend（＂soccer＂）
sns．set＿style（＇darkgrid＇）
sns．countplot（l）
輸出：

1 2 下一頁(yè)>

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫(xiě)，觀(guān)點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

立即登錄即可訪(fǎng)問(wèn)所有OFweek服務(wù)

忘記密碼

其他方式

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

暫無(wú)評(píng)論

暫無(wú)評(píng)論

圖片新聞

最新發(fā)布

最新活動(dòng)更多

一周熱點(diǎn) 月點(diǎn)擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報(bào)告

人工智能獵頭職位更多

高級(jí)軟件工程師廣東省/深圳市
自動(dòng)化高級(jí)工程師廣東省/深圳市
光器件研發(fā)工程師福建省/福州市
銷(xiāo)售總監(jiān)（光器件）北京市/海淀區(qū)
激光器高級(jí)銷(xiāo)售經(jīng)理上海市/虹口區(qū)
光器件物理工程師北京市/海淀區(qū)
激光研發(fā)工程師北京市/昌平區(qū)
技術(shù)專(zhuān)家廣東省/江門(mén)市
封裝工程師北京市/海淀區(qū)
結(jié)構(gòu)工程師廣東省/深圳市

掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯(cuò)

x

_*文字標(biāo)題：

_*糾錯(cuò)內(nèi)容：

聯(lián)系郵箱：

_*驗(yàn) 證碼：

看不清，點(diǎn)擊換一張

粵公網(wǎng)安備 44030502002758號(hào)

感谢您访问我们的网站，您可能还对以下资源感兴趣：

久久人妻av无码中文字幕

m3u8午夜福利一区二区三区久久久精产国品一产二产三产区中文字幕在线一级av片久久精品国产亚洲AV电影网