您好,歡迎來到六度教育網(wǎng)!
圖像識別技術(shù)
2015-02-25 09:32:39 來源:安防知識網(wǎng) 評論:0 點(diǎn)擊:
簡介
人的圖像識別能力是很強(qiáng)的。圖像距離的改變或圖像在感覺器官上作用位置的改變,都會造成圖像在視網(wǎng)膜上的大小和形狀的改變。即使在這種情況下,人們?nèi)匀豢梢哉J(rèn)出他們過去知覺過的圖像。甚至圖像識別可以不受感覺通道的限制。例如,人可以用眼看字,當(dāng)別人在他背上寫字時(shí),他也可認(rèn)出這個(gè)字來。
圖像識別技術(shù)可能是以圖像的主要特征為基礎(chǔ)的。每個(gè)圖像都有它的特征,如字母A有個(gè)尖,P有個(gè)圈、而Y的中心有個(gè)銳角等。對圖像識別時(shí)眼動(dòng)的研究表明,視線總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大。而且眼睛的掃描路線也總是依次從一個(gè)特征轉(zhuǎn)到另一個(gè)特征上。由此可見,在圖像識別過程中,知覺機(jī)制必須排除輸入的多余信息,抽出關(guān)鍵的信息。同時(shí),在大腦里必定有一個(gè)負(fù)責(zé)整合信息的機(jī)制,它能把分階段獲得的信息整理成一個(gè)完整的知覺映象。
在人類圖像識別系統(tǒng)中,對復(fù)雜圖像的識別往往要通過不同層次的信息加工才能實(shí)現(xiàn)。對于熟悉的圖形,由于掌握了它的主要特征,就會把它當(dāng)作一個(gè)單元來識別,而不再注意它的細(xì)節(jié)了。這種由孤立的單元材料組成的整體單位叫做組塊,每一個(gè)組塊是同時(shí)被感知的。在文字材料的識別中,人們不僅可以把一個(gè)漢字的筆劃或偏旁等單元組成一個(gè)組塊,而且能把經(jīng)常在一起出現(xiàn)的字或詞組成組塊單位來加以識別。
技術(shù)發(fā)展
圖像識別技術(shù)是人工智能的一個(gè)重要領(lǐng)域。為了編制模擬人類圖像識別活動(dòng)的計(jì)算機(jī)程序,人們提出了不同的圖像識別模型。例如模板匹配模型。這種模型認(rèn)為,識別某個(gè)圖像,必須在過去的經(jīng)驗(yàn)中有這個(gè)圖像的記憶模式,又叫模板。當(dāng)前的如果能與大腦中的模板相匹配,這個(gè)圖像也就被識別了。例如有一個(gè)字母A,如果在腦中有個(gè)A模板,字母A的大小、方位、形狀都與這個(gè)A模板完全一致,字母A就被識別了。圖像識別中的模式識別(PatternRecognition),是一種從大量信息和數(shù)據(jù)出發(fā),在專家經(jīng)驗(yàn)和已有認(rèn)識的基礎(chǔ)上,利用計(jì)算機(jī)和數(shù)學(xué)推理的方法對形狀、模式、曲線、數(shù)字、字符格式和圖形自動(dòng)完成識別、評價(jià)的過程。模式識別包括兩個(gè)階段,即學(xué)習(xí)階段和實(shí)現(xiàn)階段,前者是對樣本進(jìn)行特征選擇,尋找分類的規(guī)律,后者是根據(jù)分類規(guī)律對未知樣本集進(jìn)行分類和識別。這個(gè)模式識別的模板匹配模型簡單明了,也容易得到實(shí)際應(yīng)用。但這種模型強(qiáng)調(diào)圖像必須與腦中的模板完全符合才能加以識別,而事實(shí)上人不僅能識別與腦中的模板完全一致的圖像,也能識別與模板不完全一致的圖像。例如,人們不僅能識別某一個(gè)具體的字母A,也能識別印刷體的、手寫體的、方向不正、大小不同的各種字母A。同時(shí),人能識別的圖像是大量的,如果所識別的每一個(gè)圖像在腦中都有一個(gè)相應(yīng)的模板,也是不可能的。
為了解決模板匹配模型存在的問題,格式塔心理學(xué)家又提出了一個(gè)原型匹配模型。這種模型認(rèn)為,在長時(shí)記憶中存儲的并不是所要識別的無數(shù)個(gè)模板,而是圖像的某些“相似性”。從圖像中抽象出來的“相似性”就可作為原型,拿它來檢驗(yàn)所要識別的圖像。如果能找到一個(gè)相似的原型,這個(gè)圖像也就被識別了。這種模型從神經(jīng)上和記憶探尋的過程上來看,都比模板匹配模型更適宜,而且還能說明對一些不規(guī)則的,但某些方面與原型相似的圖像的識別。但是,這種模型沒有說明人是怎樣對相似的進(jìn)行辨別和加工的,它也難以在計(jì)算機(jī)程序中得到實(shí)現(xiàn)。因此又有人提出了一個(gè)更復(fù)雜的模型,即“泛魔”識別模型。
圖像識別的基本過程
n信息的獲取:是通過傳感器,將光或聲音等信息轉(zhuǎn)化為電信息。信息可以是二維的圖象如文字,圖象等;可以是一維的波形如聲波,心電圖,腦電圖;也可以是物理量與邏輯值。
n預(yù)處理:包括A\D、二值化,圖象的平滑,變換,增強(qiáng),恢復(fù),濾波等,主要指圖象處理。
n特征抽取和選擇:在模式識別中,需要進(jìn)行特征的抽取和選擇,例如,一幅64x64的圖象可以得到4096個(gè)數(shù)據(jù),這種在測量空間的原始數(shù)據(jù)通過變換獲得在特征空間最能反映分類本質(zhì)的特征。這就是特征提取和選擇的過程。
n分類器設(shè)計(jì):分類器設(shè)計(jì)的主要功能是通過訓(xùn)練確定判決規(guī)則,使按此類判決規(guī)則分類時(shí),錯(cuò)誤率最低。
n分類決策:在特征空間中對被識別對象進(jìn)行分類。
上一篇:模擬攝像機(jī)概述和分類
下一篇:資深老專家10點(diǎn)暖通設(shè)計(jì)中問題總結(jié)
分享到:
收藏
