一、圖像識別的基本過程
信息的獲取:是通過傳感器,將光或聲音等信息轉(zhuǎn)化為電信息。信息可以是二維的圖象如文字,圖象等;可以是一維的波形如聲波,心電圖,腦電圖;也可以是物理量與邏輯值。
預(yù)處理:包括AD,二值化,圖象的平滑,變換,增強,恢復(fù),濾波等, 主要指圖象處理。
特征抽取和選擇:在模式識別中,需要進行特征的抽取和選擇,例如,一幅64x64的圖象可以得到4096個數(shù)據(jù),這種在測量空間的原始數(shù)據(jù)通過變換獲得在特征空間最能反映分類本質(zhì)的特征。這就是特征提取和選擇的過程。
分類器設(shè)計:分類器設(shè)計的主要功能是通過訓(xùn)練確定判決規(guī)則,使按此類判決規(guī)則分類時,錯誤率最低。
分類決策:在特征空間中對被識別對象進行分類。
二、圖像識別的應(yīng)用
1、遙感圖像識別:航空遙感和衛(wèi)星遙感圖像通常用圖像識別技術(shù)進行加工以便提取有用的信息。該技術(shù)目前主要用于地形地質(zhì)探查,森林、水利、海洋、農(nóng)業(yè)等資源調(diào)查,災(zāi)害預(yù)測,環(huán)境污染監(jiān)測,氣象衛(wèi)星云圖處理以及地面軍事目標識別等。
2、通訊領(lǐng)域的應(yīng)用:包括圖像傳輸、電視電話、電視會議等。
3、軍事、公安刑偵等領(lǐng)域的應(yīng)用:圖像識別技術(shù)在軍事、公安刑偵方面的應(yīng)用很廣泛,例如軍事目標的偵察、制導(dǎo)和警戒系統(tǒng);自動滅火器的控制及反偽裝;公安部門的現(xiàn)場照片、指紋、手跡、印章、人像等的處理和辨識;歷史文字和圖片檔案的修復(fù)和管理等等。
4、生物醫(yī)學(xué)圖像識別:圖像識別在現(xiàn)代醫(yī)學(xué)中的應(yīng)用非常廣泛,它具有直觀、無創(chuàng)傷、安全方便等特點。在臨床診斷和病理研究中廣泛借助圖像識別技術(shù),例如CT(Computed Tomography)技術(shù)等。
5、機器視覺領(lǐng)域的應(yīng)用:作為智能機器人的重要感覺器官,機器視覺主要進行3D圖像的理解和識別,該技術(shù)也是目前研究的熱門課題之一。機器視覺的應(yīng)用領(lǐng)域也十分廣泛,例如用于軍事偵察、危險環(huán)境的自主機器人,郵政、醫(yī)院和家庭服務(wù)的智能機器人。此外機器視覺還可用于工業(yè)生產(chǎn)中的工件識別和定位,太空機器人的自動操作等。
三、圖像識別面臨哪些障礙
圖像識別并非一個新領(lǐng)域,但放眼全局,它仍處于早期階段。就像任何一個典型的成長中少年一樣,在適應(yīng)現(xiàn)實世界時也存在問題。
還記得“80%的組織表示他們在生產(chǎn)中應(yīng)用了AI應(yīng)用程序”嗎?在這些應(yīng)用了人工智能技術(shù)的公司中,約有33%的公司表示采用人工智能技術(shù)的最大障礙是不穩(wěn)定性 - 不成熟且未經(jīng)證實。34%認為很難招聘到合格的工程師,40%表示信息技術(shù)基礎(chǔ)設(shè)施建設(shè)阻礙了人工智能技術(shù)的引進,且很容易對公司的財務(wù)造成不利影響。
資金也是一個重要影響因素。由于用于數(shù)據(jù)流編程的開源軟件庫越來越多,如Microsoft CNTK和Accord.Net,機器學(xué)習(xí)愛好者能夠以極低的成本進行研究和學(xué)習(xí)。然而,并非所有問題都能得到解決,因為并非一切都是已知的。為了實現(xiàn)產(chǎn)品創(chuàng)意,要平衡預(yù)算,仍有很長的路要走。
聲明:以上方法源于程序系統(tǒng)索引或網(wǎng)民分享提供,僅供您參考使用,不代表本網(wǎng)站的研究觀點,證明有效,請注意甄別內(nèi)容來源的真實性和權(quán)威性。申請刪除>> 糾錯>>