機器視覺有望超越人類的極限
ImageNet大型視覺識別挑戰賽,是一項為那些試圖開發視覺機器人的科學家舉辦的年度比賽。參賽者必須針對那些具有特定圖像的物體開發出相應的算法,而這個比賽很好的證明了這一趨勢。
到目前為止,無法識別圖像的計算機很難對數以百萬計的圖像進行解析和提取。但自2012年以來,參加這個挑戰賽的人數在逐年增加,并且很有可能在近幾年超過我們現有的這一部分。
那么,2012年發生了什么改變?一個來自加拿大多倫多大學的團隊提出了一個叫做“監督”的算法,可以通過深卷積神經網絡將圖像劃分為1,000個獨立的類。
發明于1980年代初的深卷積神經網絡,由多層排列的人工神經元組成,它們反映出了人類大腦處理視覺的方法。隨著摩爾定律推動著計算機技術越來越強大,這些網絡能夠更好的模仿神經網絡的實際運作方式。
如今的深卷積神經網絡更加強大。今年ImageNet挑戰賽的贏家是GoogLeNet,來自谷歌的工程師團隊發明的算法只有6.65%的錯誤率,在相同任務中已經接近人類的錯誤率。
隨著視覺網絡成為互聯網越來越重要的一部分,我們正看到圖像學習的使用率在增加。Pinterest收購了VisualGraph,這是一家致力于機器視覺的企業,可以將圖片中的衣服和手袋提取并分類。
來自谷歌GoogLeNet項目團隊的工程師ChristianSzegedy,對于機器視覺的技術應用,可能遠遠超過我們人類使用眼睛的方式。他寫道:
這些技術的進步將是我們更好的理解圖像,這些進展也直接的將谷歌的產品,例如照片搜索,圖片搜索,YouTube,汽車自動駕駛,以及任何需要圖像識別的地方。
文章版權歸西部工控xbgk所有,未經許可不得轉載。
下一篇:中美云機器人合作研究取得成功