欧美重囗味sm群虐视频,97超碰人人操,A级国产精品片在线观看

人工智能開啟視覺處理新篇章：如何更好的理解這個世界

2020-07-20 09:53 電子產(chǎn)品世界

導(dǎo)讀：人工智能的第三次浪潮正席卷全球，而在這次計算機視覺功不可沒。視覺處理的終極目標(biāo)在于使得計算機能像人一樣觀察感知世界，核心任務(wù)就是對圖像進行理解，場景分類、目標(biāo)識別/圖像分類、目標(biāo)定位、目標(biāo)檢測、語義分割、三維重建、目標(biāo)跟蹤都是其研究內(nèi)容。

視覺與人工智能的融合

縱觀信息產(chǎn)業(yè)發(fā)展歷程，從個人電腦時代到移動互聯(lián)網(wǎng)時代，承載高性能計算的芯片決定新型計算平臺的基礎(chǔ)架構(gòu)和發(fā)展生態(tài)，并掌握著產(chǎn)業(yè)鏈最核心的話語權(quán)。傳統(tǒng)硬件架構(gòu)難以滿足人工智能時代深度學(xué)習(xí)的要求，新的算法需要新的硬件來支撐。同時，芯片的結(jié)構(gòu)將越來越像“大腦”，類腦芯片、智能芯片等將是人工智能的發(fā)展方向。

視覺芯片集成高速圖像傳感器和大規(guī)模并行圖像處理電路，能夠模仿人類視覺系統(tǒng)視覺信息并行處理機制，解決現(xiàn)有視覺圖像系統(tǒng)中數(shù)據(jù)串行傳輸和串行處理的速度限制瓶頸問題。人工智能（AI）視覺芯片與攝像頭的關(guān)系是：芯片做的是大腦，攝像頭做的是眼睛。

人眼的成像是非常聚焦的，只看到關(guān)注的東西。而當(dāng)AI算法解決了“要看什么”的問題后，前端成像就有了目標(biāo)，可以把所有的資源都調(diào)配到關(guān)注的對象上，做到“指哪打哪”，也就是取出噪音的處理過程，可以更高效智能地處理視覺信息。這種根據(jù)AI的需求來成像，能解決很多以前解決不了的問題。

現(xiàn)在，人工智能視覺處理已從數(shù)據(jù)中心迅速發(fā)展到邊緣，最新的專用集成電路（ASIC）和片上系統(tǒng)（SoC）IP正在圍繞一個主題發(fā)展，即從視覺信息的預(yù)處理，到傳統(tǒng)的計算機視覺算法，然后再用神經(jīng)網(wǎng)絡(luò)進行邊緣推理，產(chǎn)生對象檢測、識別以及適當(dāng)?shù)膭幼?，是包括計算機視覺深度學(xué)習(xí)在內(nèi)的多種機器學(xué)習(xí)的總稱。

這些網(wǎng)絡(luò)的設(shè)計旨在使用數(shù)字等效物和感知器來模擬人腦的神經(jīng)元和突觸，它們通常需要經(jīng)過訓(xùn)練，才能識別視覺等數(shù)據(jù)中的模式，然后當(dāng)遇到新的數(shù)據(jù)時，就可以從中推斷出數(shù)據(jù)可能的含義。

在過去十年，由于可負擔(dān)計算能力的增加，以及卷積神經(jīng)網(wǎng)絡(luò)（CNN）及其所用傳感器的發(fā)展，視覺處理一直在以指數(shù)級的速率進步。具體而言，若能根據(jù)傳感器、數(shù)據(jù)集和SLAM（同時定位與映射）算法輸入去“了解”世界并對其“開發(fā)出”表征模型，那么系統(tǒng)就可以開始掌握周圍環(huán)境及其在空間中的位置，并做出預(yù)測和采取行動。

在對人工智能而非提高像素的需求推動下，特別是在由計算機視覺和數(shù)據(jù)驅(qū)動的決策制定方面，GPU（圖形處理單元）領(lǐng)域已出現(xiàn)一場革命：神經(jīng)網(wǎng)絡(luò)的到來已使視覺處理成為現(xiàn)代世界的關(guān)鍵因素。因此，機器人處理操作、智能監(jiān)控攝像頭以及汽車高級駕駛輔助系統(tǒng)（ADAS）等相關(guān)行業(yè)都發(fā)生了變化 —— 隨著這類技術(shù)的全面涌現(xiàn)，未來還將出現(xiàn)更多新的應(yīng)用。

人工智能視覺處理都能做什么？

一片小小的人工智能視覺芯片能做什么？無人駕駛汽車主動識別并避讓行人、攝像頭實時甄別在逃犯，這些影視作品中的情節(jié)，或許不久將可通過基于嵌入式人工智能視覺芯片的“解決方案”成為現(xiàn)實。人工智能芯片被視為未來人工智能時代的戰(zhàn)略制高點。在視覺感知領(lǐng)域，人工智能視覺芯片正逐步應(yīng)用于智能手機、安防監(jiān)控、自動駕駛、醫(yī)療成像和智能制造等領(lǐng)域。

· 自動駕駛：自動駕駛汽車上裝有多個攝像頭，用來實現(xiàn)計算機視覺、對象識別、車道警告和駕駛員監(jiān)控，以及其他傳感器（例如，熱成像、RADAR和LiDAR）而實現(xiàn)傳感器融合。人工智能和路徑規(guī)劃可以識別和預(yù)測是否有小孩會走到公路上，從而讓車輛預(yù)測和減速，以便采取規(guī)避行動。在更簡單的層面上，自動代客泊車可以使駕駛員省去尋找停車位的負擔(dān)。

· 醫(yī)療成像：其中最突出的應(yīng)用領(lǐng)域是醫(yī)療計算機視覺和醫(yī)學(xué)圖像處理，這個區(qū)域的特征的信息從圖像數(shù)據(jù)中提取用于使患者的醫(yī)療診斷的目的。可以從圖像數(shù)據(jù)中提取的一個例子是檢測的腫瘤，動脈粥樣硬化或其他惡性變化，它也可以是器官的尺寸，血流量等。

· 智能制造：信息被提取為支撐的制造工序的目的，例如，質(zhì)量控制其中的信息或最終產(chǎn)品被以找到缺陷自動檢測。同時也被大量用于農(nóng)業(yè)的過程，從散裝材料，這個過程被稱為去除不想要的東西，食物的光學(xué)分揀。

· 軍事應(yīng)用：最明顯的例子是探測敵方士兵或車輛和導(dǎo)彈制導(dǎo)。更先進的系統(tǒng)為導(dǎo)彈制導(dǎo)發(fā)送導(dǎo)彈的區(qū)域，而不是一個特定的目標(biāo)，并且當(dāng)導(dǎo)彈到達基于本地獲取的圖像數(shù)據(jù)的區(qū)域的目標(biāo)做出選擇?，F(xiàn)代軍事概念，如“戰(zhàn)場感知”，意味著各種傳感器，包括圖像傳感器，提供了豐富的有關(guān)作戰(zhàn)的場景，可用于支持戰(zhàn)略決策的信息。在這種情況下，數(shù)據(jù)的自動處理，用于減少復(fù)雜性和融合來自多個傳感器的信息，以提高可靠性。

視覺處理行業(yè)的產(chǎn)業(yè)鏈?zhǔn)怯缮嫌位A(chǔ)層、中游技術(shù)層以及下游應(yīng)用層組成的。

· 上游基礎(chǔ)層基礎(chǔ)層：主要包括CPU、GPU等芯片硬件，深度神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等算法，以及由真實數(shù)據(jù)和模擬數(shù)據(jù)共同構(gòu)成的數(shù)據(jù)集。核心芯片被Intel、Nvidia等傳統(tǒng)芯片廠商把控，新型芯片廠商尚未崛起，規(guī)模應(yīng)用有待時日；開源平臺以谷歌的Tensorflow、Facebook的Caffe等為主，其它企業(yè)的深度學(xué)習(xí)框架多為二次開發(fā)。

· 中游技術(shù)層：主要包括視頻識別、圖片識別、模式匹配等嵌入式視覺軟件，以及一站式解決方案。算法，初創(chuàng)企業(yè)占優(yōu)；云計算，幾乎被AWS、Google Cloud、Azure、阿里云等壟斷。

· 下游應(yīng)用層：為計算機視覺的落地場景，包括智慧安防、智慧金融、手機應(yīng)用、無人駕駛等商業(yè)領(lǐng)域。垂直行業(yè)龍頭占據(jù)場景，技術(shù)層初創(chuàng)企業(yè)向上滲透。

由此，可以將國內(nèi)計算機視覺的玩家分為三類：

1. 海康威視、大華股份、宇視科技等安防廠商：安防影像分析的市場需求驅(qū)動此類企業(yè)的技術(shù)研發(fā)，近年來安防行業(yè)頭部廠商紛紛推出自家智能化產(chǎn)品和解決方案。作為人工智能范疇中最關(guān)鍵的子領(lǐng)域之一（人類從外界獲取的信息中有80%~85%是依靠視覺實現(xiàn)的），計算機視覺技術(shù)的愿景是利用攝像機等視覺傳感裝置來代替人眼對物體進行識別、跟蹤和測量，再由計算機處理這些視覺信息，從而達到像人眼一樣對事物進行感知和認知，直接對應(yīng)安防監(jiān)控系統(tǒng)“看得懂”的需求。

2. 互聯(lián)網(wǎng)巨頭公司：近年來基于深度學(xué)習(xí)的智能語音、計算機視覺、自然語言處理等技術(shù)開始向各個應(yīng)用領(lǐng)域滲透，全球人工智能產(chǎn)業(yè)規(guī)?？焖僭鲩L。為搶占人工智能高地，谷歌、微軟、阿里巴巴、百度、騰訊、IBM、Facebook 等國際知名企業(yè)均持續(xù)增加在人工智能領(lǐng)域的資本投入。美國、中國、英國、德國、日本等國家也分別出臺人工智能相關(guān)支持政策及國家戰(zhàn)略規(guī)劃，為整個產(chǎn)業(yè)的發(fā)展創(chuàng)造良好的政策環(huán)境。

3. 創(chuàng)業(yè)公司：包括商湯科技、依圖科技和曠視科技等企業(yè)，普遍以細分領(lǐng)域為發(fā)力點，布局思路各異。在商湯、曠視、依圖等頭部企業(yè)看，各家戰(zhàn)略思路差異明顯。商湯致力于構(gòu)造平臺，專注底層基礎(chǔ)應(yīng)用，力圖在完善平臺后于其他領(lǐng)域快速落地。曠視則在致力于在安防、金融、零售、汽車、教育等廣泛領(lǐng)域提供軟硬件一體化的解決方案。依圖則表現(xiàn)出對安防、醫(yī)療兩大領(lǐng)域的專注深耕，依托產(chǎn)品化、工程化能力深入落地。

AI視覺未來的發(fā)展

視覺人工智能行業(yè)的發(fā)展，離不開技術(shù)的驅(qū)動：一方面諸如GPU、FPGA、ASIC等一系列AI芯片的出現(xiàn)極大提升了芯片計算能力，突破了傳統(tǒng)CPU的算力瓶頸；另一方面以深學(xué)習(xí)為代表的AI算法的崛起，使得AI視覺的識別能力有了很大的提高。硬件算力的提升以及軟件算法的進步都對視覺人工智能的發(fā)展起到了重要的推動作用。

AI視覺行業(yè)的快速發(fā)展一方面得益于現(xiàn)階段算力的大幅提升及算法的大幅改善（國內(nèi)算法甚至已經(jīng)達到國際水平），另一方面則受益于下游應(yīng)用市場的廣闊空間。機器學(xué)習(xí)、深度學(xué)習(xí)等算法能力的不斷增強促進了視覺人工智能行業(yè)的高速發(fā)展。

視覺處理的工作流程包含四個模塊：檢測、分類、跟蹤與語義分割。具體為成像設(shè)備首先捕獲圖像，然后對每個圖像進行預(yù)處理，提取特征后輸入到分類模型中。人工智能視覺是采用圖像處理、模式識別、人工智能技術(shù)相結(jié)合的手段，著重于一幅或多幅圖像的計算機分析。

圖像可以由單個或者多個傳感器獲取，也可以是單個傳感器在不同時刻獲取的圖像序列。在消費級領(lǐng)域，隨著數(shù)據(jù)量上漲、運算力提升和深度學(xué)習(xí)算法的發(fā)展，計算機視覺技術(shù)越來越多地被應(yīng)用在各類消費級應(yīng)用場景中，典型的如人臉識別服務(wù)，具體包括人臉檢測、人臉關(guān)鍵特征點、人臉對比、人臉?biāo)阉?、人臉屬性、人臉聚類、人力活體檢測等。

AI視覺處理就是用各種成像系統(tǒng)代替視覺器官作為輸入敏感手段，由計算機來代替大腦完成處理和解釋。這里要指出的一點是在計算機視覺系統(tǒng)中計算機起代替人腦的作用，但并不意味著計算機必須按人類視覺的方法完成視覺信息的處理，計算機視覺可以而且應(yīng)該根據(jù)計算機系統(tǒng)的特點來進行視覺信息的處理。但是，人類視覺系統(tǒng)是迄今為止，人們所知道的功能最強大和完善的視覺系統(tǒng)。

當(dāng)前人工智能理論和技術(shù)日益成熟，應(yīng)用范圍不斷擴大，產(chǎn)業(yè)正在逐步形成、不斷豐富，相應(yīng)的商業(yè)模式也在持續(xù)演進和多元化。據(jù)IDC統(tǒng)計，2018年我國人工智能市場規(guī)模為161.9億元，預(yù)計到2022年市場規(guī)模將接近700億元，年復(fù)合增長率超過50%。據(jù)中國人工智能學(xué)會和羅蘭貝格咨詢公司預(yù)測，2025年市場規(guī)模將達到3萬億美元。

以深度學(xué)習(xí)為代表的人工智能算法的出現(xiàn)極大推動了視覺人工智能行業(yè)的發(fā)展。計算機視覺是人工智能行業(yè)的最大組成部分，與其他細分的比較來看，計算機視覺技術(shù)應(yīng)用的市場規(guī)模也遠遠大于其他細分。

那么，視覺系統(tǒng)芯片如果在未來實現(xiàn)產(chǎn)業(yè)化，其市場空間有多大？據(jù)推算，2018年，圖像傳感器的市場規(guī)模在150億美元左右，雖然其中120億美元發(fā)生在智能手機領(lǐng)域，但未來發(fā)展比較快的4個領(lǐng)域是安防、國防、汽車、醫(yī)療，到2021年將會迎來40億美元的市場空間，年增長率約10%—20%。

視覺處理器的需求增長會更快，目前該市場的整體規(guī)模（包括硬件、軟件、服務(wù)）在170億美元至180億美元，單從硬件來看也占到約30億美元。如果視覺系統(tǒng)芯片可以覆蓋70億美元的市場規(guī)模，企業(yè)在這中間拿到1%的話，其盈利空間就已經(jīng)很大了。

近年來，國內(nèi)外一批新型人工智能企業(yè)，依托人工智能領(lǐng)域技術(shù)和算法優(yōu)勢向芯片行業(yè)滲透，加強人工智能芯片基礎(chǔ)層研發(fā)。從市場格局來看，已經(jīng)發(fā)展成為一個相對獨立又相互依存的產(chǎn)業(yè)生態(tài)。在前端，索尼是圖像傳感器市場、生產(chǎn)和技術(shù)的領(lǐng)導(dǎo)者，緊隨其后的三星和豪威科技也保持著不錯的競爭力；在后端，Mobileye和英偉達（NVIDIA）是提供視覺處理芯片的主要廠商，在國內(nèi)該領(lǐng)域的公司有地平線等。

然而，截至目前，尚未有企業(yè)實現(xiàn)“圖像傳感器+視覺處理器”集成式芯片的大規(guī)模量產(chǎn)。不管是現(xiàn)在的創(chuàng)業(yè)企業(yè)，還是已經(jīng)在市場上占有一定份額的大企業(yè)，不是做圖像傳感器，就是做后端的視覺處理器，這將給初創(chuàng)企業(yè)帶來機會。

人工智能開啟視覺處理新篇章：如何更好的理解這個世界

相關(guān)閱讀