#物聯網IoT #人機介面HMI #人工智慧AI #語音交互 #智慧音箱 #人工神經網路ANN #深度神經網路DNN #深度置信網路DBN #遞歸神經網路RNN #卷積神經網路CNN
【語音辨識的沿革】
一直以來,通過語言與機器直接溝通,是很多技術人員追求的目標,可看似簡單的語音交互,卻經歷了長達半個多世紀的技術探索。這期間不管文學還是影視作品,都一次次描繪了人機語音交互的美好場景。但直到 21 世紀初,人與機器的語音交互仍然是令人抓狂的一種操作,遠遠沒有鍵盤和滑鼠來得方便。
在 1952 年,貝爾實驗室研發出了 10 個孤立數位語音的識別系統,為人類的語音辨識開啟了篇章;20 世紀 80 年代開始,以「隱藏式馬可夫模型」(hidden Markov model, HMM) 方法為代表的基於統計模型方法逐漸在語音辨識研究佔據主導地位,能很好地描述語音訊號短時平穩特性,將聲學、語言學、句法等知識集成到統一框架中。此後,HMM 的研究和應用逐漸成為了主流。
李開復在 HMM 模型的基礎上研發出 SPHINX 系統,這是技術人員首次嘗試「非特定人連續語音辨識系統」,其核心框架就是 GMM-HMM 框架,其中 GMM 是指 (Gaussian mixture model,高斯混合模型) 用來對語音的觀察概率進行建模,HMM 則對語音的時序進行建模。同時期發展出的技術,還有 20 世紀 80 年代後期人工神經網路 (ANN) 也成為語音辨識的一個方向。
直至 ANN 後來進化為深度神經網路 (DNN),語音辨識技術才有了本質的突破。到了 20 世紀 90 年代,隨著電腦技術的快速發展,包括個人電腦在內的一大批設備開始嘗試使用語音辨識技術。這一時期劍橋發佈的 HTK 開源工具包大幅降低了語音辨識研究的門檻。然而在接下來的一段時間,GMM-HMM 框架的技術局限性使得其應用效果差強人意。
在語音辨識技術方向中,具有更強的長時建模能力的遞歸神經網路 (又稱:迴圈神經網路,RNN)、卷積神經網路 (CNN),以及在語音辨識領域獨樹一幟的科大訊飛公司提出的 DFCNN 技術相繼出現,進而使得人機語音交互的體驗越來越好,以智慧音箱為代表的語音交互設備受到越來越多的消費者歡迎,比傳統 GMM-HMM 框架性能提升 30~60%,並與 Google 在語音辨識展開深度合作。
延伸閱讀:
《艱難中前行的語音交互技術》
http://www.compotechasia.com/a/feature/2019/0111/40859.html…
(點擊內文標題即可閱讀全文)
#科大訊飛Iflytek #DFCNN
人工神經網路ann 在 台灣物聯網實驗室 IOT Labs Facebook 八卦
人工智慧在自動駕駛車的作用
作者 : Anton Hristozov,軟體工程師/研究員
2020-10-12
自動駕駛車輛(autonomous vehicles)在農業、交通運輸和軍事等領域開始成為一種現實,很快地我們也將會看到它應用於一般消費者的日常生活中。
自動駕駛車輛根據感測器資訊和人工智慧(Artificial Intelligence;AI)演算法來執行一些必要的操作,因而需要收集資料、規劃並執行行駛路線。而這些任務,尤其是規劃和執行行駛路線需要非傳統的編程方法,這就有賴於AI中的機器學習(Machine Learning;ML)技術。
自動駕駛車輛仍有許多任務面臨巨大的挑戰,必須採用更先進縝密的方法來解決。取代人類的認知和運動能力並不是一件容易的事情,還需要持續多年的努力。AI還必須解決各種不同的任務,才能夠實現安全和可靠的自動駕駛。
宅經濟下,你需要知道電競週邊整合方案
本文將介紹讓自動駕駛車得以實現的AI應用,並提出其所面對的挑戰以及至今取得的成就,另外也探討了相較於傳統軟體的AI本質差異。在後續的文章中將進一步討論在自動駕駛領域進行開發、測試和部署AI技術的特定挑戰。
自動駕駛車的AI分析
自動駕駛車是汽車產業中成長最快速的領域,而AI則是自動駕駛車中最重要和最複雜的組成部份。圖1所示為典型的自動駕駛車組成。
自動駕駛車對於傳送即時數據的感測器數量,以及對數據進行智慧處理的需求可能會非常龐大。而AI主要被用於現代汽車的中央單元以及多個電子控制單元(ECU)中。
由於AI已在機器人等眾多領域中得到應用,它自然成為自動駕駛的首選技術。結合AI和感知等技術承諾可提供更安全、更具確定性的行為,從而帶來燃油效率、舒適性和便利性等優勢。
開發像自動駕駛車這樣複雜的AI系統面臨諸多挑戰。AI必須與多種感測器互動,並即時使用數據。許多AI演算法都是運算密集的工作負載,因此很難搭配使用記憶體和速度受限的CPU。現代車輛是一種即時系統,必須在時域中產生確定性結果,這關係到駕駛車輛的安全性。諸如此類的複雜分佈式系統需要大量的內部通訊,但這些內部通訊通常易於造成延遲,從而干擾AI演算法做出決策。此外,汽車中執行的軟體還存在功耗問題。運算越密集的AI演算法消耗功率也越多,尤其是對僅依靠電池充電的電動車(EV)而言,這會是一大問題。
在自動駕駛車中,AI用於執行多項重要任務。其主要任務之一是路徑規劃,即車輛的導航系統。AI的另一項重要任務是與感測系統互動,並解讀來自感測器的數據。
很顯然地,提供一套完整的解決方案來取代人類操控駕車的是一項艱鉅的任務。因此,製造商們開始將問題劃分為更小的部份,並逐一地解決,以期透過小幅進展最終實現完全的自動駕駛。業界一直不乏新創公司或具顛覆性的公司試圖解決所有的自動駕駛問題,並曾誓言要在2020年實現完全自動駕駛車上路。如今看來,現實顯然更複雜得多了,AI本質上存在的一些問題帶來了很多障礙。
隨著AI的發展與完善,我們將越來越接近具有安全且自主行駛的交通運輸願景。在那之前,我們必須展開長時間的開發與測試,而最終是否採用則取決於消費者的信心以及市場驅動力。儘管比預期費時更長,但一切終會發生。
需求與要求已經出現了,技術也幾近完備。其實際應用可能或快或慢,這完全取決於法規要求。分階段實施是可行之道,從比較簡單和更具確定性的用例開始,例如先在已知環境中導入自動駕駛。如果僅在具有較少未知的特定條件下行駛自動駕駛車,則可以充份緩解所使用的演算法壓力。
自駕車中的AI應用
感測器數據處理
自動駕駛車輛在運行期間,無數的感測器為車輛的中央電腦提供了數據,包括道路資訊、道路上出現的其他車輛資訊,以及如同人類感知般地偵測到任何障礙物的資訊。有些感測器甚至可以提供比普通人更好的感知能力,但要做到這一點就需要智慧演算法,用於理解即時產生的數據串流。
智慧演算法的主要任務之一是檢測並辨識車輛前方和周圍的物體。人工神經網路(ANN)是用於該任務的典型演算法,也稱為深度學習,因為神經網路包含許多層級,而每個層級又包含許多節點。圖2顯示了這種深度神經網路,不過在實際的神經網路中,其節點數和層數可能更多。
為了分類物體,視訊輸入分析採用機器學習演算法以及最可行的神經網路。由於我們有多個不同類型的感測器,因而必須為每個感測器配備專用的硬體/軟體模組。這種方法允許平行處理數據,因此可以更快做出決策。每個感測器單元都可以利用不同的AI演算法,然後將其結果傳達給其它單元或中央處理電腦。
路徑規劃
路徑規劃對於最佳化車輛行駛軌跡並產生更好的交通模式非常重要。它有助於降低延遲並避免道路擁堵。對於AI演算法來說,規劃也是一項非常適合它的任務。因為這是一項動態任務,可以考慮到很多因素,並在執行路徑時解決最佳化問題。路徑規劃的定義如下:「路徑規劃讓自動駕駛車輛能夠找到從A點到B點之間最安全、最便捷、最經濟的路線,它利用以往的駕駛經驗協助AI系統在未來作出更準確的決策。」
路徑執行
路徑規劃好之後,車輛就可以透過檢測物體、行人、自行車和交通號誌來掌握道路狀況,透過導航到達目的地。目標檢測演算法是AI社群的主要關注點,因為它能夠實現仿人類行為。而當道路情況不同或天氣條件變化時,挑戰就來了。許多測試車輛發生事故都是由於模擬環境與現實環境的條件不同,而AI軟體若接收到未知數據,很可能會做出無法預測的反應。
監測車輛狀況
最具前景的維護類型是預測性維護。其定義如下:「預測性維護利用監測和預測模型來確定機器狀況,並預測可能發生的故障以及何時發生。」它嘗試預測未來的問題,而不是已然存在的問題。從這方面來看,預測性維護可以節省大量的時間和金錢。包括監督學習和無監督學習都可用於預測性維護。其演算法能夠根據機載和機外數據來做出預測性維護的決策。用於該任務的機器學習演算法屬於分類演算法,例如邏輯迴歸、支援向量機以及隨機森林演算法等。
收集車險資料
來自車輛的數據記錄可以包含有關駕駛員行為的資訊,而且這些數據可以用來分析交通事故,也可用於處理車險理賠。所有這些都有助於降低汽車保險的保費,因為具有更加確定的安全性與保證。對於全自動駕駛車輛來說,賠償責任將從乘客(不再是駕駛人)轉移到製造商。而對半自動駕駛車輛來說,駕駛人仍可能承擔一部份責任。
要證明這一類的情況將越來越依賴於車輛AI系統所擷取到的智慧數據。來自所有感測器的數據會產生巨量的資訊,隨時保存所有數據可能不切實際,但是保存相關數據的快照,似乎是獲得證據的折衷方法,這些證據可用於特定交通事件的事後分析。這種方法類似於黑盒子保存數據的方法,可以在發生碰撞事故後根據其中的數據進行分析。
附圖:自動駕駛在農業、交通運輸和軍事等領域開始成為一種現實,很快地我們也將會看到它應用於一般消費者的日常生活中...
圖1:自動駕駛/連網車輛。(來源:Lentin, 2017)
圖2:深度神經網路示意圖(來源:Beachler, 2019)。
資料來源:https://www.eettaiwan.com/20201012ta31-role-of-ai-in-autonomous-vehicles/?fbclid=IwAR3ynFHau_8Podk-XKuJWJnvDbxUOR_TeNH-HWNiv7qOHV8LDTQAKVI3HmY