Momenta完全無人駕駛首次曝光!城區道路混行無接管,遭遇逆行也不怕,特斯拉Waymo路線二合一
本文來源:量子位微信公眾號 QbitAI 作者:李根
…………………………………………………………
Momenta(現在)是一家怎樣的公司?
宏觀印象:學霸創業、中國無人車獨角獸、賓士母公司戴姆勒加持、自動駕駛第一梯隊玩家……
產品業務:高速場景方案產品、L4級自主泊車產品交貨、最高等級高精度地圖資質……
一千個維度有一千種答案,但也頗顯盲人摸象。
只是從今往後,Momenta的技術路徑開始完整清晰。
在通往自動駕駛實現大道上,之前有漸進式的特斯拉,也有一步到位的Waymo,天下方案,莫過於此。
而現在,Momenta集二者之所長,避二者之所短:
Tesla+Waymo,就是Momenta。
▌完全無人駕駛發佈
12月26日,Momenta對外正式發佈L4級無人駕駛技術MSD (Momenta Self Driving),開始支持城市內完全無人駕駛場景。
如果說2019年來Momenta發佈的前裝量產產品Mpilot,更像是特斯拉方案。
那麼現在,MSD上馬,則顯出Waymo路線雄心。
萬萬沒想到,自動駕駛業內一度紛爭的兩種路線,如今讓Momenta實現二合一。
但MSD究竟是一套怎樣的方案?
區別於量產前裝方案,Momenta完全無人駕駛方案中最明顯不同在於多了雷射雷達。
在其測試車中,共搭載12個攝像頭,5個毫米波雷達和1個雷射雷達。整套系統感測器方案以攝像頭為主,雷射雷達為輔,多感測器冗餘。
而且Momenta強調,除去雷射雷達,方案中的硬體選型與前裝量產保持一致——這也是Momenta“兩條腿”向前的關鍵考量,後面還會詳細講到。
不過,說一千道一萬,無人駕駛——還得以身試乘看一看。
MSD方案的試乘,選在了Momenta(蘇州),地點毗鄰蘇州高鐵北站,屬城建頻繁區域,路線全程約12公里,沿途經過30餘個紅綠燈路口:
既包括無保護左轉等典型場景,也有非機動車混行、立交橋下長路口等複雜路段。
路線中還有多處工地,也有學校、居民區、寫字樓、商業中心等生活場景。
符合Momenta該方案目標所指:城市區間內,完全無人駕駛。
而且路段基礎設施也沒有過V2X改造,依然拼的是單車智慧實力。
車流交匯交互,也是最有意思的場景。MSD方案雖初發佈,但智慧程度已有老司機風範,在試乘的幾次交互場景中,有讓行、也有選擇先過,並不基於單一規則。
同車試乘的Momenta研發總監夏炎解釋,這能體現MSD在預測規劃方面的實力和學習能力。
不過整體試乘而言,因為城市區間不同高速場景(無人車混行)和停車場(低速),Momenta的AI司機給人的印象是:安全第一,寧慫不偏激。
比如在蘇州相城道路,會出現不規則的異型車——挑戰自動駕駛系統的感知識別。
其實從當天道路實際情況來看,系統完全可以“偏激”一些,讓路不減速通過。
但安全第一思考下,Momenta工程師打造的該系統,在交通中不確定性較大的情況下,先減速,甚至刹車,確保交互雙方的安全。
而且相比人類老司機,MSD雖初生牛犢,但也展現出不凡實力。
遭遇人類司機深為苦惱的大貨車時,既要對大貨車的載貨品類多樣、形態各異準確感知,還要對大貨車行為上的激進行為有應對:
MSD跟隨慢速行駛的大貨車一段時間後,“決定”變道超車,但在超車過程中仍保持對貨車一定的安全距離,通過接近路口的實白線後才拉大橫向距離超車,保證了超車過程中的安全性。
▌完全無人駕駛新速度
12公里左右里程,按道路交規限速行駛(40公里每小時為主),近40分鐘,歷經城區內各種場景——有臨時施工、有不規則車輛,還有逆行,但全程無接管。
這樣的完全自動駕駛能力,起步最早的穀歌用了近十年,百度從開始研發到落地也超過5年,一眾自動駕駛新勢力從無到有也走過了快3年……
雖然深度學習、大數據和大計算帶來的指數加速,已再明顯不過。
但得知Momenta的速度,依然讓人不可思議:
50人左右的團隊,5個月左右的時間。
沒錯,從今年下半年交貨量產自動駕駛產品後,Momenta才開始囤積重兵,依靠公司長期的技術和數據積累,以及量產自動駕駛和完全無人駕駛通用的平臺支持,開始攻堅完全無人駕駛。
至於能夠達到城區開放道路全程無接管,之前行業內最快的友商也差不多用時1年,且積累了至少十萬公里以上實際路測里程。
所以Momenta之速,背後究竟有“引擎”?
Momenta CEO曹旭東認為,與他們內部看問題的角度、方法和戰略選擇有關。
Momenta創辦,從一開始就明確目標,要打造自動駕駛大腦。
這並非傳統汽車產業內“換輪子”,而是行業開始AI化變革後,供應鏈環節中的新機會。
汽車產業鏈中:
有最基礎的Tier1一級供應商,如博世、大陸,在系統層面、硬體層面提供產業支援。
再往上則是OEM廠商,賓士、寶馬、豐田……即車廠。
還有智慧化的基礎——計算晶片,如TI、NXP、瑞薩和英偉達。
最後,核心新增的玩家,一方面是提供出行網路的滴滴Uber等,另一方面則是提供自動駕駛所需核心演算法和軟體的技術公司。
比如定位“自動駕駛大腦”的Momenta,就處於這一層。
但即便如此,如何實現完全自動駕駛,如何最高效擁抱未來,也沒有清晰明確的答案。
至少在打造自動駕駛大腦這件事上,特斯拉方案和Waymo路線一度不可調和。
▌兩個路線的爭論
所謂特斯拉路線,是按照自動駕駛等級的劃分,從低級往高級不斷升維,通過量產汽車對場景、數據和演算法的反覆運算,最終實現完全無人駕駛。
而且正是因為堅定量產路線,也為了最低門檻獲取數據、場景和功能回饋,偏執狂馬斯克完全依靠攝像頭方案、不使用價格昂貴的雷射雷達。
所以即便2019年發佈為完全自動駕駛而生的FSD硬體,外界也不相信馬斯克2020百萬RoboTaxi的豪言。
而Waymo路線,則認為只有從一開始L4才能實現RoboTaxi。該路線中,人機共駕的高級輔助駕駛被認為有天然Bug——既要機器輔助駕駛,又要人類在緊急時刻接管,顯然不靠譜。
於是Waymo從2009年正式推動後,逐漸明確了實現方式:
原型車、規模化路測、在豐富場景中不斷反覆運算,區域內落地,終極場景是讓無人車行駛運營在任何時間、任何地點和任何場景。
但Waymo路線中,最難的是無窮無盡的“長尾”問題,現實中總會有出乎預料的新場景、特殊挑戰,這就要求自動駕駛系統足夠聰明、且學習反覆運算得足夠快。
所以概括而言,二者優缺點都很明顯。
特斯拉方案:想依靠低成本感測器方案不斷升維,難且有道德挑戰;但好處是數據“眾包”,能在量產中獲得現金流和數據流程。
Waymo路線:希望一己之力不斷擴大無人車隊規模,最終真正實現完全落地,險且依賴融資燒錢;而好處是安全性相較而言更可控,不用把車主當小白鼠。
但如今Momenta之行動,所謂“兩條腿”戰略,卻實現了特斯拉和Waymo路線的二合一。
即,通過量產自動駕駛產品獲得海量數據,持續研發數據驅動的核心演算法,打造閉環自動化工程體系,發揮數據價值,高效反覆運算數據技術,最終實現完全無人駕駛。
同時,MSD的技術框架中不同感測器的感知演算法相互獨立冗余,並非完全依賴某一種感測器,因此目前量產感測器收集的數據,如視覺、地圖、軌跡數據等可以無縫應用並有效助力MSD演算法提升。
最終,一個數據流程和技術流的閉環搭建完成,量產自動駕駛和完全無人駕駛,真正互相補益。
但為何能打通?又為什麼是Momenta?
一切要從Momenta創立之初對自動駕駛的認知說起。
▌終局視角思考無人車
Momenta 2016年創辦,當時就分析過特斯拉模式和Waymo路線。
但並非為結合二者而生。
曹旭東回憶,從一開始就希望從本質出發、從終局角度思考問題。
Momenta的思考中,自動駕駛的終局,一定是L4級以上,不需要方向盤、不需要人類司機。
但要實現這個終局,結合深度學習為核心的AI新浪潮,兩大要素就格外關鍵:
一是數據驅動。
二為海量數據。
之所以要數據驅動,是因為完全無人駕駛中的長尾問題——幾乎是難以窮盡的。
唯一的可能性只有數據驅動,自動化解決大部分的問題,例如99%問題。
所以Momenta內部,“架構師”文化興盛,他們目標是架構能夠自動化解決問題的系統。
在當前系統中,Momenta的 “閉環自動化”方法論就已發揮作用,通過建立對問題自動化發現、記錄、標注、訓練、驗證的閉環過程,為技術和數據提供自動化的反覆運算能力。
而關於海量數據,這是數據驅動的原料和前提。
之前有粗略估計,實現完全無人駕駛,需要100萬輛車跑一年,每輛每天跑10小時以上。
如此海量數據,完全依靠自建車隊採集,幾乎不現實。
量產自動駕駛數據流程能夠助力完全無人駕駛,源自統一量產感測器方案。
MSD感測器方案包括視覺感測器、雷射雷達與毫米波雷達,均覆蓋360°範圍,該感測器方案子集與量產感測器方案保持一致。
所以理解了無人駕駛終局的兩大要素,或許也就不難明白Momenta此次談及的兩條腿戰略:
一條腿是量產自動駕駛;
另外一條是完全無人駕駛。
量產自動駕駛,人車共駕,以人為主,但解放人類在高速環路、停車場等場景下的駕駛時間,提升駕駛安全性及駕駛體驗。
而且通過量產自動駕駛,實現海量數據獲取——學特斯拉又超乎其外。
進一步,量產自動駕駛可以給完全無人駕駛帶來數據,通過數據驅動的方式,去自動化地解決99%的問題。
未來隨著量產產品上市,像 “活水”一般源源不斷注入MSD,推動MSD演算法不斷升級,使得完全無人駕駛系統不斷進化。
這是數據流程上的打通。
而通過完全無人駕駛,還能給量產自動駕駛回饋技術流,不斷提升體驗和能力,讓量產自動駕駛持續進步,提升行業份額。
當然,數據流程和技術流形成閉環,聽起來不算稀奇。
但真正實現這樣的戰略並不容易,關鍵是量產感測器方案的一致性、互補性,並在量產自動駕駛戰略中真正快速低成本交貨、落地。
這也是特斯拉和Waymo難以跨公司二合一的原因。
另外,作為創業公司,在數據流程和技術流閉環之外,靠融資燒錢顯然不可持續,必然還需要現金流。
所以Momenta創辦3年來,先在量產自動駕駛發力,實現數據流程和現金流方面的驗證,然後發力完全無人駕駛,同時著力於打通兩者之間的數據流程和技術流。
現在,完全無人駕駛方案發佈,數據流程和技術流的戰略雛形形成,現金流也能讓公司不受輿論和資本市場變化而左右。
曹旭東說, 目前Mpilot 和MSD的原型發佈,標誌著兩條腿的雛形期形成。預計到2019年-2024年,量產自動駕駛大規模上市,以及MSD真正的完全數據驅動,完全自動化,則是“兩條腿”戰略得到驗證的時刻,也是戰略的成型期。
▌道阻且長,行則將至
不過,也還沒到一腳定江山的時刻。
雛形初現,一切還只不過是開始。
更何況這樣的戰略完整披露,一方面會面臨質疑,另一方面也有被複製的風險。
但曹旭東並不擔心。他說:“戰略沒有優劣,戰略是選擇。這個戰略有其優點,也有難點和挑戰。我們在選擇戰略同時,也必須克服和解決其背後難點。我相信,戰略發佈後,看到的不是抄襲,更多的是爭議。在戰略執行時,遇到困難,可以選擇繼續走下去,也可以去選擇其他戰略,但我們選擇迎難而上。道阻且長,行則將至。”
按照Momenta的說法,執行層面主要面臨兩個維度的挑戰:包括技術難度和商業難度。
技術層面的難,例如數據流程的打通。曹旭東認為,行業主流都是以雷射雷達為主的技術解決方案,但Momenta是以統一量產感測器為主,需要打通量產自動駕駛到完全無人駕駛的數據流程,而他們在其中做了大量的技術創新。
在矽谷拜訪時,曹旭東也講到Momenta的戰略和已解決的技術難題,得到很多行業專家的認可和欣賞,因為Momenta在做原始的技術創新,而不是簡單的複製跟隨。
商業層面的難,包括如何深入行業、理解客戶,如何拓展能力邊界及更好的服務市場。
曹旭東進一步解釋:“To B是系統性的業務,面對的是一個組織,需要得到方方面面的認可。一線客戶都有很強的技術能力和很高的技術標準,需要經過非常嚴格的技術評測。而我們經過層層驗證,最後獲得了客戶的認可,進入了量產體系。”
Momenta也有相對長遠的完整時間表。
他們內部,認定2016年-2019年是戰略雛形期,2019年-2024年是戰略成型期。
然後2024年-2028年才是真正的戰略爆發期,那時候在完全自動駕駛“這條腿”上將加速趕上Waymo。
只是現在開始,自動駕駛“面壁者”Momenta,戰略意圖一覽無餘。
▌告別盲人摸象
作用力也才剛剛開始。
從Momenta自身來說,徹底告別被“盲人摸象”狀態。
高精度地圖供應商?高級輔助駕駛玩家?量產自動駕駛交貨……
都不準確。
大道至簡,Momenta(現在)是一家怎樣的公司?
Momenta = Tesla + Waymo。
而且這種結合帶來的新場景新技能,還可能不是線性相加。
或許也是聚變反應。
比如特斯拉一直是從車角度提供方案,Waymo則是運力技術維度……
但二者結合,就是完整軟硬體集合體,載人載貨,私家車共用車,都有了可能。
簡而言之,能做的更多,可以做的更多,新價值已經展現,新邊界也就要重勘。
自然還會進一步帶動行業新格局重塑。
自動駕駛發展中,特斯拉方案和Waymo路線,一次次被提起,一次次被模仿,一次次被對標。
這樣的新玩家新勢力,無論中美,都可以舉出很多。
但今日之Momenta,在理論上真正達到二合一,並且驗證了可行性。
於是,之前衡量自動駕駛的時間表,曾經理解Momenta的框架,可能是時候刷新了。
▌One more thing
雖然Momenta是中國自動駕駛的獨角獸,但作為Momenta的船長,曹旭東最關心的並不是公司的估值。
他認為商業世界一切有為法,一定離不開價值規律本身,估值並不需要過分關心。
他關心什麼?
作為CEO,他說核心還是人,組織的學習、進步和提升。
這位Momenta創始人,今年來自上而下改變了一件小事:不再把“創始人”放在對內對外的任何地方,僅以職務——CEO示人。
他解釋說,Momenta正在最大限度通過組織變革、文化塑造,形成合夥人文化。
合夥人不分加入先後,不論年齡資歷,核心關注的是技術、貢獻和志同道合。
他希望以此吸引最頂級的牛人,讓更多有識之士加速自動駕駛終局到來。
《道德經》裡說,夫唯不爭,故天下莫能與之爭。
但真正能邁步實踐者,少之又少。
如今,無人車獨角獸Momenta,宣示兩條腿,放下“自我”,立志要做推動終局實現的那個玩家。
這就是Momenta。
線性規劃演算法 在 天地人學堂 Facebook 八卦
【天地人跨產業沙龍 N.111】橫跨三大領域:(1)董福興(Bobby),汪達數位出版 / 總經理(華文電子書市場剖析暨電子書製作):華文電子書市場趨勢與挑戰、電子書編輯流程與製作技術、數位出版之於平台商與出版商之角色、優勢與案例解析。(2)莊凱詠(Peter),大山北月 / 執行長(複合式空間營運策略暨策展執行):複合式空間之營運暨獲利模式、菜單規劃與餐廳營運成本分析、空間策展之規劃暨執行know-how。(3)邵唯晏(Alfie),竹工凡木設計研究室 / 設計總監(當代建築市場與設計工程案例解析):當代建築市場趨勢與挑戰、非線性建築之特質、優勢與案例剖析、建築及室內設計人才市場剖析與趨勢走向。【天地人跨產業沙龍 N.111】至3/2(三)中午12:00報名截止,一次三會、三時吸收三方產業獨家精彩個案,會後跨產業人際網路交流與拓展,僅開放130位線上報名。報名與瞭解更多>>> http://goo.gl/mYAe9y
✔ 董福興(Bobby):汪達數位出版 / 總經理(華文電子書市場剖析暨電子書製作)
✔ 莊凱詠(Peter):大山北月 / 執行長(複合式空間營運策略暨策展執行)
✔ 邵唯晏(Alfie):竹工凡木設計研究室 / 設計總監(當代建築市場與設計工程案例解析)
✔ 董福興(Bobby):汪達數位出版 / 總經理(華文電子書市場剖析暨電子書製作)
曾任台灣第一個製作紙電同步及純數位雜誌之總編輯,現為汪達數位出版總經理,致力推動EPUB 3.0格式普及化,透過科技、排版促進數位出版市場活絡,身兼大塊文化出版、台灣角川與日本BookWalker合資之台灣漫讀之顧問。Bobby更以專家身分受邀參與W3C(World Wide Web Consortium)國際化小組,並擔任中文排版工作小組共同主席,解決中文數位出版之排版不相容問題,著有「中文排版需求」。W3C成立於麻省理工學院電腦科學實驗室,創辦者為web之父提姆柏納-李(Tim Berners-Lee)。
Bobby為華文地區Web與App等內容排版專家,除了提供電子書製作工具、編輯流程顧問與製作技術教學等服務,也製作電子書,包含:《華氏451度》、《貧窮文化》、《電子書到底搞什麼?》、《無架構的暴政》等。N.111天地人空間跨產業沙龍邀請到汪達數位出版總經理董福興(Bobby)分享:
(1)華文電子書市場趨勢與挑戰;
(2)電子書編輯流程與製作技術;
(3)數位出版於平台商與出版商之角色、優勢與案例解析。
✔ 莊凱詠(Peter):大山北月 / 執行長(複合式空間營運模式暨策展執行)
Peter畢業於清華大學服務科學研究所,現為大山北月執行長、新竹台三線策展人。大山北月為結合藝文展覽、餐廳佳餚之複合式空間,眺看新竹大山背景色,獲選為2014 Taipei Walker全台60家景觀好店。大山北月前身為廢棄小學,Peter活用舊址並策劃各項活動、空間策展與季節特展,包含:大家來找「茶」在地小旅行、150人夢幻婚禮、草地音樂會等。其餐廳採用鄉村食材、整合在地資源,藉以活絡當地人文及農業生態。
延伸廢棄國小概念,Peter將大山北月打造成親子同樂場所,桌椅採用國小課桌椅、點菜單以考試卷呈現,吸引都市人潮上山體驗。Peter曾獲2014關鍵評論網未來大人物、2013 onTrack創業列車Most Innovative Award。N.111天地人空間跨產業沙龍邀請到大山北月執行長莊凱詠(Peter)分享:
(1)大山北月之營運暨獲利模式;
(2)菜單規劃與餐廳營運成本分析;
(3)空間策展之規劃暨執行know-how。
✔ 邵唯晏(Alfie):竹工凡木設計研究室 / 設計總監(當代建築市場與設計工程案例解析)
竹工凡木設計總監、CSID中華民國室內設計協會歷年最年輕秘書長、國立交通大學建築研究所博士候選人。Alfie專長空間設計與電腦輔助設計(CAD/CAM)整合,其所帶領之竹工凡木設計研究室,強調一條龍式全方面設計服務、致力參數式演算法,打破傳統設計思維並有效降低工程成本。Alfie曾於2008年代表台灣前往日本參與安藤忠雄海外實習計畫(Ando Program),更榮獲2014 International JINTANG PRIZE年度新銳設計師、2015亞洲明日之星。近日發表之新書著作「當代建築的逆襲:Non-linear Architecture」,並榮登誠品暢銷書排行榜。
竹工凡木版圖遍及亞太五地,包含:台北、台南、北京、西安、新加坡。其作品包含:關島《Q Hotel》特色商旅、北京《MIBA釀酒大師》特色酒店、台南《日安竹米》文創旅店、北京《盤龍複合文創商業園區》、台北《京站威秀旗艦影城》等。N.111天地人空間跨產業沙龍邀請到竹工凡木設計研究室設計總監邵唯晏(Alfie)分享:
(1)當代建築市場趨勢與挑戰;
(2)非線性建築之特質、優勢與案例剖析。
(3)建築及室內設計人才市場剖析與趨勢走向。
本次N.111天地人文創跨產業沙龍,與您一起於小週末夜聆聽。關於『跨產業沙龍』:由天地人文創旗下天地人學堂創辦,固定每周三19:30-21:30於台北市中正區齊東老街天地人文創空間舉辦,至今已累積300位以上講師、10,000人次以上各產業參與者。在小周末舒適的夜晚與空間,邀您一同輕鬆享受三位產業專家的獨家精選個案,會後人際網絡交流與拓展,是您不可錯過的人脈交流與產業學習公開平台。
> 官網&詳情:http://goo.gl/q9vVsk
> 專屬FB社團:http://goo.gl/XPgZFw
* 為維護演講品質,保障參與者權益|本活動禁帶外食 |手機請保持靜音或關機 |攝影勿使用閃光燈
線性規劃演算法 在 李開復 Kai-Fu Lee Facebook 八卦
創新工場“AI蒙汗藥”入選NeurIPS 2019,3年VC+AI佈局進入科研收穫季
本文來自量子位微信公眾號
……………………………………………………………………
NeurIPS 2019放榜,創新工場AI工程院論文在列。
名為“Learning to Confuse: Generating Training Time Adversarial Data with Auto-Encoder”。
一作是創新工場南京國際AI研究院執行院長馮霽,二作是創新工場南京國際人工智慧研究院研究員蔡其志,南京大學AI大牛周志華教授也在作者列。
論文提出了一種高效生成對抗訓練樣本的方法DeepConfuse,通過微弱擾動資料庫的方式,徹底破壞對應的學習系統的性能,達到“資料下毒”的目的。
創新工場介紹稱,這一研究就並不單單是為了揭示類似的AI入侵或攻擊技術對系統安全的威脅,還能協助針對性地制定防範“AI駭客”的完善方案,推動AI安全攻防領域的發展。
NeurIPS,全稱神經資訊處理系統大會(Conference and Workshop on Neural Information Processing Systems),自1987年誕生至今已有32年的歷史,一直以來備受學術界和產業界的高度關注,是AI學術領域的“華山論劍”。
作為AI領域頂會,NeurIPS也是最火爆的那個,去年會議門票在數分鐘內被搶光,而且在論文的投稿錄取上,競爭同樣激烈。
今年,NeurIPS會議的論文投稿量再創新高,共收到6743篇投稿,最終錄取1428篇論文,錄取率為21.2%。
▌“資料下毒”論文入選頂會NeurIPS
那這次創新工場AI工程院這篇入選論文,核心議題是什麼?
我們先拆解說說。
近年來,機器學習熱度不斷攀升,並逐漸在不同應用領域解決各式各樣的問題。不過,卻很少有人意識到,其實機器學習本身也很容易受到攻擊,模型並非想像中堅不可摧。
例如,在訓練(學習階段)或是預測(推理階段)這兩個過程中,機器學習模型就都有可能被對手攻擊,而攻擊的手段也是多種多樣。
創新工場AI工程院為此專門成立了AI安全實驗室,針對人工智慧系統的安全性進行了深入對評估和研究。
在被NeurIPS收錄的論文中,核心貢獻就是提出了高效生成對抗訓練資料的最先進方法之一——DeepConfuse。
▌給數據下毒
通過劫持神經網路的訓練過程,教會雜訊生成器為訓練樣本添加一個有界的擾動,使得該訓練樣本訓練得到的機器學習模型在面對測試樣本時的泛化能力盡可能地差,非常巧妙地實現了“資料下毒”。
顧名思義,“資料下毒”即讓訓練資料“中毒”,具體的攻擊策略是通過干擾模型的訓練過程,對其完整性造成影響,進而讓模型的後續預測過程出現偏差。
“資料下毒”與常見的“對抗樣本攻擊”是不同的攻擊手段,存在於不同的威脅場景:前者通過修改訓練資料讓模型“中毒”,後者通過修改待測試的樣本讓模型“受騙”。
舉例來說,假如一家從事機器人視覺技術開發的公司希望訓練機器人識別現實場景中的器物、人員、車輛等,卻不慎被入侵者利用論文中提及的方法篡改了訓練資料。
研發人員在目視檢查訓練資料時,通常不會感知到異常(因為使資料“中毒”的噪音資料在圖像層面很難被肉眼識別),訓練過程也一如既往地順利。
但這時訓練出來的深度學習模型在泛化能力上會大幅退化,用這樣的模型驅動的機器人在真實場景中會徹底“懵圈”,陷入什麼也認不出的尷尬境地。
更有甚者,攻擊者還可以精心調整“下毒”時所用的噪音資料,使得訓練出來的機器人視覺模型“故意認錯”某些東西,比如將障礙認成是通路,或將危險場景標記成安全場景等。
為了達成這一目的,這篇論文設計了一種可以生成對抗雜訊的自編碼器神經網路DeepConfuse。
通過觀察一個假想分類器的訓練過程更新自己的權重,產生“有毒性”的雜訊,從而為“受害的”分類器帶來最低下的泛化效率,而這個過程可以被歸結為一個具有非線性等式約束的非凸優化問題。
▌下毒無痕,毒性不小
從實驗資料可以發現,在MNIST、CIFAR-10以及縮減版的IMAGENET這些不同資料集上,使用“未被下毒”的訓練資料集和“中毒”的訓練資料集所訓練的系統模型在分類精度上存在較大的差異,效果非常可觀。
與此同時,從實驗結果來看,該方法生成的對抗雜訊具有通用性,即便是在隨機森林和支援向量機這些非神經網路上也有較好表現。
其中,藍色為使用“未被下毒”的訓練資料訓練出的模型在泛化能力上的測試表現,橙色為使用“中毒”訓練資料訓練出的模型的在泛化能力上的測試表現。
在CIFAR和IMAGENET資料集上的表現也具有相似效果,證明該方法所產生的對抗訓練樣本在不同的網路結構上具有很高的遷移能力。
此外,論文中提出的方法還能有效擴展至針對特定標籤的情形下,即攻擊者希望通過一些預先指定的規則使模型分類錯誤,例如將“貓”錯誤分類成“狗”,讓模型按照攻擊者計畫,定向發生錯誤。
例如,下圖為MINIST資料集上,不同場景下測試集上混淆矩陣的表現,分別為乾淨訓練資料集、無特定標籤的訓練資料集、以及有特定標籤的訓練資料集。
實驗結果有力證明,為有特定標籤的訓練資料集做相應設置的有效性,未來有機會通過修改設置以實現更多特定的任務。
對資料“下毒”技術的研究並不單單是為了揭示類似的AI入侵或攻擊技術對系統安全的威脅,更重要的是,只有深入研究相關的入侵或攻擊技術,才能有針對性地制定防範“AI駭客”的完善方案。
隨著AI演算法、AI系統在國計民生相關的領域逐漸得到普及與推廣,科研人員必須透徹地掌握AI安全攻防的前沿技術,並有針對性地為自動駕駛、AI輔助醫療、AI輔助投資等涉及生命安全、財富安全的領域研發最有效的防護手段。
▌還關注聯邦學習
除了安全問題之外,人工智慧應用的資料隱私問題,也是創新工場AI安全實驗室重點關注的議題之一。
近年來,隨著人工智慧技術的高速發展,社會各界對隱私保護及資料安全的需求加強,聯邦學習技術應運而生,並開始越來越多地受到學術界和工業界的關注。
具體而言,聯邦學習系統是一個分散式的具有多個參與者的機器學習框架,每一個聯邦學習的參與者不需要與其餘幾方共用自己的訓練資料,但仍然能利用其餘幾方參與者提供的資訊更好的訓練聯合模型。
換言之,各方可以在在不共用資料的情況下,共用資料產生的知識,達到共贏。
創新工場AI工程院也十分看好聯邦學習技術的巨大應用潛力。
今年3月,“Learning to Confuse: Generating Training Time Adversarial Data with Auto-Encoder”論文的作者、創新工場南京國際人工智慧研究院執行院長馮霽代表創新工場當選為IEEE聯邦學習標準制定委員會副主席,著手推進制定AI協同及大資料安全領域首個國際標準。
創新工場也將成為聯邦學習這一技術“立法”的直接參與者。
▌創新工場AI工程院科研成績單
創新工場憑藉獨特的VC+AI(風險投資與AI研發相結合)的架構,致力於扮演前沿科研與AI商業化之間的橋樑角色。
創新工場2019年廣泛開展科研合作,與其他國際科研機構合作的論文,入選多項國際頂級會議,除上述介紹的“資料下毒”論文入選NeurlPS之外,還有8篇收錄至五大學術頂會,涉及影像處理、自動駕駛、自然語言處理、金融AI和區塊鏈等方向。
┃兩篇論文入選ICCV
Disentangling Propagation and Generation for Video Prediction
https://arxiv.org/abs/1812.00452
這篇論文的主要工作圍繞一個視頻預測的任務展開,即在一個視頻中,給定前幾幀的圖片預測接下來的一幀或多幀的圖片。
Joint Monocular 3D Vehicle Detection and Tracking
https://arxiv.org/abs/1811.10742
這篇論文提出了一種全新的線上三維車輛檢測與跟蹤的聯合框架,不僅能隨著時間關聯車輛的檢測結果,同時可以利用單目攝像機獲取的二維移動資訊估計三維的車輛資訊。
┃一篇論文入選IROS
Monocular Plan View Networks for Autonomous Driving
http://arxiv.org/abs/1905.06937
針對端到端的控制學習問題提出了一個對當前觀察的視角轉換,將其稱之為規劃視角,它把將當前的觀察視角轉化至一個鳥瞰視角。具體的,在自動駕駛的問題下,在第一人稱視角中檢測行人和車輛並將其投影至一個俯瞰視角。
┃三篇論文入選EMNLP
Multiplex Word Embeddings for Selectional Preference Acquisition
提出了一種multiplex詞向量模型。在該模型中,對於每個詞而言,其向量包含兩部分,主向量和關係向量,其中主向量代表總體語義,關係向量用於表達這個詞在不同關係上的特徵,每個詞的最終向量由這兩種向量融合得到。
What You See is What You Get: Visual Pronoun Coreference Resolution in Dialogues
https://assert.pub/papers/1909.00421
提出了一個新模型(VisCoref)及一個配套資料集(VisPro),用以研究如何將代詞指代與視覺資訊進行整合。
Reading Like HER: Human Reading Inspired Extractive Summarization
人類通過閱讀進行文本語義的摘要總結大體上可以分為兩個階段:1)通過粗略地閱讀獲取文本的概要資訊,2)進而進行細緻的閱讀選取關鍵句子形成摘要。
本文提出一種新的抽取式摘要方法來模擬以上兩個階段,該方法將文檔抽取式摘要形式化為一個帶有上下文的多臂老虎機問題,並採用策略梯度方法來求解。
┃一篇論文入選IEEE TVCG
sPortfolio: Stratified Visual Analysis of Stock Portfolios
https://www.ncbi.nlm.nih.gov/pubmed/31443006
主要是對於金融市場中的投資組合和多因數模型進行可視分析的研究。通過三個方面的分析任務來幫助投資者進行日常分析並升決策準確性。
並提出了一個全新的視覺化分析系統sPortfolio,它允許使用者根據持倉,因數和歷史策略來觀察投資組合的市場。sPortfolio提供了四個良好協調的視圖。
┃一篇論文入選NSDI
Monoxide: Scale Out Blockchain with Asynchronized Consensus Zones
https://www.usenix.org/system/files/nsdi19-wang-jiaping.pdf
提出了一種名為非同步共識組 Monoxide 的區塊鏈擴容方案,可以在由 4.8 萬個全球節點組成的測試環境中,實現比比特幣網路高出 1000 倍的每秒交易處理量,以及 2000 倍的狀態記憶體容量,有望打破“不可能三角”這個長期困擾區塊鏈性能的瓶頸。
▌獨特的“科研助推商業”思路
國內VC,發表論文都很少見,為什麼創新工場如此做?
這背後在於其“VC+AI”模式。
最獨特之處在于,創新工場的AI工程院可以通過廣泛的科研合作以及自身的科研團隊,密切跟蹤前沿科研領域裡最有可能轉變為未來商業價值的科研方向。
這種“科研助推商業”的思路力圖儘早發現有未來商業價值的學術研究,然後在保護各方智慧財產權和商業利益的前提下積極與相關科研方開展合作。
同時,由AI工程院的產品研發團隊嘗試該項技術在不同商業場景裡可能的產品方向、研發產品原型,並由商務拓展團隊推動產品在真實商業領域的落地測試,繼而可以為創新工場的風險投資團隊帶來早期識別、投資高價值賽道的寶貴機會。
“科研助推商業”並不是簡單地尋找有前景的科研專案,而是將技術跟蹤、人才跟蹤、實驗室合作、智慧財產權合作、技術轉化、原型產品快速反覆運算、商務拓展、財務投資等多維度的工作整合在一個統一的資源體系內,用市場價值為導向,有計劃地銜接學術科研與商業實踐。
以AI為代表的高新技術目前正進入商業落地優先的深入發展期,產業大環境亟需前沿科研技術與實際商業場景的有機結合。
創新工場憑藉在風險投資領域積累的豐富經驗,以及在創辦AI工程院的過程中積累的技術人才優勢,特別適合扮演科研與商業化之間的橋樑角色。
於是,創新工場AI工程院也就順勢而生。
創新工場人工智慧工程院成立於2016年9月,以“科研+工程實驗室”模式,規劃研發方向,組建研發團隊。
目前已經設有醫療AI、機器人、機器學習理論、計算金融、電腦感知等面向前沿科技與應用方向的研發實驗室,還先後設立了創新工場南京國際人工智慧研究院、創新工場大灣區人工智慧研究院。
目標是培養人工智慧高端科研與工程人才,研發以機器學習為核心的前沿人工智慧技術,並同各行業領域相結合,為行業場景提供一流的產品和解決方案。
而且, 創新工場還與國內外著名的科研機構廣泛開展科研合作。
例如,今年3月20日,香港科技大學和創新工場宣佈成立電腦感知與智慧控制聯合實驗室(Computer Perception and Intelligent Control Lab)。
此外,創新工場也積極參與了國際相關的技術標準制定工作。例如,今年8月,第28屆國際人工智慧聯合會議(IJCAI)在中國澳門隆重舉辦,期間召開了IEEE P3652.1(聯邦學習基礎架構與應用)標準工作組第三次會議。
IEEE聯邦學習標準由微眾銀行發起,創新工場等數十家國際和國內科技公司參與,是國際上首個針對人工智慧協同技術框架訂立標準的專案。
創新工場表示,自身的科研團隊將深度參與到聯邦學習標準的制定過程中,希望為AI技術在真實場景下的安全性、可用性以及保護資料安全、保護使用者隱私貢獻自己的力量。
線性規劃演算法 在 管理數學12-線性規劃-單行法- YouTube 的八卦
課程簡介:解決 線性規劃 問題的其中一種技巧,以代數為主技巧課程難度:○○○適合對象:大學二年級授課教師:李柏堅製作單位:中華科技大學遠距教學組 ... ... <看更多>
線性規劃演算法 在 [問題] 論文要用程式解線性規劃問題,該從何學起 的八卦
想請教一下
我的論文是研究某一個組合最佳化的問題
最後建立出一個線性數學規劃模型
再想一個演算法去求近似解,再跟Cplex求出的最佳解比較,看速度快多少。
但是因為我程式超爛,完全不知道從何下手,
也不知道該用哪種語言比較容易做到這些事,所以想來請教看看各位高手
我個人是比較會用VB、C#,C跟C++不太熟,本來考慮使用VB寫
但是因為Cplex的語法好像是C語言的樣子,所以我又會有疑慮是否要用C
因為最後要寫cplex的時候,就不用重新再學語言
另外想請教一下,該看哪方面的書籍才能幫助我寫完程式呢?
謝謝啦。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 111.32.13.29
※ 編輯: WANGMIN 來自: 111.253.116.22 (04/07 01:50)
想請教你說的cplex是 CPLEX Studio IDE嗎?
因為我們老師可能會叫我們使用舊版的 Cplex9,要用Visual c++ 去呼叫的
※ 編輯: WANGMIN 來自: 111.253.116.22 (04/07 07:47)
... <看更多>