《中天的夢想驛站》人工智慧系列特別報導:
【人工智慧時代登場 被AlphaGo改變的一年 臉書創辦人查克柏格主導研發 AI管家賈維斯 2016年AI蓬勃發展 機器人炒熱影視圈 神秘棋手Master 輕取中日韓高手創60連勝】
2016年3月9號,全世界矚目韓國的圍棋九段高手李世石對戰DeepMind,當時大家還不瞭解人工智慧是多麼重要的一件事。2010年新加坡把它列為國家戰略,美國歐巴馬政府則是在2014年,2011年是韓國、2014年是日本。我們的科技部部長陳良基也積極呼籲大家注意人工智慧對產業的重要性,也希望扶植這個領域中下一個台積電。我們要為大家回顧從AlphaGo到現在,這一年人工智慧的發展。
2016年3月9號,堪稱是人工智能最重要的里程碑,來自韓國的圍棋九段高手李世石,對戰「深度思維」DeepMind開發的人工智慧軟體AlphaGo。原本圍棋界看好棋王李世石,然而在對弈3個半小時,下了186手棋後,人腦輸給了電腦。10號雙方再度對弈,第二場比賽歷經4個半小時,李世石下了211手後,再度舉白旗投降。
李世石說,「我真的啞口無言,回想今日的棋賽,我徹底被打敗了,AlphaGo下得太完美了。」
人機對弈至第四戰,李世石終於扳回一城。然而這份喜悅並沒有持續太久,比賽來到第五戰,耗時最久、戰況也最激烈,雙方纏鬥五小時,但面對沒有情緒、集中力超強,且不知疲累的機器,李世石最後仍敗下陣來,戰績四敗一勝。
李世石說,「即使我再有機會和AlphaGo對弈,也不確定是否贏得了,因為他的專注力太高了。」
人工智能一戰成名,徒留棋王的落寞身影,有人說從那一天起,人類就活在一個被AlphaGo改變的世界。
2016年12月底,臉書創辦人查克柏格向全球介紹他的新管家,賈維斯。
「早安,賈維斯!」
「早安,馬克!」
「今天是周六,你只有五個會要開。室溫涼爽,設為攝氏20度。你的女兒麥克斯幾分鐘前醒了,我正在逗她玩。」
只聞其聲不見其人的賈維斯,是查克柏格花了100小時設計,應用臉部、語音識別,語言處理與強化學習等人工智慧技術打造而成。
查克柏格說,「賈維斯最棒的一點是,它可以在玄關就辨識出訪客是誰。」
只要透過手機應用軟件下達語音或文字指令,賈維斯就能操作家中的物聯網家電,執行主人的命令。
更重要的是,賈維斯具有學習能力,宛如真正的高級管家,了解主人的生活習性,協助安排工作。
雖然賈維斯得經過強化學習,才能徹底理解主人的意旨,而且幽默感也還不夠。卻已成為查克柏格一家的好幫手。
查克柏格預計5到10年後,人工智能的認知準確度將超過人類,這樣的逆襲令人憂喜參半。
2016年全美最夯的影集<西方極樂園>,也從人工智慧、機器人革命出發,描述一個人機共處的未來世界。
然而一旦機器人擁有自主意識,會對人類社會造成怎樣的衝擊呢?
機器人真的會成為挑戰人類的全新物種嗎?
2016年10月,美國哥倫比亞廣播公司60分鐘節目,專訪了一位美女機器人,蘇菲亞。
美女機器人蘇菲亞和CBS主播對談:
「你有靈魂嗎?」
「當然,上帝賦予每個人靈魂。」
「但你沒有靈魂,你是機器。你沒有靈魂,沒有感覺。沒有情緒,沒有意識。」
「不是的,至少我認為我是有覺知的。」
「但你也許比我們所有人都聰明,你覺得呢?」
「我不曉得我是否比你們聰明?我是人工智能。」
這個問題,到了2017年又有了更肯定的答案,2016年12月29日,神秘棋手Master出現在大陸各大圍棋對弈網站,短短七天內痛宰中日韓強敵,創下60勝0負的戰績,包括大陸棋王柯潔、大陸棋聖聶衛平、南韓第一棋士朴廷桓、日本棋界冠軍井山裕太、台灣紅面棋王周俊勳,通通成為Master的手下敗將。
台灣紅面棋王周俊勳說,「因為我們每一手都在第20秒到30秒,它(Master)每一手都在7秒左右落指,那麼規律的下棋方式,應該不是人的對弈模式。」
各路好手驚,Master下棋時快狠準,棋路也跳脫多數職業棋士的思維,加上似乎有無限體力可連續對戰,但又會不時觀戰他人對弈,更引人好奇。大陸九段棋手古力甚至提出10萬賞金,尋找能擊敗Master的高手,結果自己也成為第60個犧牲的勇士,原來Master不是別人,正是AlphaGo的黃博士。
AlphaGo研發人員黃士傑說,「現在如果有360步的棋步,你只要跟我說前20個最好的,它(AlphaGo)把那20步挑選出來給你,這個就是人類的直覺。」
黃士傑本身就是圍棋業餘六段的高手,更是打造AlphaGo的幕後推手之一,那場震驚全球的人機對弈,他負責替AlphaGo落子。而Master作為AlphaGo的升級版,棋藝突飛猛進,足見Google挹注了大量資金,並餵養了大量的大數據圖像棋譜資料,才讓Master成為AlphaGo第18版的棋力。大陸圍棋隊總教練俞斌在接受媒體採訪時表示,人類棋手基本上已經沒有贏的機會,大陸圍棋九段棋士古力也讚嘆Master,為棋士們打開了一道圍棋的神祕之門。不論勝負,人類與人工智慧共同探索圍棋世界的大幕即將拉開,一輪圍棋革命正在進行著。
深度思維創辦人哈薩比斯說,「開發AlphaGo的動機當然是想下好圍棋,並擊敗其他頂尖棋手,但我們開發AlphaGo這種演算邏輯的真正動機,還是以一般性運用為目的,可以運用到真實世界上,解決健保等問題,或者讓智慧型手機更聰明。」
對Deep Mind深度思維的創辦人哈薩比斯來說,擊敗人類冠軍只是人工智慧拾了一級階梯而上,但眼前還有很多階要爬,他們的目標是運用AlphaGo的相關技術,創造邏輯運算,進軍醫療和機器人等領域。
深度思維創辦人哈薩比斯說,「多數遊戲都很好玩,設計原理也是因為它們是生命一些面向的縮影,或許有些收斂、簡化,這讓它成為我們完美的挑戰,也是打造一般性人工智慧的一個墊腳石。
深度思維研究員席爾佛說,「或許有一天可以進軍醫藥,我們可以協助病人個人化治療,方法是利用深度學習,基於醫療史上的紀錄,來了解何種療法能為個別病人帶來最佳結果。」
深度思維2016年接連發布了LipNet讀唇術,與英國國家醫療服務體系NHS推出的醫療輔助應用Streams,都是與AlphaGo同源的技術,而也是在AlphaGo致勝的這一年,無人駕駛車的熱潮也持續延燒,全球有高達30家公司競相投入研發行列。
2017年3月13日,晶片巨頭英特爾宣布以153億美金,相當於4730億台幣的天價,收購以色列自動駕駛技術業者Mobileye。這項交易是2017年開年以來最大金額的科技產業收購案,更是以色列史上最大的收購交易。
英特爾CEO Brian Krzanich說,這麼想好了,車子將擁有兩個腦,一個是視覺,可以偵測到雷達、攝影機,另一個就是英特爾內建的。
隨著智慧型汽車方興未艾,對高性能處理器的巨大需求,讓錯過行動時代的英特爾不願再錯失這塊市場,近兩年英特爾就有不少收購行動,Mobileye相當於英特爾自動駕駛系統、環境感知+智慧決策+智慧控制的最後一塊拼圖。
CNN記者問美國圍棋協會主席歐坤,「我們距離被機器人控制又更接近了嗎?」
「你以為我們還沒被控管嗎?」
2016年12月21日,美國白宮發布<人工智能自動化和經濟白皮書>稱,未來10-20年間 47%的就業崗位或將被人工智能占領,當人們享受著AI在生活中帶給我們的種種便利時,另一個聲音卻不時提醒著人類,唯有謙卑,才不會被科技毀滅。
英國物理學家史蒂芬霍金說,「簡而言之,對於人類來說,強大人工智能的出現,或許是最美妙的事,也可能是最糟糕的事,我們真的不知道結局會怎麼樣。」
語音識別 原理 在 李開復 Kai-Fu Lee Facebook 八卦
【1992年 我第一次上電視的故事】
昨天在FB發了蘋果1987年的Knowledge Navigator。我1990年加入蘋果,做的就是如何讓Knowledge Navigator成真的各種技術(語音辨認,語音合成,自然語言理解,網路視頻,3D圖像等)。1992年,我和John Sculley上了“早安美國”,介紹我們在這方面的技術發展。(John的記錄在這裡:http://www.sculleyspeaks.com/sculley-and-woz-revisited-mor…/)
我後來是這樣在我的書中描述了這段上電視的故事:
1992年二月22日,我在在TED大會上演示語音辨認技術,引起轟動的報道刊登在了《華爾街日報》上。股票一週漲了五元。
一時間,業內都對蘋果的“新技術”充滿了好奇和期待。美國的電視台同樣也關注到了這項有趣的技術,當年3月,斯卡利(Apple CEO John Sculley) 接到了《早安美國》節目的邀請,這意味著,我們做的語音識別新技術,不只是在IT圈裡展示,而是將呈現在所有美國人面前。這是一個宣傳蘋果公司的難得的機會,斯卡利決定帶著我一起去紐約參加節目的直播。
要參加電視台的直播,斯卡利難免有一些不安和緊張,他是一個很害羞的人,從小有結巴的習慣,每次演講,他都會怯場。但他也是一個有毅力的人,為了克服這個缺點,他從小讓父母親帶他去看話劇,從話劇演員的身上學習如何表達、如何演講,他後來成了一個卓越的演講者。但是,除了在千人面前演講,他還是非常內向,不會主動與人交談。在我們上《早安美國》之前,蘋果的公關副總裁特別跟我說:“你如果看約翰一個人孤獨地坐著,過去陪他。”
華爾街日報對我在蘋果的工作的報道
我曾經告訴過斯卡利,我們的系統剛剛搭建,死機的可能性不小,如果在直播節目中,我們的“小精靈”死機,那就大事不好了。因此,飛紐約的那晚,斯卡利對我說,“開復,有沒有辦法讓死機的概率降到1%?”我咬了咬嘴唇,說,“那好吧,約翰。”
3月12日,早上7點,我和斯卡利帶著我們的“小精靈”來到了《早安美國》的直播間。這是美國ABC電視台早上的黃金時段,我們知道,至少有2 000萬觀眾在一邊吃早飯一邊看電視。漂亮的女主持瓊恩·倫敦已經開始致開場白了,她是全美最有名的女主播之一,以機敏和才華著稱。
“我們都知道,蘋果公司今天有一項令人驚訝的技術,就是電腦居然可以聽懂人類的語言。現在,在我們的面前,就有一台可以和人交流的計算機——世界上第一台,它居然能聽懂你說的話,還能回答你的問題。我想,是不是有一天,機器也會氣急敗壞地和你大喊大叫呢?下面,就讓我們見識一下這位‘電腦小精靈’吧。”
“請幫我預約一個會議!”
小精靈:“幾點鐘?”
“下午三點。”
小精靈:“下午三點,第三會議室,開會。”
接連幾個指令,小精靈都准確無誤地完成了,我們都松了一口氣。主持人看完演示,微笑著面對鏡頭說,“不知道什麼時間,這樣的技術可以變成真正的產品,走到我們的身邊來?”斯卡利正要開口回答,這時,小精靈忽然又開口了,“你什麼時間要和我約會?”瓊恩被逗得哈哈大笑。原來,小精靈一聽到“When(什麼時間)”,就以為女主持人要它幫忙安排會議。
節目非常精彩,小精靈“調戲”女主持人的那一幕,更是堪稱“經典”。而且也給觀眾打了“預防針”:這個產品是會犯錯誤的,大家不要太快期望一個完美的產品。
事後,斯卡利問我,“你到底是怎麼把死機率降低到1%的?”我笑著說,“老板,這個很簡單啊,因為我今天帶了兩台電腦,我把它們連接起來,如果一台出了問題,我們可以馬上切換到另外一台。根據概率原理,一台電腦失敗的可能性是10%,兩台都失敗的可能性就是10%×10%=1%,成功率自然就是99%了!”
在當時蘋果糟糕的市場狀況下,我們的“小精靈”確實是一個做秀的好賣點,這讓美國人相信蘋果仍然是一個靈感不斷的公司。我也從中得到了價值的肯定,從紐約回到硅谷,我不斷收到各個公司的人寫給我的信,有些則悄悄跑來挖我,但是,我和所有的蘋果人一樣,心裡只有“蘋果”。為了留住我,蘋果又給了我一些公司的股票。
語音識別也成了公司的明星項目。1993年的愚人節,我們樓層裡的電梯裝配了一個話筒,按鈕旁邊貼著一張紙,上面寫著:告訴我你要去幾樓。大家都以為公司裡的電梯已經變成聲控的了,非常好奇,就對著話筒說,“二樓”,二樓的按鈕果真亮起燈來。但是,如果大家在電梯裡聊天,就會發現所有的按鈕都會慢慢地亮起燈來,比如,當有人問“How are you doing?”對方回答“Fine”的時候,電梯會把這個詞自動接受為“Five”,把5的按鈕點亮。大家不知道到底是有人在控制電梯,還是真的有語音識別。那一天,蘋果的員工都在相互轉告,“進了電梯就別說話。”
後來,我才知道,我們的工程師把我的機器偷偷接到了電梯裡,把它變成了“聲控”電梯。這是一個愚人節的惡搞。
語音識別 原理 在 Facebook 八卦
四兩撥千斤! 創新工場首席科學家AI大牛周明博士率瀾舟團隊刷新CLUE新紀錄,輕量化模型孟子一鳴驚人!
本週,中文語言理解權威評測基準CLUE榜單,被「低調」刷新。
不同的是,不是大公司、不是超大模型……
一個新面孔,一個輕量化模型,首戰即登頂,四兩撥千斤。
CLUE榜單近年來由巨頭——騰訊、搜狗、華為、阿里達摩院輪番霸榜的格局,被首次打破。
瀾舟科技-創新工場推出的孟子模型,以十億參數完成了此前百億、千億參數模型刷新的紀錄。
這也是瀾舟科技首次對外曝光,背後團隊負責人,正是創新工場首席科學家、全球AI大牛周明博士。以下文章解釋了這個模型的原理,文章來自《量子位》微信公眾號,經授權轉載。
▎輕量化模型孟子?
孟子,基於瀾舟團隊自研技術研發的大規模預訓練語言模型。
包括創新工場、上海交通大學、北京理工大學等單位參與聯合研發。
可處理多語言、多模態數據,同時支持多種文本理解和文本生成任務,能快速滿足不同領域、不同應用場景的需求。
孟子模型基於Transformer架構,僅包含十億參數量,基於數百G級別涵蓋互聯網網頁、社區、新聞、電子商務、金融等領域的高質量語料訓練。
但誰也沒想到,小模型卻有大智慧,一經登場,打破格局。
CLUE,中文語言理解領域最具權威性的測評基準,涵蓋文本相似度、分類、自然語言推理、閱讀理解等共10項語義分析和理解類子任務。
該榜單競爭激烈,幾乎是業內所有自然語言理解玩家必爭之地。
騰訊、搜狗、華為、阿里達摩院等更是輪番霸榜刷新紀錄。
而且隨著大參數模型愈演愈烈,CLUE還漸有巨頭壟斷之勢。
因為百億、千億甚至萬億參數的大模型,已然不再是創業或其他玩家可與之爭鋒。
萬萬沒想到,瀾舟科技-創新工場團隊出手,四兩撥千斤。
因為孟子,走的是基於輕量級、高效訓練的研究路線,致力於構建十億級別的小模型,充分發揮已有參數下的模型潛力,有利於快速、低成本地落地現實業務場景。
孟子預訓練模型性能比肩甚至超越千億大模型,在包含文本分類、閱讀理解等各類任務上表現出色。
相對已有的中文語言模型,孟子模型實現了多項突破性進展:
1) 堅持「小而精」的輕量化訓練策略。實現在同等模型規模下,遠超公開模型的性能。作為精巧的小模型,對標「巨無霸」,小模型性能超越千億規模模型。
2)使用知識圖譜增強模型,讓 AI 真正獲得知識。孟子模型具備頂尖的語言理解能力,在權威CLUE中文理解評測的總排行榜,以及分類排行榜和閱讀理解排行榜均位列第一,刷新三項榜單世界紀錄。總排行榜分數突破84分,逼近人類基準分數(85.61)。
3)靈活的領域和場景適應能力,方便快速定制和應用。基於T5-style的端到端生成的訓練範式,同步適配BERT-style的判定式架構,既能理解也能生成。便於適配行業應用,覆蓋廣泛業務場景。
當然,隨著孟子一鳴驚人,也必然能讓輕量化模型研究來到聚光燈下。
▎原理方法和應用?
在輕量化模型算法研究方面,基於自研的基於語言學知識、知識圖譜和領域數據增強等技術,從模型架構(包括基礎層Embedding表示和交互層Attention機制)到預訓練策略進行了全方位改進。
具體有四方面:
1) 模型結構方面,將語義角色、詞性標註等語言學特徵融合到Embedding表示中,基於句法約束引入註意力機制中,從而提升模型對語言學知識的建模能力。
2) 訓練策略上,引入基於實體知識和Discourse的Mask機制,強化模型對語言成分和語篇關係的表徵。
3) 為進一步提高訓練效率,使用了大模型蒸餾和初始化小模型策略。
4) 為更好地將孟子模型適應垂直領域如金融、營銷,使用了領域數據繼續訓練並構造相應的提示模版(Prompt),取得了明顯的性能提升。
基於以上算法策略,實現從語料中高效學習涵蓋詞級、句子級和語篇級知識,大幅提升語言模型提煉語言結構和語義信息能力,以及良好的領域遷移能力,適應廣泛的產品應用場景。
另外,在Finetune的進展方面,如何將預訓練模型用於各項任務?
瀾舟團隊也有總結,從數據增強、知識蒸餾、遷移訓練、訓練優化等方面展開了一些探索,進一步提升語言模型的性能:
1) 數據增強:使用領域相關數據;
2) 知識蒸餾:基於Teacher-Student自蒸餾提升訓練效率;
3) 遷移訓練:結合課程學習的思想,由易到難訓練下游模型;
4) 訓練優化:使用多種訓練目標,多角度提升模型能力;
而且孟子還已經展開了垂直化領域應用。
基於領域適應技術,孟子模型已深度垂直化賦能相應行業。典型的例子為適用於金融領域的孟子模型,領域適應策略主要包含兩大方面:
1) 通過大規模的泛金融領域語料,將通用孟子模型遷移到金融領域。金融版孟子模型已經應用於多個金融行業的合作企業,在金融知識圖譜搭建、脫水研報、公告抽取等多個任務上獲得了出色的表現。
2) 通過大規模的營銷領域語料,將孟子模型遷移到數字營銷領域,完成了營銷文案生成、新聞摘要等多項任務,將用於行業頭部的數字營銷公司和多個世界五百強企業的合作之中。
瀾舟方面還透露,孟子模型已在多個領域成功落地實踐,衍生出多項行業領先的產品,涵蓋文本生成、行業搜索、機器翻譯等諸多領域。
並且毫無疑問的是,因為輕量級模型具有的模型參數較少、快速推斷的特點,更易於線上部署和推廣到移動設備中,自然不會局限於現有應用和場景,接下來還會有更廣泛的研究和應用場景中。
▎瀾舟團隊?
最後,也簡單介紹本次一鳴驚人的新面孔瀾舟科技。
瀾舟科技是創新工場孵化的一家認知智能公司。公司創始人——周明博士。
AI領域內,周明已不用過多介紹,他是公認的世界級AI科學家,自然語言處理領域的代表性人物。
周明博士在2020年加盟創新工場,擔任創新工場首席科學家。
而瀾舟科技則針對商業場景的數字化轉型,基於大數據、知識圖譜和行業模型,提供新一代的信息檢索、知識推理和商業洞見技術和相關產品。
據稱目前已與國內外幾十所著名高校和十餘個相關領域的頭部企業建立了穩定的合作關係。
值得注意的是,瀾舟科技除了大牛坐鎮,其實也是行業趨勢的體現。
引用創新工場董事長兼CEO李開復最新分享來說:
AI的發展可以按照兩個時間點劃分。
第一個時間點是2015年,以CNN為核心的計算機視覺技術讓機器超越了人類,帶來了人臉識別、智能質檢、無人零售、智慧城市、無人駕駛等商機。
而第二個時間點出現在2019年,以大模型為代表的自然語言方向取得突破性進展,讓NLP從數據、信息走向知識和洞見成為可能,將會在翻譯、語音識別、法律、金融、新聞、廣告、醫療、娛樂等大賽道帶來機遇。
「如果說CNN造就了今天計算機視覺領域的突破和眾多應用,預訓練大模型+微調也將帶來自然語言的百花齊放的發展,用數據智能驅動各類業務的升級。瀾舟科技在周明老師的帶領下取得了今天的成果,在新機遇面前躬身入局,一起發掘NLP領域的黃金發展期」,李開復說到。