四兩撥千斤! 創新工場首席科學家AI大牛周明博士率瀾舟團隊刷新CLUE新紀錄,輕量化模型孟子一鳴驚人!
本週,中文語言理解權威評測基準CLUE榜單,被「低調」刷新。
不同的是,不是大公司、不是超大模型……
一個新面孔,一個輕量化模型,首戰即登頂,四兩撥千斤。
CLUE榜單近年來由巨頭——騰訊、搜狗、華為、阿里達摩院輪番霸榜的格局,被首次打破。
瀾舟科技-創新工場推出的孟子模型,以十億參數完成了此前百億、千億參數模型刷新的紀錄。
這也是瀾舟科技首次對外曝光,背後團隊負責人,正是創新工場首席科學家、全球AI大牛周明博士。以下文章解釋了這個模型的原理,文章來自《量子位》微信公眾號,經授權轉載。
▎輕量化模型孟子?
孟子,基於瀾舟團隊自研技術研發的大規模預訓練語言模型。
包括創新工場、上海交通大學、北京理工大學等單位參與聯合研發。
可處理多語言、多模態數據,同時支持多種文本理解和文本生成任務,能快速滿足不同領域、不同應用場景的需求。
孟子模型基於Transformer架構,僅包含十億參數量,基於數百G級別涵蓋互聯網網頁、社區、新聞、電子商務、金融等領域的高質量語料訓練。
但誰也沒想到,小模型卻有大智慧,一經登場,打破格局。
CLUE,中文語言理解領域最具權威性的測評基準,涵蓋文本相似度、分類、自然語言推理、閱讀理解等共10項語義分析和理解類子任務。
該榜單競爭激烈,幾乎是業內所有自然語言理解玩家必爭之地。
騰訊、搜狗、華為、阿里達摩院等更是輪番霸榜刷新紀錄。
而且隨著大參數模型愈演愈烈,CLUE還漸有巨頭壟斷之勢。
因為百億、千億甚至萬億參數的大模型,已然不再是創業或其他玩家可與之爭鋒。
萬萬沒想到,瀾舟科技-創新工場團隊出手,四兩撥千斤。
因為孟子,走的是基於輕量級、高效訓練的研究路線,致力於構建十億級別的小模型,充分發揮已有參數下的模型潛力,有利於快速、低成本地落地現實業務場景。
孟子預訓練模型性能比肩甚至超越千億大模型,在包含文本分類、閱讀理解等各類任務上表現出色。
相對已有的中文語言模型,孟子模型實現了多項突破性進展:
1) 堅持「小而精」的輕量化訓練策略。實現在同等模型規模下,遠超公開模型的性能。作為精巧的小模型,對標「巨無霸」,小模型性能超越千億規模模型。
2)使用知識圖譜增強模型,讓 AI 真正獲得知識。孟子模型具備頂尖的語言理解能力,在權威CLUE中文理解評測的總排行榜,以及分類排行榜和閱讀理解排行榜均位列第一,刷新三項榜單世界紀錄。總排行榜分數突破84分,逼近人類基準分數(85.61)。
3)靈活的領域和場景適應能力,方便快速定制和應用。基於T5-style的端到端生成的訓練範式,同步適配BERT-style的判定式架構,既能理解也能生成。便於適配行業應用,覆蓋廣泛業務場景。
當然,隨著孟子一鳴驚人,也必然能讓輕量化模型研究來到聚光燈下。
▎原理方法和應用?
在輕量化模型算法研究方面,基於自研的基於語言學知識、知識圖譜和領域數據增強等技術,從模型架構(包括基礎層Embedding表示和交互層Attention機制)到預訓練策略進行了全方位改進。
具體有四方面:
1) 模型結構方面,將語義角色、詞性標註等語言學特徵融合到Embedding表示中,基於句法約束引入註意力機制中,從而提升模型對語言學知識的建模能力。
2) 訓練策略上,引入基於實體知識和Discourse的Mask機制,強化模型對語言成分和語篇關係的表徵。
3) 為進一步提高訓練效率,使用了大模型蒸餾和初始化小模型策略。
4) 為更好地將孟子模型適應垂直領域如金融、營銷,使用了領域數據繼續訓練並構造相應的提示模版(Prompt),取得了明顯的性能提升。
基於以上算法策略,實現從語料中高效學習涵蓋詞級、句子級和語篇級知識,大幅提升語言模型提煉語言結構和語義信息能力,以及良好的領域遷移能力,適應廣泛的產品應用場景。
另外,在Finetune的進展方面,如何將預訓練模型用於各項任務?
瀾舟團隊也有總結,從數據增強、知識蒸餾、遷移訓練、訓練優化等方面展開了一些探索,進一步提升語言模型的性能:
1) 數據增強:使用領域相關數據;
2) 知識蒸餾:基於Teacher-Student自蒸餾提升訓練效率;
3) 遷移訓練:結合課程學習的思想,由易到難訓練下游模型;
4) 訓練優化:使用多種訓練目標,多角度提升模型能力;
而且孟子還已經展開了垂直化領域應用。
基於領域適應技術,孟子模型已深度垂直化賦能相應行業。典型的例子為適用於金融領域的孟子模型,領域適應策略主要包含兩大方面:
1) 通過大規模的泛金融領域語料,將通用孟子模型遷移到金融領域。金融版孟子模型已經應用於多個金融行業的合作企業,在金融知識圖譜搭建、脫水研報、公告抽取等多個任務上獲得了出色的表現。
2) 通過大規模的營銷領域語料,將孟子模型遷移到數字營銷領域,完成了營銷文案生成、新聞摘要等多項任務,將用於行業頭部的數字營銷公司和多個世界五百強企業的合作之中。
瀾舟方面還透露,孟子模型已在多個領域成功落地實踐,衍生出多項行業領先的產品,涵蓋文本生成、行業搜索、機器翻譯等諸多領域。
並且毫無疑問的是,因為輕量級模型具有的模型參數較少、快速推斷的特點,更易於線上部署和推廣到移動設備中,自然不會局限於現有應用和場景,接下來還會有更廣泛的研究和應用場景中。
▎瀾舟團隊?
最後,也簡單介紹本次一鳴驚人的新面孔瀾舟科技。
瀾舟科技是創新工場孵化的一家認知智能公司。公司創始人——周明博士。
AI領域內,周明已不用過多介紹,他是公認的世界級AI科學家,自然語言處理領域的代表性人物。
周明博士在2020年加盟創新工場,擔任創新工場首席科學家。
而瀾舟科技則針對商業場景的數字化轉型,基於大數據、知識圖譜和行業模型,提供新一代的信息檢索、知識推理和商業洞見技術和相關產品。
據稱目前已與國內外幾十所著名高校和十餘個相關領域的頭部企業建立了穩定的合作關係。
值得注意的是,瀾舟科技除了大牛坐鎮,其實也是行業趨勢的體現。
引用創新工場董事長兼CEO李開復最新分享來說:
AI的發展可以按照兩個時間點劃分。
第一個時間點是2015年,以CNN為核心的計算機視覺技術讓機器超越了人類,帶來了人臉識別、智能質檢、無人零售、智慧城市、無人駕駛等商機。
而第二個時間點出現在2019年,以大模型為代表的自然語言方向取得突破性進展,讓NLP從數據、信息走向知識和洞見成為可能,將會在翻譯、語音識別、法律、金融、新聞、廣告、醫療、娛樂等大賽道帶來機遇。
「如果說CNN造就了今天計算機視覺領域的突破和眾多應用,預訓練大模型+微調也將帶來自然語言的百花齊放的發展,用數據智能驅動各類業務的升級。瀾舟科技在周明老師的帶領下取得了今天的成果,在新機遇面前躬身入局,一起發掘NLP領域的黃金發展期」,李開復說到。
同時也有2部Youtube影片,追蹤數超過55萬的網紅黑羽,也在其Youtube影片中提到,我是不是對員工很好啊~ 每週一到五下午5點更新,六日中午12點更新記得要開啟YouTube🔔鈴鐺唷! 🔥電腦規格🔥 機殼:火鳥科技-黎明至尊 處理器:AMD Ryzen™ 7 5800X 主板:BIOSTAR 映泰-B550M-SILVER 顯卡:ZOTAC- GAMING GeForce R...
輕量化模型 在 國立陽明交通大學電子工程學系及電子研究所 Facebook 八卦
提供完善AI建模工具 陽明交大讓自駕車辨識更精準
訊息來源
https://www.digitimes.com.tw/iot/article.asp?cat=130&cat1=40&id=0000607775_SPR8I9Y662CLUO66K07LI
陽明交通大學電機學院副院長暨嵌入式人工智慧研究中心主任郭峻因。
嵌入式AI技術的應用漸廣,其中深度學習是目前最常用的演算法之一,此演算法需建立完整精確的訓練模型,推論(Inference)端才能順利發揮效益,在此次論壇中,陽明交通大學電機學院副院長暨嵌入式人工智慧研究中心主任郭峻因就以「嵌入式AI深度學習運算模型之建構與應用」為題,發表精采演說。
陽明交大的智慧視覺系統設計實驗室(NYCU iVS Lab),聚焦於各種智慧視覺研究,自駕車也是其中一環。郭峻因表示,自駕車已成全球汽車與科技兩大產業的共同趨勢,NYCU iVS Lab在此領域的研究包括各種ADAS所需的功能與相關技術,在感測器部分,除了視覺感測器外,其研究內容也包括光達(LiDAR)。他指出,影像辨識目前是AI的主流發展方向,在車用領域,AI也可應用於LiDAR,進行物件偵測與分析。
對於AI的導入建議,他表示開發者必須先行掌握圖資與軟硬體核心技術,再進行AI建模,在此環節郭峻因特別強調,建模時必須採用定點而非浮點運算,方能符合自駕車系統需求。針對目前AI設計趨勢與挑戰,郭峻因則以近期的某電動車事故為例點出問題癥結。日前台灣高速公路發生一起車禍,駕駛人放手讓電動車行駛,電動車卻直接撞擊前方道路上一輛倒臥的貨櫃車,在一般正常狀態下,該品牌電動車可偵測前方車輛,過近就會自動剎車,但在這次事件中,AI無法辨識靜止且呈倒臥姿態的貨櫃車是否為車輛,再加上白色車身影響了其視覺判斷,最終釀成車禍。
從這次事件可以看出目前AI在自駕車上的幾個問題,像是攝影機無法偵測車道車輛、霧與強光會干擾系統識別白色汽車、雷達有可能忽略靜態車輛、相機與雷達兩大感測器整合方式有待改進等,現在NYCU iVS Lab就致力於解決上述問題。
郭峻因緊接著談到嵌入式AI感應核心技術與應用。他指出標準的嵌入式深度學習開發,必須先設定與標示資料、再建構訓練模型。NYCU iVS Lab已針對上述環節推出不同平台,讓AI開發者在不同環節均有快速簡易的工具,協助業者縮短開發時程。
郭峻因表示,NYCU iVS Lab所推出的工具都經過測試,具有高度實用性,以資料的設定與標示為例,NYCU iVS Lab在此部分提供的ezLabel工具,只需要前後兩幀畫面,即可標記整段影像中的物件,大幅減少人工標記工時;ezLabel是網路開放平台,可讓全球各地深度學習專家與一般民眾使用,目前ezLabel 2.3版已累積有超過610位使用者。
模型建構部分,NYCU iVS Lab建構SSD輕量化模型與MTSAN(Multi-Task Semantic Attention Network;多任務語義注意網路)。SSD輕量化模型解決了過去此類模型因錨點(Anchor)密度不足,難以偵測瘦長物品的痛點,NYCU iVS Lab在加入CSPNet後,不僅強化運算速度與準確度,同時運算量與參數量也減少了一半。至於MTSAN則是結合物件偵測技術,利用畫素分割場域,並藉此強化物件特徵,郭峻因指出,光是此動作就可提升4.5%的準確度(mAP)。
自駕車導入可分割場域的MTSAN後,可與前車防碰撞(FCWS)或車道偏移系統(LDWS)整合,精準判斷車道,在山路上行駛時,可以識別彎曲車道線,另外也可加入2D與3D的卷積(Convolution)行為分析技術,用來預測後端車輛的超車方向與可能性。
演講最後郭峻因引述美國未來20年發展AI的藍圖做總結。他表示未來的AI必須與情境整合,同時打造開放性知識場域,集結眾人之力,讓AI可了解人類的智能與反應,以進行有意義的互動,此外AI也必須能自我學習,整合周邊環境的各種資訊,培養應對困難挑戰的能力。
至於自駕車的AI應用,他則指出需強化研發各種感知技術,讓車輛可以精準識別路上各類型物件與其移動的意向,將是未來產學研的重點,透過這些研發,車禍事故發生機率將可大幅降低,進而建構安全可靠的交通場域。
輕量化模型 在 黑羽 Youtube 的評價
我是不是對員工很好啊~
每週一到五下午5點更新,六日中午12點更新記得要開啟YouTube🔔鈴鐺唷!
🔥電腦規格🔥
機殼:火鳥科技-黎明至尊
處理器:AMD Ryzen™ 7 5800X
主板:BIOSTAR 映泰-B550M-SILVER
顯卡:ZOTAC- GAMING GeForce RTX 3080 Trinity
記憶體:十銓科技-NIGHT HAWK RGB DDR4-3600 8G*2
SSD:十銓科技-CARDEA ZERO Z340 M.2 PCIe SSD 512GB
風扇:火鳥科技-幽靈ARGB 120
燈條:火鳥科技-光魔3.0 ARGB LED燈條套組(40公分*2)
電源供應器:EVGA 金牌 850W
耳機:德國冰豹-NOZ 立體聲電競耳機
滑鼠:德國冰豹-Burst Pro 超輕量化光學電競滑鼠
鍵盤:德國冰豹-VULCAN 121 AIMO機械電競鍵盤-泰坦紅軸中文-黑
滑鼠墊:德國冰豹-Sense AIMO
貓貓頻道快給我罐罐☛https://pse.is/S5EUP
黑羽の粉絲群☛https://discord.gg/zT6rzMe
周邊の網路商店☛https://pse.is/TCQKX
看完記得訂閱窩☛http://bit.ly/27QQBOa
黑羽の遊戲頻道☛http://bit.ly/2dUzNkP
黑羽の直播紀錄☛https://pse.is/SAVGF
【生活必須要更多的黑羽】
黑羽IG(blackm3284):https://www.instagram.com/blackm3284/
Facebook粉專☛https://www.facebook.com/blackm3284
個人Facebook☛https://www.facebook.com/blackm3heiyu
bilibili☛https://space.bilibili.com/355677304/#/
Twitter☛https://twitter.com/blackm3284
Twitch☛http://www.twitch.tv/blackm3
【黑羽小資訊】
✎直播軟體➤Open Broadcaster Software
✎後製軟體➤SonyVegas
✎電腦周邊➤麥克風Blue Yeti、鍵盤B.FRIED MK1R、滑鼠羅技G900、視訊鏡頭羅技C922Pro
【合作方式】
廠商邀約➤HeiYu@capsuleinc.cc
創作者邀約➤blackm314968@gmail.com
#黑羽 #電腦 #水聊食龜宅大餐

輕量化模型 在 XXY_Animal of Vision Youtube 的評價
#歷史上的今天 1999-MAY-19 星際大戰首部曲上映
《星際大戰首部曲:威脅潛伏》是目前《星際大戰》系列電影中的劇情時間最早的一部,描述了銀河共和國的一場貿易衝突意外發現了某種黑暗勢力正蠢蠢欲動。
▶ YouTube收看:
https://youtu.be/4sSPhmASsh8
▶ PODCAST收聽:
https://open.firstory.me/story/ckadgxqgsfu9008736o7pd3el
《星際大戰》可以說是美國科幻文化中,非常重要而且討論度非常高的經典作品;自從1977年第一部《星際大戰》電影上映後,到了今日已推出了九部本傳電影故事和兩部外傳電影故事,影集、動畫、小說、漫畫等周邊作品也開啟了《星際大戰》的娛樂事業,讓它成為家喻戶曉的娛樂品牌之一。
《星際大戰首部曲:威脅潛伏》的上映極具時代意義,它不只是星戰創始人 喬治盧卡斯睽違16年的夢想之作,同時也將1977年到1983年的《星際大戰》經典三部曲故事更加延展,描述了一個經典反派黑武士如何從光明面投向黑暗面,另一方面也描述了民主政治如何走向權力腐化的帝國政權。不論在人性或是政治上,《星際大戰》的世界觀更顯完整,也為接下來迪士尼接手後的《星際大戰》後傳三部曲鋪了路。
值得一提的是,首部曲中的特效場面使用了更新動畫技術,更多以電腦建模方式製作的場景,與過去實景模型的特效技術不同;當中讓影迷津津樂道的光劍對決場景,也因為演員使用的道具劍材質改進,變得更輕量化,讓動作場面變得更加靈活、緊湊。
另外在片中飾演艾米達拉皇后的娜塔莉波曼,也因為演出本片星路大開,在完成本片演出後也完成了她在哈佛大學的學業,接演了接下來諸如《冷山》、《偷情》、《V怪客》、《巴黎我愛你》、《我的藍莓夜》等片。她在2010年因為演出《黑天鵝》獲得第83屆奧斯卡金像獎最佳女主角獎,也在日後投入幕後製作的工作。
看完這則「歷史上的今天」你有什麼想法呢?
歡迎留言分享與我討論唷!
**************
歡迎加入【有梗電影俱樂部】,不錯過任何電影實體聚會與活動喔!
臉書社團(需回答問題審核):https://www.facebook.com/groups/viewpointmovieclub/
Telegram群組:https://t.me/viewpointmovieclub2
PODCAST - Firstory APP
📣 XXY:https://open.firstory.me/user/xxymovie
📣 What A MAXX!:https://open.firstory.me/user/whatamaxx
別忘了按讚追蹤XXY視覺動物
📣 XXY視覺動物 YouTube頻道 http://pcse.pw/9ZNYT
📣 XXY @Yahoo頁面 https://tw.tv.yahoo.com/xxy/
📣 IG:xxy_djfishmb
📣 XXY @方格子 https://vocus.cc/user/@XXY2018
#電影 #歷史 #點評 #影評 #知識 #解析 #movie #history #星際大戰 #starwars #首部曲 #娜塔莉波曼 #喬治盧卡斯 #光劍

輕量化模型 在 轻量化和大模型计算模式是啥?【AI芯片】AI计算体系03 的八卦
轻量化 和大 模型 计算模式是啥? ... 压缩算法、端侧推理 模型 、大 模型 和并行模式等重要的里程碑SOTA 模型 和算法为切入点,深入地了解什么是深度学习计算 ... ... <看更多>