運用AI、大數據,讓防疫精準到位
今年一月底過年時,行政院成立了 #防疫大數據小組。我們用智慧科技廣泛地應用在防疫工作。
我身為一個醫師,畢業於台大公衛所,如同大家知道,我有一個亦師亦友的夥伴:從學校到政治工作、到SARS,到今天的武漢肺炎,他可說是奮鬥不息。陳建仁 Chen Chien-Jen老師當然教學嚴格(雖然看起來和藹可親),讓我不但能從臨床工作轉換到流行病學的領域,也能瞭解各種數據分析及複雜的統計。
時代在轉變,隨著計算機、通訊,各種新技術的發達,已經比我研究所時代突飛猛進;大數據分析、人工智慧中的機器學習,也已讓過去不可能的任務,可以在短時間完成,開啟了防疫工作前所未有的新視野。
.
二月初,我就邀請杜奕瑾 (Ethan Tu)及 AI Labs的工作夥伴,一起協助政府防疫。
這陣子,相關的工作會議來來回回,已開了好幾次。
他們不僅放下手邊的工作,也因此讓利用科技、大數據分析協助防疫的「台灣模式」獲許多國家詢問,包括歐盟、美國等等,也都想向台灣取經,想深入了解AI、大數據在防疫上的應用。
下午Ethan打電話告訴我,他們想到好方法了!急著與我分享討論。因此晚上討論了包括:
1.運用人工智慧協助臨床醫師在 #武漢肺炎 診斷。以大數據整合包括疫情調查、臨床、實驗室檢驗、病毒分析做流行病學的預測分析。
2.運用人工智慧輔助 #防疫追蹤系統 落實居家檢疫管理。
包含居家治療及居家檢疫,雙向提供資訊與疫情指揮中心連線,包括更多的衛教、健康資訊。
3.老藥新用平台,已初步透過AI篩選出有效藥物,現在持續針對更多藥物與實驗室深入進行精確比對。
.
超前部署,需要大家Brainstorming ,想出更好的方法解決問題,更是一個團隊的信念,無私的分享彼此的知識。感謝健保署李伯璋署長、衛福部資訊處龐一鳴處長、行政院資安處簡宏偉處長在防疫結合科技用盡心思,就像今天晚上燈火通明。
同時也有2部Youtube影片,追蹤數超過8萬的網紅范琪斐,也在其Youtube影片中提到,歡迎收看范琪斐的寰宇漫遊,今天的琪斐大放送我們要來談談,2020美國總統大選民調一面倒的說拜登贏川普一大截,川貴人,這次別選了吧?乖~我待會給你買個....樓?大家好,我是范琪斐。中間偏右的《華爾街日報》(Wall Street Journal)聯手中間偏左的《國家廣播公司》(NBC),在「川拜」首...
大數據分析 研究 方法 在 譚蕙芸 Facebook 八卦
[Just Do it](六之二)
「光復香港。時代革命」八個字,在首宗國安法審訊中佔了重要席位。八個字的意思是甚麼,誰人可以作解讀?控方早前傳召了專家證人嶺大歷史系教授劉智鵬;今日到辯方專家證人之一的港大政治與公共行政學系教授李詠怡作供。專家證人報告乃是她和中大新傳學院院長李立峯一起撰寫,然而今天只是由李詠怡作供。
李詠怡這一整天的作供,涉及了社會科學不同範疇,有量化統計方法、符號學、文化身份的建構、語言學。但早上,竟然來了一節關於中國歷史的討論,還要是以英語進行。
「李教授,你懂得中國歷史嗎?」辯方大狀劉偉聰,輕輕問到。
和早前劉智鵬作供不同,今天整天審訊,以英語為主,翻譯員只需照顧在犯人欄裡的被告唐英傑。雖然唐戴了耳機,但翻譯先生坐在唐旁邊,兩人只隔了一度欄。
身型瘦削,長髮及肩,穿黑色軟質西裝外套和上衣,下身穿灰色西褲,腳踏圓頭皮鞋,臉容沒化粧,說話嚴肅的李詠怡教授,用英語說着:「我在香港出生及教育,本科也在香港修讀。我在讀書時有修中國歷史。」
劉大狀穿衣講究,條子西褲配了顏色圖案袜子尖頭皮鞋。上庭時,脫下條子西裝外套,套上白色大狀領子,外披黑色大律師袍。銀白色假髮下,他那長及頸項的頭髮向外翹,說英語時,口部張開得特大。
他的手部動作很多,食指和中指之間夾着一支原子筆,當他請李教授慢下來時,會把右手掌竪起,開始新提問時,會用食指指着專家證人李教授方向,靜下來時雙手疊在腰間,緊張起來時上身向前傾,瞪起眼。
劉大狀的身體語言多樣,像個樂團的指揮家。
這天,劉大狀用廣東話朗讀古籍,又有一番古代文人雅士風韻。他從英式紳士風,轉變成古代書生腔口,在高院一庭朗讀着:「《元史:陳祖仁傳》裡,自古人君,不幸遇艱虞多難之時,孰不欲奮發有為,成不世之功,以光復祖宗之業。」快慢起伏有致,像朗誦表演。
劉大狀解釋,陳祖仁乃是元順帝之advisor,因為元順帝要修建皇宮而花費了金錢,陳勸諫皇上。
劉大狀追問,這句中,「光復」二字有沒有推翻政權之意思?李教授回應:「沒有,因為他是皇帝,他不會想推翻自己的皇朝。」此時,坐在律師後的控方專家劉智鵬教授,一度仰頭思考。
劉智鵬早前作供,以歷史脈絡分析八字意思,認為「光時」口號有推翻政權意思;今日辯方專家證人作供,三位法官發問的次數,顯然比早前劉教授作供時更頻密。
劉大狀問,英文Liberate Hong Kong (光復香港之英文翻譯)句子之中, “liberate”意思為何。李詠怡教授指,和中文「光復」意思有差異,「只能抽象地解釋有些事物被控制了,被限制了,希望從控制和限制中重獲自由。」此時,控方證人劉智鵬低頭與旁人細語。
至於「革命」意思又如何?李詠怡教授指,有三個意思,第一,改變國家管治和政治體制,有可能使用暴力;第二,人們做事方式出現重大改變,例如「科技革命」,「科學革命」;第三,天體運轉。顯然,第三個意思被排除。
而李教授認為,考慮到「光復香港」的使用,和2012-2018年頻繁出現的「光復行動」有關,「光復」這詞應放在這些活動脈絡裡理解。
而李詠怡指出,「光復行動」並非旨在推翻政府或政權;而是人們因為社區及日常生活不開心,被內地遊客或水貨客滋擾,想處理關於社區問題,是關於公共空間秩序的恢復。
劉大狀追問,「內地遊客和香港人是不是不同的族群 (ethnic group)?」
李詠怡教授解釋,在社會學有謂「社會建構的身份」(social construction of identity).她指出,有人或許會以血緣來理解族群,但社會學亦會看人們主觀如何把自己定義。
劉大狀進一步問:「一個人可不可以屬於多於一個族群?」
李教授說:「可以」。
劉拖慢了節奏,咬字清晰問到:「當一個族群厭惡另一個族群,是否等於要推翻政權?」
李詠怡教授乾脆地答:「不是。」
午飯後,眾人飯氣攻心,昏昏欲睡,幾名押送被告唐英傑的懲教職員坐得有點歪,反而還押一年的唐英傑,穿起藍色西裝,深色襯衣,始終翻閱着律師給他的厚厚文件。
李詠怡教授指出,她理解「時代革命」,要回到梁天琦於2016年的立法會造勢晚會錄影片段,梁天琦曾解說,他先是想「世代革命」,但後來改為「時代革命」,因為認為不應以「世代」差異作為政治主張。
李教授認為,當時梁天琦提出的「光復香港。時代革命」,以她的理解為:「恢復一個已失去的舊秩序,團結喜愛自由的人,為這個重要歷史時刻帶來改變。」
李詠怡教授和其研究伙伴以數據分析過連登討論區的帖子,發現在反修例運動期間,每天有高達4400帖子提及過「光復香港」或「時代革命」。而這個口號在反修例運動中,於2019年7月21日開始被示威者使用,其後使用次數上升。
她分析到,口號自7.21被廣泛使用,原因有兩個:第一,在2019年7月有出現過「光復屯門」「光復上水」等示威活動,「光復」字眼在示威者間再次出現。第二,元朗發生7.21襲擊事件,「此事令公眾感到憤怒,人們需要一些新的東西去表達他們的憤懣。」李詠怡教授解說道。
李教授再指出,反修例運動有一些特色,就是「高度去中心化」,而且「沒有清晰領袖人物」。在此背景下,她和團隊曾訪問40個示威參與者,作焦點小組討論,結果發現,對於口號的理解,「不同人有不同意思。」
較特別的是,在數據分析下,「光復香港」或「時代革命」均與「香港獨立」在數據上沒有重要關聯。對比之下,「五大訴求」和「香港獨立」的關聯,和「光時」與「港獨」口號一樣,兩者關聯不強:「而我們知道,五大訴求與香港獨立,並沒有關係。」
此時,李詠怡教授把討論帶往符號學的層次。「人們會主動為符號添加意義,影像或符號像錨,人們會把自己的感受及假設投射在上面。而口號本質上是含糊不清,懷有多種意義,因為口號的設定就是要曖昧、模稜兩可,具開放性,好讓你能添加意義進去。」
此時,法官杜麗冰舉了一個生活化的例子:「就好像運動品牌Nike,它那句口號『Just Do it!』的意思,在不同情況使用,也會有不同的意思。」
而李詠怡教授不認同控方證人嶺大歷史系教授劉智鵬的演釋,「劉教授把古典中國文本,近乎機械式地用作解讀口號,是從脈絡中抽空了。」
李詠怡教授再進一步指出,早前在法庭播放了梁天琦造勢晚會片段,她發現,控方呈上的文件中,連梁天琦說的話都抄寫出錯了,而這個錯,正好顯示抄寫者對文字意義的不理解。
梁天琦曾在晚會上說過:「選票就係子彈,這句是Malcolm X講,我地冇槍冇炮,手上選票就是政治版圖變革改革的一仗。」而當時控方專家劉智鵬指,梁意思是以把選票等同「武器」,欲以暴力推翻政權。
但李詠怡教授說,當她翻閱法庭文件時,發現抄寫者把美國黑人民權領袖Malcolm X誤寫為「Comix」,中文版亦「亂寫一通」(李形容為gibberish)。
李教授指,這裡的典故來自Malcolm X於1964年發表過的演說, “The Ballot or the Bullet”,目的是要號召非洲裔美國人登記做選民及參與投票。李教授指:「這裡是一個比喻,就像我們說『時間就是金錢』。」
作供進行到下午,三位法官不斷發問問題。李詠怡承認,從連登找數據,只能找到「連帶關係」,不是「因果關係」,要找因果的話,則要用另一些工具。法官們亦好奇一些細緻的調查方法,例如為何「光復香港」和「時代革命」兩句要分開去作大數據分析,而不是一併去分析。
法官們翻閱一張又一張圖表,有時候,三位法官有人只有黑白圖表,沒有彩色圖表,律師們又要趕去找彩色圖表。大家翻查完一個又一個bundle,三位法官不斷發問問題。
那邊廂,坐在犯人欄的唐英傑,很仔細地研讀數據,他像個勤力好學的學生,一直跟進庭上的討論。直至下午,唐英傑每看畢一頁文件,會小心地用右手手指夾着紙張,擱在犯人欄寬闊的木欄上。
從早到晚,法庭忽然成為了跨學科的討論場域。元順帝,Malcolm X先後登場。從東方西方,從遠古到近代,人物夠多樣。怎知差不到多到休庭,還有多一個名人登場。
劉大狀提到Edward Leung (梁天琦)說了些甚麼,他卻說了Professor Lau (劉教授)說了甚麼。乾坐了一天的主控官站起來指正劉大狀說錯了。
劉大狀風趣地道:「哎,我說漏了嘴。」然而英語劉大狀說的是,「My Freudian slip」.
全法庭有人爆笑,連奧地利心理分析始祖弗洛伊德的理論也搬了出來,曾說過人皆有「戀母殺父情意結」的奧地利大師,指出我們說錯話,是潛意識想法浮出水面的表現。
然而這位還可以說笑,在庭上風趣幽默的劉大狀,昨午才以被告人身份,出席了西九龍裁判法院的47人國安法審訊過堂,獲得繼續保釋,才能今天披上大狀袍,站在庭上替另一位國安法被告辯護。被告身份與辯護律師身份交替切換,在現今香港,時代寫照也。
***
國安法首審專家證人系列(六之一):[Regime & Redeem]
7月2日控方專家劉智鵬作供
https://www.facebook.com/wwviviantam/photos/a.1435553239866430/4210137115741348/
國安法首審專家證人系列(六之二):[Just Do it]
7月9日辯方專家李詠怡作供
https://www.facebook.com/wwviviantam/photos/a.1435553239866430/4229321820489544/
國安法首審專家證人系列(六之三):[過去與未來]
7月12日辯方專家李詠怡作供
https://www.facebook.com/wwviviantam/photos/a.1435553239866430/4237523026336090/
國安法首審專家證人系列(六之四):[知行合一]
7月13日辯方專家李詠怡及李立峯作供
https://www.facebook.com/wwviviantam/photos/a.1435553239866430/4240215429400183/
國安法首審專家證人系列(六之五):[沒有誰比誰高貴]
7月14日辯方專家李立峯作供
https://www.facebook.com/wwviviantam/photos/a.1435553239866430/4243328702422189/
國安法首審專家證人系列(六之六):[選櫻桃的人]
7月15日辯方專家李立峯作供
https://www.facebook.com/wwviviantam/photos/a.1435553239866430/4245860505502342/
(圖為辯方專家證人之一的港大政治與公共行政學系教授李詠怡離開法庭時攝,星期一她繼續作供)
大數據分析 研究 方法 在 譚蕙芸 Facebook 八卦
[選櫻桃的人](六之六)
國安法專家證人對壘,進入了最後一天。過去一星期,控辯雙方對「光復香港。時代革命」這口號的爭辯,尤如走在平行時空。
雙方對此八字的歷史典故、在近代香港公眾領域中如何冒起,口號因為為甚麼事件而爆紅,到解讀八字含意是否與「分裂國家」有關,開展激烈爭辯。
控方的歷史學者劉智鵬,追溯了中國古籍,並引述2016梁天琦競選活動節錄,並以2019年7.21中聯辦外示威者的「反中國政府」行為,加上警方點算示威錄影片段口號與顛覆行為同時出現作為論據,指「光時」數千年意義不變,必然與把香港從中國國土分裂出來有關。
辯方的兩位李姓社會科學學者,則使用多種社科分析工具,以大數據及訪問等量化及質化研究,說明「光時」意義開放多樣,與「港獨」關係不強。
這天早上,李立峯(Francis)進入最後階段作供。今天法庭內對答互相穿插,你來我往,因為程序原因,辯方補問後,控方又可覆問;三位法官亦有提問,其後,控辯雙方亦可進行一輪補問。舌劍唇槍,火花四濺,對量化研究的統計學方法論,展開最後一輪爭辯。
法律人crossover社科人,法庭內社科論述夾雜法律用語,互相澄清,有時理解,有時誤解,有時水火不容,是一種跨專業跨社群的「傳播過程」。
高佻的Francis,今天穿了筆挺的深灰色西裝外套和同款褲子,藍色袜子,配黑色皮鞋。手長腳長的他,坐在那張調得太低的證人辦公室椅子上,大部份時間雙腳交疊着,解說社科原理時,忍不住左右微微搖晃。
Francis的手部動作很多。虛構的符號,概念,時間線,常在空中出現。「這是point A,這是 point B」,左右手好像各自握着一個小球;「時間過了幾個月」,他的右手掌竪起,在枱面上從左掃向右;「事情慢慢發酵」,他又會凌空做出像搞動手動原筆刨的動作。證人枱,尤如學術講堂。
Francis作供到了第三天,法庭裡的所有人,從庭警到保安,從記者到市民,從法官到律師們,都像接受了社科特訓。今天的對答,涉及更深入地提問,用甚麼樣的嚴謹精神,檢視事物的意思,確立事物的關係,作出任何一個聲稱。
控方曾指出,「光時」口號的出現日期,來自7.21白天,中聯辦外「反中國政府」的示威,故口號含意和「反中國政府」有關。
Francis反駁,電腦分析連登討論區,發現「光時」於網上出現的時間,要比7.21早兩星期。他解釋,2019年7月初,有人舉行「光復屯門公園」活動;7月中,有「光復上水」活動。他留意到網上已出現「光時」口號完整八字或部分。在他看來,社會運動一直發展,社運進程和口號如何出現有動態關係。
「心理學上有Priming (促發效應) 這概念。7月初至中的光復行動,讓『光復』二字開始重新在人們腦海出現,心理上作出了提示,並驅使人們回想起幾年前的社區光復行動,為『光時』口號後來再出現製造充足背景。」
控方亦挑戰,7.21日後,「光時」口號廣泛被傳播,是因為人們對「反中國政府」的意思認同。
Francis用數據反駁。Francis披露,他於2019年11月替進行全港電話民意調查,其中一個問題問受訪市民:「過去幾個月那一件事令你對警方產生負面印象。」Francis指出,大部份回應(逾八成人)均指出「元朗襲擊」有關。此民調是當時由警監會委托Francis團隊進行的。
「這數據顯示,721之後,公眾關注是元朗襲擊,而非中聯辦。對支持反修例運動的人來說,元朗襲擊引起巨大的集體不滿和憤懣。『光時』口號夠抽象,讓人們在示威現場吶喊出來,可以表達他們的情緒、憤怒和怨氣。」Francis補充,口號出現是一個動態過程,不是忽然出現。
另一個討論重點是,唐英傑案發生在2020年7月1日。而Francis的示威現場調查、電話民意調查及焦點小組等,均於2020初完成。法律上,十分強調證據之相關性 (relevance),如此,好像有段時間的空白。
今早,辯方完成覆問後,三位法官先曾退庭25分鐘,卻沒有讓Francis離開。重新開庭後,唯一的男官陳嘉信娓娓道來:「李教授,請給我們一點耐性……」說了一大堆開場白,原來就是問及這個在法官們心中的「空白時段(gap)」。
意思是,Francis如何說服法庭,他對「光時」口號意思乃開放性的看法,在案件事發時及之前 (2020年初至中),並沒有改變?如此這樣,Francis又以理論輔以數據回答。
首先,Francis以控方專家的說話反問:「我們在2020初,以多方法去找『光時』口號的意義,數據及焦點小組都確認『光時』可以有多種意思,與『港獨』關係不強烈。」
「控方專家劉智鵬教授認為,『光時』口號千百年不變,那忽然有人告訴我,在我的研究之後6至8個月內,口號的意義有改變,那就請證明給看,相關理論及證據。現在不只是說意義出現了改變,而且是變得極單一,出現了很具體的轉變。作為社會學家,我看不到相關證據。」
Francis提供自己的證據。他從連登不同時段,搜刮了大數據,嘗試彌補這個「關鍵空白」。
Francis詳細解釋研究方法:
在2019年11月到2020年2月,從連登「時事台」看不同口號出現的情況。
團隊發現,「光復香港」與「香港獨立」的統計學上關係疲弱,相關系數(correlation coefficient)只有0.295;「時代革命」和「香港獨立」的相關係數亦只有0.353。而另一個口號「五大訴求」和「香港獨立」的相關係數也差不多,只有0.371 。
Francis解釋,「1」是統計學上「完全有關」。「光復香港」和「時代革命」出現的統計學上關係很強,高達0.99 。
而統計學上,「0.3」只能說是弱到中度有關,Francis指出,這是國際學術圈子共同認知的解讀。由於「五大訴求」中的具體訴求內容,與追求港獨沒有關係,也可以說明,「光時」口號和「港獨」沒明顯關係。
Francis指,若「光時」真是於2020年出現意義上的轉變,同一個研究於2020年初至中進行,相關係數會上升。但團隊真是把連登於2020年案發前一段時間的數據再以電腦分析,得出結果是,統計學上,「光時」口號與「港獨」關係維持疲弱。
團隊於2020年3月至7月,從連登找一樣的口號。發現「光復香港」與「港獨」的相關係數,維持在0.291, 而「時代革命」和「港獨」字眼的相關係數,亦維持在0.2652 。
「若『光時』口號在案發現時間,與『港獨』意思變得更緊密,數字應該上升,但數據維持差不多。這測試說明,沒有證據去說『光時』與『港獨』的意思變得越來越相近。我們知道案發現時間有個隙縫,我們盡力嘗試去以數據回答。」
面對統計學上的關係,法官和控方代表,都作出追問。
這天法官杜麗冰戴了色彩繽紛的膠框眼鏡,她問道,「會不會只是後來少了人談『港獨』,少了人上網討論?」
Francis指出:「相關係數與數量的多少沒關,而是兩個變項(variable)的強弱關係。」
Francis早前提過,意義十分雷同的字眼,人們不會兩個都使用:「好像我說『你很醒目』和『你很聰明』(clever及smart),人們會只選一個字,否則是太累贅(redundant)。」
彭寶琴法官學以致用,立即追問,如果「光時」和「港獨」意思接近,這個方法怎樣有效?因為說了「光時」等於說了「港獨」,人們不用說兩次同一件事。
Francis的「社科狂熱」又燒起來,指彭官點出了一個重要問題:
「所以研究的設計,非常講究。這裡關鍵是我是以『每一天』為計算單位,而非『每一個帖子』。人們發一個帖,不會重覆使用同義字,但於同一日,總的來說,若當時『港獨』是熱話題,不同的人同日使用『光時』口號會不會多了?」這是設計的精要。
Francis後來再解釋得更具體。
「例如,某一天,含有『香港獨立』的帖子數量,佔當日總帖子數量比例為10%;同一天,含有『光復香港』的帖子數量,佔當日總帖子數量比例亦同為10%。
第二天,含有『香港獨立』的帖子數量,佔當日總帖子數量比例為5%;同一天,含有『光復香港』的帖子數量,佔當日總帖子數量比例亦同為5%。
第三天,含有『香港獨立』的帖子數量,佔當日總帖子數量比例為12%;同一天,含有『光復香港』的帖子數量,佔當日總帖子數量比例亦同為12%。
如此這樣,我們拿200天的數據,看關係是否一起上升和一起下滑, 即是看兩組數字是否齊上齊落。最後算出來的『相關係數』就會是『1』.」
然而,控方的報告,是由幾位警員,回看百計遊行錄影,然後數算有多少天有人揮舞「光時」旗幟或有喊「光時」口號,而再紀錄這天有沒有人進行「顛覆行為」,例如喊港獨口號、進行破壞或使用暴力等。
早幾天,Francis批評,警察的做法,不能建立「光時」與「港獨」意思相,因為兩者只是同時出現 (co-appearance)。
控方代表周天行檢控專員,還是堅持挑戰Francis,指出Francis沒有把連登裡刪掉了的帖子,計算在內。
Francis回應說:「我們的數據包含2千5百萬個帖子或回應,刪掉了一些帖子,不會影響結果。」
周專員追問:「你知道有多少帖子被刪掉了?」
Francis答得巧妙:「我不需要知道。」
周專員再拿出那疊人手從連登萃取下來的帖子影印本,指出個別帖子,叫Francis回應。帖子裡,有個別網民留言,指「光時」意思就是「港獨」。
Francis忍不住回應:「這裡顯示的是,有人把『光時』理解為與『港獨』有關。這和我們的焦點小組發現一樣。的確有人從『光時』看到有『港獨』意義。」早前,Francis在庭上有從其報告讀出有焦點小組參加者,指『光時』有『少少港獨意味』,但同時有其他人看不到港獨意思。
Francis語帶雙關:「但我看的是2千5百萬留言,人們不可以 “cherry pick”(挑選櫻桃,指只選取對自己有利的東西,漠視對自己不利的東西)。」
Francis說到不可以cherry pick時,一頓,望着周專員說:「我不是批評你,而是我們如何防止包括我自己也做了cherry picking。(I am not criticizing you, but how can we prevent myself from cherry picking)」
Francis續說:「當然,研究員可以從2千5百萬個留言逐個查看是否與『港獨』有關,但現實上沒可能,所以我們才用這個統計學方法去看關聯。若你提及的這個帖,持續頻密在連登出現,數據上會見到強關係,但這類帖子只是零星出現,沒有成為一個主流。」
辯方代表劉偉聰大狀坐着,聽到這裡,微微一笑。
周專員還是不放棄找Francis研究的漏洞:「你沒有調查過連登以外,例如現實生活上,有人用其他方法喊口號?」
Francis重新讓數據說話:「我們已有2千5百萬個留言,多達20萬用家的意見,結果我們找不到統計學上的強烈關係。你問可不可以再做其他研究?當然可以。」
連登大數據分析,把「光復香港」和「時代革命」分拆,不是把八個字一次過與「香港獨立」作電腦運算。
Francis解釋他背後想法:「網民留言很短的,只寫『光復香港』或只寫『時代革命』已經代表了整個口號。連劉智鵬教授也說過,他認為把整個口號分開來分析也含有分裂國家意思,劉教授也有拆過口號作理解。」
周專員再嘗試進攻:「警察做的示威錄像調查具相關性(relevant),有助(helpful)我們理解口號意義。」
Francis:「我不認為有幫助,我會說不相關(irrelevant)。」
周專員瞪大了眼,眼神穿透了長方型金屬眼鏡:「完全不相關(not relevant at all)?」
Francis反駁:「如果你是指警察報告,能支持『光時』意思是『港獨』,那警察報告不成立,清楚不能作出這個總結。我抱歉只能說,我不認為是相關的。(Sorry to say I don’t think it is relevant)。」
周專員質疑,警察報告中,百計示威錄影片段,Francis有沒有看過。
Francis回應:「我信任警察,在點算數目字上沒有問題。(I trust police on how they count them)我沒有理由自己去看一次,為了挑戰警察點算是否準確。」
周專員轉向發問統計學問題,叫Francis拿着控方影印的連登帖子,即場示範運算「相關係數」。
此時,彭寶琴法官插話,指這疊資料未必對法庭有幫助,「除非你對李教授的方法論有質疑」。
周說:「就是要看李教授從連登找到的結果有多可靠。」周繼續要求Francis拿着影印的連登帖子示範做統計運算。
時近中午,彭寶琴終於解說了她整個早上學習到的統計學知識:
「李教授解釋得好詳細了。當一個變項的百分比,與另一個變項的百分比,在一段長時間內,可以檢視兩者是一起上升,還是一起下降,如兩者趨勢一樣,則『相關係數』等於『1』.」說完,彭官望着Francis。
Francis微笑說:「很接近了(Close Enough)。」
此後,周天行專員就說,沒有提問,然後坐下。
兩位社會學家,連續五天在香港法院講解社會科學方法、理論,解釋如何以不同工具怎樣去探視、切割、理解社會運動。本來大家以為只是虛浮懸空又抽象的文字意思,透過社科工具,學者對社會深切的認知熱情,原來可以從人們的腦海中,抽取一些集體認知和意義。
按李立峯所說,他認為這些意思,雖然觸不到,也是可以科學化去檢視和驗証的社會性事實(social facts)。
兩位學者的多項關於反修例運動的研究,早在2019年已經開展,當時沒有國安法,唐英傑亦未成為被告。而再回溯過去幾十年,社科學者一直有研讀社會運動,撰寫學術論文和著書。
七一遊行,六四晚會,派研究員到現場做問卷調查,打電話到府上問大家的各種想法,在學術圈子不是新鮮事。
只是以往這些艱澀的知識,只會出現在大學班房裡,供學者們互相辯論,或學子們修讀學習。
如今社科學者走進法庭,把他們畢生研究的成果,於審訊中呈上。法官們在審訊中,不時對這批「專家證人」強調:「教授,請問你/妳如何可以協助法庭理解這或這?」「教授,若我有錯請糾正我。」
至於法庭與社科世界的奇異交雜,最終對判決是否有影響,還待揭曉。
不過,Francis已不是第一次以社科學者身份,出現在香港法庭。2017年佔中九子案開審,他是香港近代法庭史上,第一位以「民調學者」身份作供的專家證人。
控辯雙方的律師代表,曾於今次國安法第一審中,就Francis上一次於佔中案作專家證人的結果,各有不同解讀,各自做了自己的Cherry Picking。
控方周天行問:「李教授,上次於佔中案你以『民意調查』專家身份作供,最後法庭判詞下來,是否不給予你的專家報告任何比重?」
Francis答是。
然而辯方劉偉聰大狀亦曾問及:「李教授,雖然佔中案法官沒有對你的供詞給予任何比重,但判詞中卻形容,你在民意調查的作供過程裡『既有誠信亦可靠』。」
Francis亦答是。
是否徒勞?視乎觀點與角度。
(圖為兩位辯方專家證人離開高等法院)
***
國安法首審專家證人系列(六之一):[Regime & Redeem]
7月2日控方專家劉智鵬作供
https://www.facebook.com/wwviviantam/photos/a.1435553239866430/4210137115741348/
國安法首審專家證人系列(六之二):[Just Do it]
7月9日辯方專家李詠怡作供
https://www.facebook.com/wwviviantam/photos/a.1435553239866430/4229321820489544/
國安法首審專家證人系列(六之三):[過去與未來]
7月12日辯方專家李詠怡作供
https://www.facebook.com/wwviviantam/photos/a.1435553239866430/4237523026336090/
國安法首審專家證人系列(六之四):[知行合一]
7月13日辯方專家李詠怡及李立峯作供
https://www.facebook.com/wwviviantam/photos/a.1435553239866430/4240215429400183/
國安法首審專家證人系列(六之五):[沒有誰比誰高貴]
7月14日辯方專家李立峯作供
https://www.facebook.com/wwviviantam/photos/a.1435553239866430/4243328702422189/
國安法首審專家證人系列(六之六):[選櫻桃的人]
7月15日辯方專家李立峯作供
https://www.facebook.com/wwviviantam/photos/a.1435553239866430/4245860505502342/
大數據分析 研究 方法 在 范琪斐 Youtube 的評價
歡迎收看范琪斐的寰宇漫遊,今天的琪斐大放送我們要來談談,2020美國總統大選民調一面倒的說拜登贏川普一大截,川貴人,這次別選了吧?乖~我待會給你買個....樓?大家好,我是范琪斐。中間偏右的《華爾街日報》(Wall Street Journal)聯手中間偏左的《國家廣播公司》(NBC),在「川拜」首場辯論後,到川普確診前這段時間,所做的民調顯示,拜登的支持率高達53%,足足領先川普14個百分點(53%:39%)。真的假的啦~這個幅度也太誇張,我們再參考一下別的。
(10/11公布)美國ABC News和《華盛頓郵報》(The Washington Post),在川普出院後做的最新民調,有54%的選民說會把票投給拜登,大幅領先川普12個百分點(54%:42%)。專門統計各家民調數據的Five Thirty Eight指出,拜登的平均支持率勝過川普10.4個百分點(52.2%:41.9%, 10/10數據)。另一個民調數據集合網站「真清晰政治」(Real Clear Politics)的網站顯示,從10月以來每一家主要民調公司統計出的結果,都是拜登遙遙領先川普,差距在5到16個百分點不等,其中不乏立場較為中間的The Hill和經濟學人。所以平均下來拜登的支持率領先9.8個百分點。(10/9公布)美國權威智庫與民調機構「皮尤研究中心」(Pew Research Center)做出來的結果是,52%的選民打算把票投給拜登,領先川普10個百分點(52%:42%)。
我們找了很多民調,可是只有很少數的說,川普領先拜登, 說很少數,是怕我們川貴人傷心,其實找來找去只有一個。 (10/5公布)英國《每日快報》聯手英美智庫Democracy Institute做的民調顯示,川普支持率在46%,小勝拜登1個百分點(46%:45%)。不過我還是註明一下,這個《每日快報》是英國的右翼八卦報,民主研究所的民調,也沒有被民調界公信力很高的538列入參考的近500家民調就是了, 所以現在大多數民調都顯示,拜登會獲得壓倒性勝利,但川貴人當然不認為他會選輸啊,最近又在那邊「Fake news」、「Fake polls」喊來喊去,民調統統都是假的!這都是幻覺~嚇不倒我的!
先不要笑,川貴人說的是真的,4年前一直到投票日當天早上,民調都還顯示希拉蕊一定會凍蒜,《紐約時報》做了大半年的民調,到選舉當天早上,還在說希拉蕊有80%以上的勝選機會,結果最後被「逆轉」,搖擺州統統被川貴人拿下!2016年的民調,被很多人認為是「壞掉了」、「走鐘了」,完全無法反映出真實民意,今年隨著大選日逼近,也有越來越多人開始質疑,真的假的啊?這幾年來專家們一直試圖釐清,當年的「希拉蕊慘案」到底是怎麼出現的,總之過去四年民調專家就很努力的要找出,民調為什麼會跟開出來的票差那麼多,但真的非常困難,因為變數實在太多了,我們今天就幫大家整理出幾個專家們認為可能的原因。
(一)手機的普及
還記得去年台灣不是在吵「手機民調要不要納入總統初選民調」嗎?美國其實也有類似的問題。美國現在就跟台灣「人手一機」一樣,有時候還兩三機,越來越少人使用家用電話了,而且年輕人、低收入者以及少數族群,都只用手機而已;反觀年長者和白人族群,就會比較依賴室內電話。大數據分析網站《Datanami》就指出,25歲左右的年輕人看到不認識的電話,幾乎都會pass不接;但70歲的長輩們則是每通必接,因此這樣進行的電話民調就很容易往某一族群傾斜。
那用手機民調不行嗎?根據1991年的《電話消費者保護法》(Telephone Consumer Protection Act of 1991;TCPA),美國是禁止「自動撥號系統」打電話給手機用戶的,所以如果要打手機做民調,就必須派出「真人」撥號,這有多麻煩呢?數據顯示,你想獲得1,000個回答,就至少得隨機撥號2萬次,其中大部分是空號,因為手機號碼是私人的,根本不會刊登在電話簿上,這實在太勞民傷財了,很想幫做民調的人馬殺雞一下耶,你們辛苦了。
(二)沉默的多數
每次選舉我都很期待接到民調電話,但大多數美國人可不是這麼想的,可能是因為擔憂個資和隱私外洩,導致選民接電話不敢說出真實意見,或者是覺得,蛤~民調很久欸,老娘才沒空理你。1970年代左右,美國「民調回應率」(Polls response rate)高達80%,你只要打過去人家多半都會回答你,但是根據「皮尤研究中心」最新報告,2018年美國「民調回應率」已經暴跌到6%,等於你打100通電話就只有6個人不掛你電話、願意花時間跟你聊兩句,但你也不知道他是不是講真話。
像2016年的大選,支持川普的選民中,就有一群選前不願意表態的,或者在接受民調時故意說謊的,有些甚至不告訴鄰居他們其實支持川普。《Datanami》表示,這些選民會讓調查的結果失準2%到6%,6%很多欸,根本就是超出誤差範圍了。
(三)網路民調難
啊現在網路那麼發達,用網路做民調不就統統搞定了嗎?事實上恐怕剛好相反。數據顯示美國18-29歲的年輕人,有98%都使用網路,但偏偏這個年齡層的人最不愛投票,拿美國總統大選風向球:2018年美國期中選舉為例,雖然這群年輕人投票率比前一次大幅提高15.7個百分點,但仍是所有年齡層中最低的(35.6%),也就是說,每個人都是「鍵盤投手」,大家網路上搖旗吶喊超熱情,結果投票日當天大家都覺得不差我這一票。另一方面,你在網路上想填幾歲就幾歲,想變性就變性,別國網軍想來帶風向,也不是那麼困難,因此網路民調也非常容易失準。
(四)早期民調誇大
另一個大變數是「早期民調」的準確度很低,因為選民還沒有足夠時間去瞭解候選人到底在幹嘛,但早期民調卻是媒體報導所仰賴的主要資訊來源,結果就是候選人拿來造勢、媒體見獵心喜誇大報導,進而影響到後續選民對候選人表示支持的聲量。例如看到拜登領先,那支持拜登的人講話就會比較大聲,因為他們是「主流」,反之支持川普的人,可能就會比較不敢表達意見,形成「沉默螺旋」。
「皮尤研究中心」也加碼解釋,事實上2016年的全國民調還算準確,(預測希贏3.3%最後贏2.1%),但美國總統大選是以選舉人票為單位,希拉蕊全國總票數高於川普也沒屁用,最後川普拿下所有的搖擺州,入主白宮。而選前的州民調也無法反映出搖擺州的真實民意,地方往往沒有全國性民調那種資源,四年前他們就忽略了在最後關頭,投給川普的搖擺選民數量,也沒有準確掌握未受過大學教育的白人選民,他們到底支持誰,種種因素導致了中西部上演「大驚奇」。還有就是民調公司往往有特定的政黨傾向,最後很可能導向「護主」的結果,讓民調不盡然客觀。
那這些問題2020年還會再重演嗎?老實說,有些變數還是很難避免,《紐約時報》就整理了,和四年前相比,哪些因素可能讓美國民調更精準或更失準。
更精準的第一點就是,搖擺選民減少了。
四年前民調失準的一大因素就是搖擺選民,但今年跟民調人員說:嗯~我還沒想好,的搖擺選民數量變少了,四年前的這個時候,大概還有20%的選民說他們還沒決定要投誰,或是打算投給小黨候選人,但今年這群人的數量只剩一半,而且其中支持川普的人也老早就表態,尤其是搖擺州的白人工人階級選民。
更精準的第二點是,選民教育程度的加權。
大家要有個概念,民調準不準確,完全取決於你抽樣有沒有做到「隨機」,也就是每個族群的意見都要被採納進來,但這真的非常難做到,最後很容易讓民調結果出現偏差。例如在美國,如果你跑去郊區教堂裡做民調,那幾乎可以篤定會獲得一個偏共和黨的結果;但如果你對大學生進行抽樣,最後很可能獲得一個偏民主黨的結果。另外的數據又顯示,受過高等教育的選民,比較願意接受民調訪問,每個都是選我選我~而那些較保守、教育程度較低的選民,他們的聲音就很難反映在民調上,所以如果你沒有按照「教育程度」來做加權,民調就會充斥太多年輕大學生的意見,導致結果偏向民主黨。先前民調機構都不怎麼重視教育程度對選情的影響,結果導致2016「爆冷門」。
有鑑於4年前的「教訓」,今年有越來越多民調機構,把選民教育程度的權重提高了,簡單來說就是把教育程度較高的受訪者音量降低一點,把教育程度較低的受訪者音量調高一點,讓他們各自符合在總人口中所佔的比例。今年從3月以來,美國各家民調機構做的幾十個調查中,已經有半數增加教育程度的權重,是先前的兩倍多(約20%)。
可能比2016年更糟糕的是,網路民調的增加。我們剛剛已經提過網路民調的準確度有待商榷,但過去幾個月來,越來越多機構採用網路民調的方式,比例佔地方民調總數的一半。他們採用的方法可能太過簡單,就是直接抓一群網路群組成員,然後再根據受訪者的人口統計資料進行分類加權,這樣的作法成本很低又很方便,但非常容易有樣本代表性不足的結果,而且最後民調可能左傾。 (最好的方式是結合電話民調和網路民調,例如AP/NORC/VoteCast的民調,電訪4萬人外加隨機抽樣11萬網友,結果可能較為客觀。
另一個可能不太客觀的做法是:請選民「回想投票」。
目前有越來越多投票機構採取這個方式,也就是要求受訪者回想2016年他把票投給誰,是希拉蕊還是川普呢?然後再依據他們的回答去做選舉意向的加權。這樣做可以讓民調數字看起來比較漂亮,也可以減少錯誤,但卻很難避免系統偏差,導致結果傾向某一政黨。再加上通常大家都會傾向回答,自己是投給獲勝的那一方,沒有人會想承認自己投給輸家嘛!再說這四年來誕生不少首投族,又有不少人往生,像是疫情導致那麼多人死亡,也有很多人搬到別的地方去,硬把2016年的投票意向套用到今年,恐怕不太合適。
所以這個民調到底是能不能看啊?你要是問我,我覺得就別看了 ,這是我們媒體想要預測選舉的結果, 或研究單位拿來做選民行為分析. 但一般選民還是把政策看清楚點比較要緊,你管別人怎麼投
今天琪斐大放送的關鍵字是:
#美民調失準
#選情霧茫茫
--------------------------------------
《#范琪斐的寰宇漫遊》每周四晚間8點55分在 #寰宇新聞台 播出,沒跟上的也沒關係,歡迎訂閱我們的 YouTube 頻道 🔔#范琪斐的寰宇漫遊 🔔https://reurl.cc/ZvKM3 1000pm準時上傳完整版!

大數據分析 研究 方法 在 容海恩 Eunice Yung Youtube 的評價
主席:
我們新民黨就今年度的財政預算案,在今年1月至3月期間,先後3次與財政司司長陳茂波會晤,在稅務、土地、房屋、醫療、教育、安老、青年發展、地區設施規劃、公務員福利,以及包括電競產業在內的經濟發展等不同範疇提出多項建議,當中我們見到財政司司長在2月28日公布的財政預算案,未有做到全民共享經濟成果。
不過,在政府公布補漏方案後,我留意到市民一般是歡迎政府派4,000元,但卻批評政府推出這項措施的方法和審查機制都很複雜,申請門檻高、細節又不清晰,很多市民都搞不清楚自己是否合資格申領,他們亦不懂得計算差額。每日都有很多市民到我的地區辦事處查詢有關細節,另有不少市民在我的臉書留言,鬧政府搞到這項措施咁複雜,最終只是折騰市民,希望政府聽到市民的意見,以便民、利民為前提,盡量精簡有關措施的申請和審查機制。
我認為政府現時的問題就像墮進視窗95的年代,未有利用大數據分析簡化整個申請程序,透過政府部門之間的數據共享,讓市民只需將自己的個人資料,例如身份證,上載至政府網頁,便能查證自己是否符合申領資格,以及可申領的金額。我希望政府可以在未來加快研究大數據的應用。
此外,預算案提及會預留80億元,改善18區的地區設施。最近沙田民政事務處向沙田區議會提交文件,表示在這項新措施下,沙田區將會在大圍村南路大圍遊樂場現址興建一座政府大樓,提供的設施包括,小型圖書館、普通科門診診所、會議室及綜合用途室、長者鄰舍中心,以及公眾停車場。這與我們一直爭取的綜合市政大樓想法非常接近。
事實上,沙田大圍的人口發展預計將會在2024年飆升至的72萬,人口不斷增加,但區內很多社區設施都已經非常殘舊、落後、不足,根本無法滿足區內居民的日常生活需要,尤其是公共街市、康體設施、圖書館、停車場等設施和服務,與區內人口增長明顯出現很大落差,所以我同新民黨一直爭取在大圍興建綜合市政大樓,並提供公共街市、圖書館、長者服務中心、幼兒園、康體設施及停車場等設施和服務,落實一地多用的政策,善用土地資源。
過去,我在2016年11月16日亦曾在立法會上提出口頭質詢,要求政府在大圍興建綜合市政大樓,當時的發展局局長,即現時的財政司司長陳茂波回覆表示,政府未有計劃在大圍興建新的綜合服務大樓,不單只我感到失望,亦有居民要我同時任發展局局長轉達他們的心聲:「大圍居民憤怒了」。幸好政府終於肯「開綠燈」,回應市民和我們的訴求,落實興建大樓,總算是遲到的春天。不過根據政府的建議,在大樓內提供的設施並不包括大圍居民很希望有和很需要有的公共街市,我希望民政事務局能夠仔細聆聽居民和地區組織的訴求,重新訂定政府大樓內提供的設施和服務,以滿足居民的實際需要。我同大圍很多居民都熱切期盼大樓可以早日落成啟用。
主席,預算案亦提及會預留20億元,在未來10年推行街市現代化計劃,全面檢視現有近百個街市的情況,改善設施,包括加快加裝冷氣、全面翻新或重建。但究竟什麼叫作「現代化街市」呢?是否單單加裝冷氣、改善消防裝置和通風設備,以及粉飾外墻等就等於一個「現代化街市」?我們希望政府能真正展現新思維。
對於政府提出上述的現代化設施,我實在感到失望,顯示政府在街市管理的思維,仍然是很古舊,欠缺創新,亦追不上時代步伐,例如電子支付系統、智能售賣機等,現時在個別街市已有提供,為商戶和市民帶來便利,這些才是真正的現代化設施,點解政府未有將這些適用於街市的創新科技納入工程範圍呢?不單只是設施問題,政府也須改善現時街市管理。正如我在2016年11月23日在立法會上動議「力促市場健康競爭,制衡領展獨大局面」的議案,希望政府正視各區社區設施和服務不足的問題,包括優化現有公共街市的設施和股務,為市民提供現時領展街市和商場以外的其他選擇,達致制衡領展獨大的目標。
主席,在醫療方面,預算案雖然對公共醫療設施增撥資源,擴建現有醫院及興建新醫院,但大部份是位於新界西,對於回應新界東居民長期面對醫療設施不足、輪候時間超長的時間,相對力度不足,未知稍後政府會否為新界東居民提供一些醫療方面的補漏措施?
另外,在環保方面,過去有不少環保回收業界人士向我反映,政府在2015年推出的10億元回收基金,申請手續繁複,限制較多,首階段成功率僅得5%,未能有效帶動本地回收產業發展,我希望政府簡化有關申請手續和降低門檻,令更多中小型回收商能夠受惠,進一步提高本地中、下游回收再造商的作業能力和效率。
至於我一直促請政府投放資源,推動本港電競及遊戲產業發展,今次司長在預算案宣布撥款1億元支援電競發展,並將數碼港商場打造成電競發展的場地,一定程度上是回應了我的訴求,希望長遠政府和業界共同加強培訓本地電競及遊戲開發人才,推動相關產業發展的同時,亦有助促進青年向上流動。
主席,公務員方面,我曾多次建議政府以團體保險方式,為公務員購買醫療保險,我亦就預算案作出書面提問,不過局長回覆表示:「為公務員購買私人醫療保險,涉及改變現行政策及龐大財政負擔,政府現階段難以考慮。」對此我感到非常失望,同時我會繼續爭取,促使政府進一步改善公務員的醫療福利,希望政府能給予公務員團隊以及退休公務員更完善的醫療保障。
主席,本人謹此陳辭,支持《2018年撥款條例草案》。
