這個有意思,中華官場空話訓練還是不錯的,韓宋互有高下!
昨天的「2020總統大選政見發表會」大家都收看了嗎?
在接收資訊的時候,是否有時候會覺得「好像對方講了很多,但我總有一種空虛的感覺」呢?
這可能是因為「對方說的話,資訊含量偏低」造成的哦!
資訊含量的算法大意是「你講的話有料的部份」除以「你講的全部量」。(Content_Words / All_Words)
透過 Articut 斷詞系統的 POS 標記,您也可以隨手計算出手邊的資料,是否「資訊含量偏低」哦!
ps. 大家認為營養價值不高的娛樂新聞,資訊含量也大約在 0.64 左右。大概可以理解成「每十個字,就有 6.4 個字是有意義的字眼,而不是佔版面用冗詞贅字哦!」
#NLP #POS #文本分析 #InformationDensity #中文斷詞 #Articut
同時也有10000部Youtube影片,追蹤數超過62萬的網紅Bryan Wee,也在其Youtube影片中提到,...
articut 在 Icu醫生陳志金 Facebook 八卦
剛剛在大學同學的群組有人貼出演講資訊。
我熊熊看成:「數據大便」@@
然後龍貓柚子的貼文
有網友回應:「數大便是美」
我拿給太太看:「你知道這句的意思嗎?」
太太:「為什麼要‘數’(ㄕㄨˇ)大便?」
#中文斷詞很難
#人工智慧也有瓶頸
Articut 這個會斷嗎?