來自創新工場大灣區人工智慧研究院的兩篇論文入選了自然語言處理領域(NLP)頂級學術會議 ACL 2020 。
這兩篇論文均聚焦中文分詞領域,是深度學習引入知識後的有益嘗試,將該領域近年來廣泛使用的各資料集上的分數全部刷至新高,在工業中也有著可觀的應用前景。
本文來自創新工場公眾號
……………………………………………………………………
創新工場兩篇論文入選ACL 2020,將中文分詞性能刷至新高
“土地,我的金箍棒在哪裡?”
“大聖,你的金箍,棒就棒在,特別配你的髮型。”
感謝神奇的中文分詞,給我們帶來了多少樂趣。豐富多變的中文行文,給人的理解造成歧義,也給AI分詞帶來挑戰。
近日,自然語言處理領域(NLP)頂級學術會議 ACL 2020 (https://acl2020.org/)正在火熱舉行。
令人振奮的是,來自創新工場大灣區人工智慧研究院的兩篇論文入選。這兩篇論文均聚焦中文分詞領域,是深度學習引入知識後的有益嘗試,將該領域近年來廣泛使用的各資料集上的分數全部刷至新高,在工業中也有著可觀的應用前景。
分詞及詞性標注是中文自然語言處理的基本任務,尤其在工業場景對分詞有非常直接的訴求,但當前沒有比較好的一體化解決方案,而且中文分詞普遍存在歧義和未登錄詞的難題。
基於此,兩篇論文各自提出了“鍵-值記憶神經網路的中文分詞模型”和“基於雙通道注意力機制的分詞及詞性標注模型”,將外部知識(資訊)創造性融入分詞及詞性標注模型,有效剔除了分詞“噪音”誤導,大幅度提升了分詞及詞性標注效果。
兩篇文章的作者有:華盛頓大學博士研究生、創新工場實習生田元賀,創新工場大灣區人工智慧研究院執行院長宋彥,創新工場科研合夥人張潼,創新工場CTO兼人工智慧工程院執行院長王詠剛等人。
ACL(The Association for ComputationalLinguistics)國際計算語言學協會是自然語言處理領域影響力最大、最具活力的國際學術組織之一,自1962年創立以來已有58年歷史,其每年夏天舉辦的年會是該領域學術頂會。
與往年不同的是,受新冠疫情影響,ACL2020全部轉為線上進行,不過這絲毫沒有減弱熱度。根據之前公佈的資料,今年大會投稿數量超過3000篇,共接收 779 篇論文,包括 571 篇長論文和 208 篇短論文,接收率為 25.2%,在全球疫情衝擊下反而是有史以來最盛大的一屆ACL會議,創新工場的技術大牛們也頂著時差連續數晚熬夜參會。
▌利用記憶神經網路,將中文分詞性能刷到歷史新高
中文分詞目的是在中文的字序列中插入分隔符號,將其切分為詞。例如,“我喜歡音樂”將被切分為“我/喜歡/音樂”(“/”表示分隔符號)。
中文語言因其特殊性,在分詞時面臨著兩個主要難點。一是歧義問題,由於中文存在大量歧義,一般的分詞工具在切分句子時可能會出錯。例如,“部分居民生活水準”,其正確的切分應為“部分/居民/生活/水準”,但存在“分居”、“民生”等歧義詞。“他從小學電腦技術”,正確的分詞是:他/從小/學/電腦技術,但也存在“小學”這種歧義詞。
二是未登錄詞問題。未登錄詞指的是不在詞表,或者是模型在訓練的過程中沒有遇見過的詞。例如經濟、醫療、科技等科學領域的專業術語或者社交媒體上的新詞,或者是人名。這類問題在跨領域分詞任務中尤其明顯。
對此,《ImprovingChinese Word Segmentation with Wordhood Memory Networks》這篇論文提出了基於鍵-值記憶神經網路的中文分詞模型。
該模型利用n元組(即一個由連續n個字組成的序列,比如“居民”是一個2元組,“生活水準”是一個4元組)提供的每個字的構詞能力,通過加(降)權重實現特定語境下的歧義消解。並通過非監督方法構建詞表,實現對特定領域的未標注文本的利用,進而提升對未登錄詞的識別。
例如,在“部分居民生活水準”這句話中,到底有多少可能成為詞的組塊?單字可成詞,如“民”;每兩個字的組合可能成詞,如“居民”;甚至四個字的組合也可能成詞,例如“居民生活”。
把這些可能成詞的組合全部找到以後,加入到該分詞模型中。通過神經網路,學習哪些詞對於最後完整表達句意的幫助更大,進而分配不同的權重。像“部分”、“居民”、“生活”、“水準”這些詞都會被突出出來,但“分居”、“民生”這些詞就會被降權處理,從而預測出正確的結果。
在“他從小學電腦技術” 這句話中,對於有歧義的部分“從小學”(有“從/小學”和“從小/學”兩種分法),該模型能夠對“從小”和“學”分配更高的權重,而對錯誤的n元組——“小學”分配較低的權重。
為了檢驗該模型的分詞效果,論文進行了嚴格的標準實驗和跨領域實驗。
實驗結果顯示,該模型在5個資料集(MSR、PKU、AS、CityU、CTB6)上的表現,均達了最好的成績(F值越高,性能越好)。(注:所選擇的五個資料集是中文分詞領域目前全世界唯一通用的標準資料集)
創新工場大灣區人工智慧研究院執行院長宋彥表示,與前人的模型進行比較發現,該模型在所有資料集上的表現均超過了之前的工作,“把中文分詞領域廣泛使用的標準資料集上的性能全部刷到了新高。”
在跨領域實驗中,論文使用網路博客資料集(CTB7)測試。實驗結果顯示,在整體F值以及未登陸詞的召回率上都有比較大提升。
▌“雙通道注意力機制”,有效剔除“噪音”誤導
第二篇論文《Joint ChineseWord Segmentation and Part-of-speech Tagging via Two-way Attentions ofAuto-analyzed Knowledge》提供了一種基於雙通道注意力機制的分詞及詞性標注模型。
中文分詞和詞性標注是兩個不同的任務。詞性標注是在已經切分好的文本中,給每一個詞標注其所屬的詞類,例如動詞、名詞、代詞、形容詞。詞性標注對後續的句子理解有重要的作用。
在詞性標注中,歧義仍然是個老大難的問題。例如,對於“他要向全班同學報告書上的內容”中,“報告書”的正確的切分和標注應為“報告_VV/書_N”。但由於“報告書”本身也是一個常見詞,一般的工具可能會將其標注為“報告書_NN”。
句法標注本身需要大量的時間和人力成本。在以往的標注工作中,使用外部自動工具獲取句法知識是主流方法。在這種情況下,如果模型不能識別並正確處理帶有雜音的句法知識,很可能會被不準確的句法知識誤導,做出錯誤的預測。
例如,在句子“他馬上功夫很好”中,“馬”和“上”應該分開(正確的標注應為“馬_NN/上_NN”)。但按照一般的句法知識,卻可能得到不準確的切分及句法關係,如“馬上”。
針對這一問題,該論文提出了一個基於雙通道注意力機制的分詞及詞性標注模型。該模型將中文分詞和詞性標注視作聯合任務,可一體化完成。模型分別對自動獲取的上下文特徵和句法知識加權,預測每個字的分詞和詞性標籤,不同的上下文特徵和句法知識在各自所屬的注意力通道內進行比較、加權,從而識別特定語境下不同上下文特徵和句法知識的貢獻。
這樣一來,那些不準確的,對模型預測貢獻小的上下文特徵和句法知識就能被識別出來,並被分配小的權重,從而避免模型被這些有噪音的資訊誤導。
即便在自動獲取的句法知識不準確的時候,該模型仍能有效識別並利用這種知識。例如,將前文有歧義、句法知識不準確的句子(“他馬上功夫很好”),輸入該雙通道注意力模型後,便得到了正確的分詞和詞性標注結果。
為了測試該模型的性能,論文在一般領域和跨領域分別進行了實驗。
一般領域實驗結果顯示,該模型在5個資料集(CTB5,CTB6,CTB7,CTB9,Universal Dependencies)的表現(F值)均超過前人的工作,也大幅度超過了斯坦福大學的 CoreNLP 工具,和伯克利大學的句法分析器。
即使是在與CTB詞性標注規範不同的UD資料集中,該模型依然能吸收不同標注帶來的知識,並使用這種知識,得到更好的效果。
而在跨領域的實驗中,和斯坦福大學的CoreNLP 工具相比,該模型也有近10個百分點的提升。
▌主動引入和分辨知識,實現中文分詞技術突破
中文分詞在中國科研領域已經有幾十年的歷史。最初的中文分詞是基於詞典構建,詞典的好壞會直接影響到最後分析的效果。如果某個新詞在詞典裡沒有,那麼模型是死活都分不出來的。
這種方式的局限性還在於,詞典和分詞兩件事情中間始終有一條鴻溝,儘管詞典可以編撰得非常全面,但在處理分詞的時候,因為每一句話都有上下文語境,往往會產生多種不同的切分方法,從而無法有效地在當前語境下對分詞結構進行恰當的指導。
從2003年開始,分詞方法出現了新的突破。研究人員提出了打標籤的方式,通過給每一個字打詞首、詞尾、詞中的標籤,不再需要構建詞典,大幅度提升了未登錄詞的召回效果。
到了2014年左右,深度學習和神經網路開始被廣泛應用到中文分詞中,打標籤的模型從之前的淺層學習變成了深度學習,但演算法本質沒有發生變化,所以提升作用並不太大。
近兩年,學界開始研究怎麼在打標籤的過程中加入外部知識和資訊。創新工場的這兩篇文章就是沿著這個路徑,用記憶神經網路的方式記錄對分詞結果有影響的 n元組,並引入對詞性標注有影響的句法知識,將分詞結果和自動獲得的知識銜接起來,既發揮了神經網路的優勢,也把知識的優勢用上,實現了分詞技術上小而有效的改進和突破。
宋彥表示,“從技術創新的角度,我們的貢獻主要有兩點。一是在現有技術的基礎上,建立了一個一體化的模型框架,使用非監督方法構建詞表,並把知識(資訊)融入進來,使用更高層次的句法知識,來幫助詞性標注,起到'他山之石,可以攻玉’的效果。”
“二是主動吸收和分辨不同的外部知識(資訊)。通過鍵-值記憶神經網路和雙通道注意力機制,進行動態權重的分配,能夠有效分辨知識,區分哪些是有效的,哪些是無效的。雖然這些知識是自動獲取的、不準確的,但‘三個臭皮匠,頂個諸葛亮’,經過有效利用,總能湊出一些有用的資訊。如何實現模型的主動吸收和分辨,就變得更加重要。”
據瞭解,今年的ACL大會,在分詞領域一共收錄了18篇論文,創新工場人工智慧工程院同時有2篇入選,也表現出ACL官方對這一貢獻的認可。
▌具備跨領域分詞能力,提升工業應用效率
中文分詞和詞性標注是最底層的應用,對於接下來的應用和任務處理非常重要。例如對於文本分類、情感分析,文本摘要、機器翻譯等,分詞都是不可或缺的基本“元件”。
宋彥表示,做此項研究的目的是主要為了拓展其工業場景的應用,正確的分詞能夠平衡公司應用開發的效率和性能,同時方便人工干預及(預)後處理。
這也是創新工場人工智慧工程院的努力方向之一。工程院成立於2016年9月,宗旨是銜接科技創新和行業賦能,做嫁接科研和產業應用的橋樑,為行業改造業務流程、提升業務效率。
工程院下設北京總部、南京研究院和大灣區研究院。大灣區研究院再下設資訊感知和理解實驗室,專注于對自然語言處理(NLP)領域的研究。執行院長宋彥本人也有超過15年的NLP領域的科研經驗。
“在工業場景使用的時候,跨領域的模型能力是一個非常直接的訴求。”宋彥表示,在某個領域的訓練模型,大概率也需要應用到其他領域。
“如何在新領域缺少資料,或者新領域只有少量未標注資料的情況下,實現模型的冷開機,依然是項巨大的挑戰。如果能利用外部知識,提高模型性能,就能有效地召回很多在訓練集中沒有出現過的新詞。”
例如搜尋引擎的廣告系統,最初也是通過組詞匹配的方式,在某個特定領域訓練其分詞模型,但在進入一個新的領域時,例如從新聞領域進入醫療領域或體育領域,效果往往會大打折扣,甚至頻頻出錯。
而使用跨領域特性後,廣告系統在進入新領域時,便無需額外的資料,就可以對它進行比較準確的分詞和標注,從而有效匹配廣告和客戶,大大提升系統運行的效率和穩定性。
目前,這兩篇論文的工具都已經開源,在下面兩個連結中,可以找到對應的所有代碼和模型,各位朋友可按需自取:
分詞工具:https://github.com/SVAIGBA/WMSeg
分詞及詞性標注工具:https://github.com/SVAIGBA/TwASP
同時也有8部Youtube影片,追蹤數超過1萬的網紅鍾日欣,也在其Youtube影片中提到,我是JC老師 電腦相關課程授課超過6000小時的一位AutoCAD課程講師 由於實在太多同學向JC老師反映,希望可以有線上課程學習,所以就決定錄製一系列的AutoCAD線上影片教學 而且不加密、不設限、不販售,就是純分享,希望可以幫助到有需要的朋友們 如果這部AutoCAD教學影片對你有幫助的話,請...
分隔符號 在 就是教不落 - 阿湯 Facebook 八卦
有些系統匯出的報表或檔案會用分隔符號來區分內容,或者你想要更快的 KEY IN 資料後再到 Excel 製作表格,那麼就可以透過 Excel 的分隔符號轉換功能來做最方便。
喜歡請到 YouTube 訂閱並開啟小鈴噹,第一時間就可以收到最新的教學影片哦。
https://www.youtube.com/watch?v=rpwoFySxrBs
分隔符號 在 會計人的Excel小教室 Facebook 八卦
Power BI中的Power Query是專門進行大數據資料處理的工具。本文以證交所的證券交易統計表為例,介紹依分隔符號分割資料行、複製資料行、擷取資料長度等操作。
分隔符號 在 鍾日欣 Youtube 的評價
我是JC老師
電腦相關課程授課超過6000小時的一位AutoCAD課程講師
由於實在太多同學向JC老師反映,希望可以有線上課程學習,所以就決定錄製一系列的AutoCAD線上影片教學
而且不加密、不設限、不販售,就是純分享,希望可以幫助到有需要的朋友們
如果這部AutoCAD教學影片對你有幫助的話,請幫我按個讚,給我點鼓勵,也多分享給需要的朋友們喔~
---------------------------------------------------------------------------------------------------------
● 「主要單位」頁籤
◆ 設定主要標註單位的格式和精確度,以及設定標註文字的字首和字尾。
◆ 線性標註:設定線性標註的格式與精確度。
★ 單位格式:為除「角度」之外的所有標註類型設定目前單位格式。(DIMLUNIT 系統變數)。堆疊分數中數字的相對大小由系統變數 DIMTFAC 決定 (與公差值使用該系統變數的方式相同)。
★ 精確度:顯示與設定標註文字中的小數位數。(DIMDEC 系統變數)
★ 分數格式:設定分數的格式。(DIMFRAC 系統變數)
★ 小數分隔符號:設定十進位格式的分隔符號。(DIMDSEP 系統變數)
★ 捨入:除了「角度」之外,為所有標註類型的標註測量設定最接近捨入值。(系統變數 DIMRND)。如果輸入值 0.25,則會將所有距離捨入到最接近 0.25 個單位的值。如果輸入值 1.0,則會將所有標註距離捨入到最接近的整數。請注意,小數點後的位數取決於「精確度」設定。
★ 字首:在標註文字中指定的字首。(DIMPOST 系統變數)
★ 字尾:在標註文字中指定的字尾。(DIMPOST 系統變數)
◆ 度量比例:定義線性比例選項。主要套用到舊式圖面。
★ 比例係數:設定線性標註測量的比例係數。建議您不要變更預設值 1.00。(DIMLFAC 系統變數)。例如,如果輸入 2, 則 1 英吋的線會顯示為兩英吋。該值不套用到角度標註,也不套用到捨入值或正負公差值。
★ 僅套用到配置標註:僅將測量值比例係數套用到在配置視埠中建立的標註。該設定應該處於不勾選狀態,使用非關聯式標註的情況除外。(DIMLFAC 系統變數)
◆ 零抑制:控制前導零與結尾零、以及零英呎與零英吋的抑制。(DIMZIN 系統變數)
★ 前導:抑制所有十進位標註中的前導零。例如,0.5000 會變為 .5000。選取前導可使用次要單位顯示小於一個單位的標註距離。
★ 次要單位係數:設定某單位的次要單位數字。它用於在距離小於一個單位時使用次要單位計算標註距離。例如,如果在字尾為 m 時輸入 100,則次要單位字尾將以 cm 顯示。
★ 次要單位字尾:在標註值次要單位後包括字尾。您可以輸入文字或使用控制碼來顯示特殊符號。例如,輸入 cm 可讓 .96m 顯示為 96cm。
★ 結尾:抑制所有十進位標註的結尾零。例如,12.5000 變成 12.5,30.0000 變成 30。
★ 0 英呎:在距離小於 1 英呎時抑制英呎與英吋標註的英呎部分。例如,0'-6 1/2" 變成 6 1/2"。
★ 0 英吋:在距離是整數英呎時抑制英呎與英吋標註的英吋部分。例如,1'-0" 變成 1'。
◆ 角度標註:顯示與設定角度標註的目前角度格式。
★ 單位格式:設定角度單位格式。(DIMAUNIT 系統變數)
★ 精確度:設定角度標註的小數位數。(系統變數 DIMADEC)
★ 零抑制:控制前導零和結尾零的抑制。(DIMAZIN 系統變數)
▲ 前導:抑制角度十進位標註中的前導零。例如,0.5000 變成 .5000。
▲ 結尾:抑制角度十進位標註中的結尾零。例如,12.5000 變成 12.5,30.0000 變成 30。
● 「對照單位」頁籤
◆ 指定標註測量結果中對照單位的顯示,並設定對照單位的格式與精確度。
◆ 顯示對照單位:將替用測量單位加入到標註文字中。將系統變數 DIMALT 設定為 1。
◆ 對照單位乘法器:指定用作主要單位和對照單位之間的轉換係數的乘法器。例如,若要將英吋轉換為公釐,則輸入 25.4。此值不會影響角度標註,而且不會套用到捨入值或正負公差值。(系統變數 DIMALTF)
◆ 距離捨入至:除了「角度」之外,設定所有標註類型的對照單位捨入規則。如果輸入值 0.25,則所有的對照單位都被捨入到最接近 0.25 個單位的數值。如果輸入值 1.0,則所有標註測量值會被捨入到最接近的整數。小數點後的位數取決於「精確度」設定。(系統變數 DIMALTRND)
---------------------------------------------------------------------------------------------------------
AutoCAD線上影片教學範例下載:https://goo.gl/DhVTau
AutoCAD2D常用快速鍵清單整理:http://goo.gl/SjNIxz
AutoCAD2015線上影片教學頻道:https://goo.gl/Q5aCf5
JC老師個人網站:http://jc-d.net/
JC老師個人FB:https://www.facebook.com/ericjc.tw

分隔符號 在 鍾日欣 Youtube 的評價
我是JC老師
電腦相關課程授課超過6000小時的一位AutoCAD課程講師
由於實在太多同學向JC老師反映,希望可以有線上課程學習,所以就決定錄製一系列的AutoCAD線上影片教學
而且不加密、不設限、不販售,就是純分享,希望可以幫助到有需要的朋友們
如果這部AutoCAD教學影片對你有幫助的話,請幫我按個讚,給我點鼓勵,也多分享給需要的朋友們喔~
---------------------------------------------------------------------------------------------------------
● 「公差」頁籤
◆ 指定標註文字公差的顯示和格式。
◆ 公差格式:控制公差格式。
★ 方式:設定公差的計算方式。(DIMTOL 系統變數)
▲ 無:不加入公差。系統變數 DIMTOL 設為 0。
▲ 對稱:加入正/負公差表示式,將單個變動值套用到標註測量值。在標註後顯示一個正號或負號。請在「上限值」中輸入公差值。系統變數 DIMTOL 設為 1。系統變數 DIMLIM 設為 0。
▲ 偏差:加入正/負公差表示式。將不同的正負變動值套用到標註測量值。在「上限值」中輸入的公差值的前面放一個加號 (+);在「下限值」中輸入的公差值的前面放一個減號 (-)。系統變數 DIMTOL 設為 1。系統變數 DIMLIM 設為 0。
▲ 上下限:建立上下限標註。顯示最大值和最小值,一個在另一個上方。最大值是標註值加上「上限值」內輸入的值。最小值是標註值減去「下限值」內輸入的值。系統變數 DIMTOL 設為 0。系統變數 DIMLIM 設為 1。
▲ 基本:建立基本標註,該標註可在標註的最大實際範圍周圍顯示一個方塊。文字與方塊之間的距離以負值儲存在系統變數 DIMGAP 中。
★ 精確度:設定小數位數。(DIMTDEC 系統變數)
★ 上限值:設定最大值或上限公差值。如果選取「方式」中的「對稱」,此值將用於公差。(DIMTP 系統變數)
★ 下限值:設定最小值或下限公差值。(DIMTM 系統變數)
★ 調整高度比例:設定公差文字的目前高度。公差高度與主標註文字高度的比率被計算並儲存在系統變數 DIMTFAC 中。
★ 垂直位置:控制對稱與偏差公差的文字對正方式。
◆ 公差對齊:堆疊時控制上公差值與下公差值的對齊方式
★ 對齊小數分隔符號:值依小數分隔符號堆疊。
★ 對齊運算符號:值依運算符號堆疊。
◆ 零抑制:控制前導零與結尾零、以及零英呎與零英吋的抑制。(DIMTZIN 系統變數)
★ 前導:抑制所有十進位標註中的前導零。例如,0.5000 變成 .5000。
★ 結尾:抑制所有十進位標註的結尾零。例如,12.5000 變成 12.5,30.0000 變成 30。
★ 0 英呎:在距離小於 1 英呎時抑制英呎與英吋標註的英呎部分。例如,0'-6 1/2" 變成 6 1/2"。
★ 0 英吋:在距離是整數英呎時抑制英呎與英吋標註的英吋部分。例如,1'-0" 變成 1'。
◆ 對照單位公差:格式化替用公差單位。
★ 精確度:顯示與設定小數位數。(DIMALTTD 系統變數)
★ 零抑制:控制前導零與結尾零、以及零英呎與零英吋的抑制。(DIMALTTZ 系統變數)
▲ 前導:抑制所有十進位標註中的前導零。例如,0.5000 變成 .5000。
▲ 結尾:抑制所有十進位標註的結尾零。例如,12.5000 變成 12.5,30.0000 變成 30。
▲ 0 英呎:在距離小於 1 英呎時抑制英呎與英吋標註的英呎部分。例如,0'-6 1/2" 變成 6 1/2"。
▲ 0 英吋:在距離是整數英呎時抑制英呎與英吋標註的英吋部分。例如,1'-0" 變成 1'。
---------------------------------------------------------------------------------------------------------
AutoCAD線上影片教學範例下載:https://goo.gl/DhVTau
AutoCAD2D常用快速鍵清單整理:http://goo.gl/SjNIxz
AutoCAD2015線上影片教學頻道:https://goo.gl/Q5aCf5
JC老師個人網站:http://jc-d.net/
JC老師個人FB:https://www.facebook.com/ericjc.tw

分隔符號 在 鍾日欣 Youtube 的評價
我是JC老師
電腦相關課程授課超過6000小時的一位 Revit 課程講師
由於實在太多同學向JC老師反映,希望可以有線上課程學習,所以就決定錄製一系列的 Revit 線上影片教學
而且不加密、不設限、不販售,就是純分享,希望可以幫助到有需要的朋友們
如果這部 3ds Max 教學影片對你有幫助的話,請幫我按個讚,給我點鼓勵,也多分享給需要的朋友們喔~
---------------------------------------------------------------------------------------------------------
匯出明細表
● 開啟明細表視圖。
● 按一下「檔案」功能表 /「匯出」 / 「報告」 /「明細表」
● 在「匯出明細表」對話方塊中,指定明細表的名稱和目錄,然後按一下「儲存」。
● 將顯示「匯出明細表」對話方塊。
● 按一下「確定」。
● Revit Architecture 會將檔案另存成分隔符號文字,這種格式可以使用多種試算表程式 (例如 Microsoft® Excel 或 Lotus® 123) 開啟。
---------------------------------------------------------------------------------------------------------
Revit 2016 線上教學影片目錄:http://bit.ly/2vR6fgW
Revit 2016 線上教學影片範例下載:http://bit.ly/2vR0b7X
3ds Max 2015 線上教學影片目錄:http://bitly.com/2dUGqn3
AutoCAD 2015 2D 線上教學影片目錄:http://bitly.com/2dUGm6Y
TQC AutoCAD 2008 2D 線上教學影片目錄:http://bitly.com/2dUGQtB
JC-Design網站:http://jc-d.net/
JC-Design粉絲團:https://www.facebook.com/jcdesigntw/
JC-Design LINE ID:@umd7274k
JC電子信箱:[email protected]

分隔符號 在 快速將分隔符號的文字檔案變成Excel 表格EP 11 - YouTube 的八卦

有些系統匯出的報表或檔案會用分隔符號來區分內容,或者你想要更快的KEY IN 資料後再到Excel 製作表格,那麼 ... ... <看更多>
分隔符號 在 Re: [算表] Excel分隔符號問題- 看板Office - 批踢踢實業坊 的八卦
推文的方法其實我也看不太懂 哈哈 (全部取代能這樣用?)
要我來改的話 有點鎖碎 其中一個方法是
excel中資料前後各加一欄資料(比如一個空格之類)
是存成csv檔之後
才把,用全部取代改成","
前後多餘的碼再取代為無~
其他方法就是excel中找個地方
=A1&CHAR(10)
這樣到記事本"看起來"會對
但原因是換行符號顯示不出來 其實還是在
有幾個char(N)在格子中 都會在csv中產生 " 引號
9(tab).10.13.34(").44(,).
大概可以猜出是因為筆記本用來分隔欄位的符號無法分別這些資料
所以會用"包住欄位資料來分別。
※ 引述《nomo720905 (流暢)》之銘言:
: 標題: [算表] Excel分隔符號問題
: 時間: Sat Feb 14 23:24:29 2009
:
: 軟體:OFFICE
:
: 版本:2003
:
: 最近再弄sim卡,把A手機的電話簿複製至B手機!
: A手機電話簿儲存在手機內,用手機軟體只能輸出為xls檔,
: 而利用sim卡讀取程式複製至B手機,只能讀取TXT檔,
: 所以怎麼把:
:
: A B C (儲存格)
: 1 Service 800
:
: 怎麼輸出txt為:
: "1","Service","800"
:
: 謝謝!
:
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc)
: ◆ From: 59.117.116.220
: 推 KAMESANMA:另存為CSV(逗號分隔)(*.csv) 再直接把副檔名改成txt就OK 02/14 23:32
: → nomo720905:沒辦法啊,必須有"號 02/14 23:58
: 推 we81096:你可以先將ABC儲存格改成"1"、"Service"、"800" 02/15 08:26
: → we81096:再照一樓方式儲存 02/15 08:26
: → we81096:最後如果"←有多餘就利用取代修改 02/15 08:27
: → nomo720905:問題就是,有1百多筆資料,要一個一個點起來修改成""嗎 02/15 11:54
: → we81096:不是有全部取代嗎0_0? 02/15 13:13
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 218.164.51.218
... <看更多>