<rp id="s5t7n"></rp>
<source id="s5t7n"></source>

      1. <source id="s5t7n"></source>

        English | 中文

        English | 中文

        預告 | 重磅推出第六期“學術工作坊”
        作者:高而杰
        2019年06月18日

        講座題目:

        1. 胡韌奮:BERT模型與歷時詞義研究

        2. 王敬:面向漢語二語學習的句子偏誤自動糾正研究

        3. 邱媛媛:面向漢語語法偏誤自動識別的數據集構建與評估

        講座時間:2019年6月19日(周三)14:00-17:00

        講座地點:北京語言大學綜合樓二層清常廳

        講座簡介:

        1. 詞向量方法被廣泛地應用于歷時詞義分析,但是現有的靜態詞向量方法僅能為每個時期的詞語生成一個唯一的向量,無法對不同詞義進行表征。為了解決這個問題,我們將基于BERT語言模型的動態詞向量引入歷時詞義變化研究,提出了一個細粒度詞義表征和追蹤模型,對1810年-2009年共計200年間的英文詞義演變進程進行了系統追蹤和分析。與前人工作相比,該方法不僅可以回答詞義演變中的what和when問題,還可以深入解釋how的問題。此外,研究顯示,詞義演變與生物進化類似,存在“義項競爭”、“義項合作”等有趣的機制。

        2. 近年來,計算機輔助漢語二語教學受到越來越多的重視,漢語句子偏誤自動糾正是其中一個重要的研究任務?,F有的很多研究工作聚焦在神經網絡模型構建上,而很少關注漢語語言特征及漢語偏誤本身的規律,因此本報告將從漢語中介語語料分析出發,討論漢語句子中字層面、詞層面、句層面偏誤的自動糾正問題。

        3. 漢語語法偏誤自動識別作為一項新興的 NLP 任務,在數據集和算法模型的構建上都存在不少挑戰。從數據集角度看,現有的漢語偏誤語料庫構建標準不統一,標注體系普遍較為復雜,不利于數據集的擴充,此外,語料涉及的話題相對封閉,其出發點往往是為漢語教學服務,并非面向計算機自動識別和處理偏誤。本次報告以漢語語法偏誤數據集構建為核心,探討語法偏誤范疇、偏誤文本特征以及標注方法和數據集評估等問題。


        主講人:胡韌奮

        胡韌奮,博士,北京師范大學講師,研究方向為計算語言學、計算機輔助語言教學,擔任ACL、COLING、CONLL等國際會議審稿人,中文信息學會青工委委員。在ACL、EMNLP、COLING、《北京大學學報》、《語言文字應用》、《中文信息學報》等國內外高水平會議期刊上發表論文二十余篇。

        胡韌奮 博士.jpg


        主講人:王敬

        王敬,北京師范大學中文信息處理研究所博士生,主要研究方向為自然語言處理,具體研究句子可接受度、面向漢語學習的偏誤自動糾正、語言模型等。

        王敬_meitu_1.jpg


        主講人:邱媛媛

        邱媛媛,北京師范大學中文信息處理研究所碩士生,曾獲得“NLP-NABD 2018” 最佳英文論文獎。

        邱媛媛_meitu_2.jpg


        一本无码字幕高清在线-更新最快的韩国特级黄大片免费播放国产影院