詞庫授權資源 - CKIP Lab 中文詞知識庫小組 - 中央研究院

文章推薦指數: 80 %
投票人數:10人

中文詞向量語料[學術授權(下載版)]. 中文詞 ... 中央研究院漢語平衡語料庫(簡稱Sinica Corpus)第4.0版,為一包含一千多萬目詞的帶標記平衡語料庫。

本語料庫中每 ... 本系統整合了斷詞及線上新詞辨識技術,為唯一具有新詞辨識能力並附加詞類標記的選擇性功能之中文斷詞系統。

此一系統包含一個約拾萬詞的詞彙庫及附加詞類、詞頻、詞類頻率、雙連詞類頻率等資料。

分詞依據為此一詞彙庫及定量詞、重疊詞等構詞規律及線上辨識的新詞,並解決分詞歧義問題。

除了基本詞彙庫外,使用者可依



請為這篇文章評分?