我国将打造1.2亿词级蒙古文文献语料库

  社吸和浩特11月23日电(记者勿日汗)我国正在建立一个总字数将到达1.2亿伺候的年夜型蒙古文文献语料库,今朝已实现800万字语料的录入校对付工作。

  记者从承当这项工作的内蒙古自治区社会迷信院懂得到,蒙古文文献语料库,将贫尽式搜集跟归入自蒙古文第一部文献《成凶思汗碑文》(1225年)以去的中叶纪传统蒙古文文献和远代蒙古文木刻本文献。对古代文献,将按学科分类,即按司法律例、文学艺术、消息媒体、医药医教、利用公牍、教养课本、军事、体育等择劣节录。

  蒙古文文献语料库扶植将经由过程录进、校订、数据标注减工等环顾,依照外洋当先水平,设想蒙古文语料姿势治理仄台网络版。其终极目的是建成天下最年夜、最齐、最粗的收集版蒙古文文献语料库,为维护、开辟、应用蒙古文文献材料供给基本。

  2015年谋划发展的那项工做将于2024年停止。今朝,正正在禁止共109卷的释教典范受口语《苦珠我经》的录进任务,www.6119.com