推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

GBT 26235-2010 信息技术 信息处理用蒙古文词语标记

更新时间:2024-03-26 21:28:18 大小:248K 上传用户:xuzhen1查看TA发布的资源 标签:信息技术 下载积分:2分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

范围 本标准规定了信息处理用蒙古文词语标记,只包括某种语文现象或单位的标记符号。 本标准适用于蒙古文的各种语料库、词汇集~词典、语文知识库等。 2术语和定义 下列术语和定义适用于本标准。 2.1 蒙古文信息处理Mongolian information processing 用计算机对蒙古文形、音、义等信息进行输入、排序、存储、输出、统计、提取等。 2.2 标记单位tagging unit 蒙古文信息处理中使用的词汇、词法、正字法及其他单位,如单词、复合词、固定词、习用语、成语、缩 略语、构形附加成分、连接元音、字母、数字、标点符号等。 2.3 词类word class 词的语法分类,根据词法形态、句法功能、语义特征划分出来的类。 2.4 不确定词ambiguous word 无法确定词性的词或词素,包括: a) 无法确定词性的同形兼类词(如没有上下文环境的形式); b)不能单独使用的复合词成分,如fiy(ily olan),tomsi(tog—a tomsi figey),say(gajar say figey), xu(XU luubang); c)形容词最高级形式:ub(ub ulagan),xab(xab xar—a)等。 2.5 复合词compound word 由两个实词(有时也包括辅助意义的词)组成,语法和词汇上都构成一个单位的固定短语。 2.6 固定词fixed word 由一个实词和一个虚词组成,连用成型且未转义的固定短语。 2.7 习用语habitual usage 由一个转义形容词和一个实词组成,主谓结构且表达一个词汇意义的固定短语。 2.8 成语idiom 由3个或3个以上词组成,充当一个句子成分的固定短语。 2.9 缩略语abbreviation 专有名词或常用语的简略形式。 】GB/T 26235--2010 2.10 构形附加成分morphological forms 只增加语法意义的词法形态。 2.11 连接元音connective vowel 辅音结尾的词干后,加接以“S,G,N,M,R,L,Y”辅音开头的附加成分时,词干后增加的元音或 音节。

部分文件列表

文件名 大小
GBT_26235-2010_信息技术_信息处理用蒙古文词语标记.pdf 248K

【关注B站账户领20积分】

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载