综述类

  • 藏文信息处理研究进展

    高定国;

    藏文有着悠久的历史,是藏族人民交流思想的工具。1997年,藏文编码字符集国际、国家标准的制定作为藏文信息处理的开始,至今正好20年。这20年中藏文信息处理起步、发展,取得了较好的成绩。本文简要回顾了藏文信息处理中字、词、句、段、篇的特点、处理方法及取得的典型成果,也回顾了藏语资源建设和应用研究取得的成果,并对藏文信息处理未来的发展方向进行展望。希望能为迈入藏文信息处理的初学者展示一个藏文信息处理发展的脉络,提供一个参考。

    2018年01期 v.34;No.119 1-11页 [查看摘要][在线阅读][下载 250K]
  • 傣文信息技术研究进展

    殷建民;

    本文介绍了20世纪90年代以来傣文(含德宏傣文和西双版纳傣文)信息处理技术的发展,涉及傣文编码字符集、傣文字型、傣文键盘布局等基础标准的制订和傣文电子出版系统、傣文网站、傣文移动客户端、傣文识别系统、傣文分词系统、傣文语料库、傣文电子词典、傣文机器翻译等应用系统的开发。

    2018年01期 v.34;No.119 12-17+26页 [查看摘要][在线阅读][下载 156K]
  • 壮、蒙古、维、哈、柯、朝语信息处理研究进展

    刘连芳;海银花;那顺乌日图;黄家裕;吐尔根·依布拉音;玄龙云;

    少数民族语言文字处理是中国语言文字信息处理的重要组成部分。自20世纪80年代以来,少数民族语言文字处理在各民族科研、产业工作者的共同努力下,在操作系统、输入输出、编辑排版、标准化、语言资源建设、机器翻译、软件平台、人才培养等各个方面取得了长足的进展。本文综述壮、蒙古、维吾尔、哈萨克、柯尔克孜、朝鲜6个少数民族的语言文字信息处理历史、现状及存在问题,并对其未来发展方向进行展望。

    2018年01期 v.34;No.119 18-26页 [查看摘要][在线阅读][下载 165K]
  • 东南亚语言及信息处理研究进展

    黄家裕;刘连芳;邓姿娴;温家凯;

    本文首先介绍各东南亚语言的特点,并重点介绍越南语与中国壮语的关联以及它们在信息处理上的相近性;然后介绍国内外越南语信息处理的工作现状,并分析汉越机器翻译的发展趋势;最后展望东南亚语言及壮语信息处理的下一步工作。

    2018年01期 v.34;No.119 27-31页 [查看摘要][在线阅读][下载 992K]
  • 浅谈蒙古文网站现状及发展趋势

    德格吉日胡;木仁;韩百岁;明慧;

    本文主要介绍蒙古文网站概况、带来的影响和利用现状等方面。结合已有研究视角、方法及关注焦点,文中提出网站建设当中存在的问题和解决思路,并展望蒙古文网站的发展趋势。

    2018年01期 v.34;No.119 32-38页 [查看摘要][在线阅读][下载 1767K]
  • 藏文文本聚类及其相关技术综述

    李玖一;于洪志;徐涛;

    藏文作为一门古老的语言有其独有的规则和特点。随着网络的普及,互联网用户中的藏族同胞迅速增加,网络上的藏文文本也越来越多。利用藏文文本聚类来提供更高效的管理和更良好的用户体验成为近年的研究热点。本文首先介绍了藏文文本聚类的应用背景和相关概念,然后介绍了藏文文本特点和藏文文本聚类的相关技术,讨论了藏文文本建模和聚类算法,最后对藏文聚类发展和应用进行了总结和展望。

    2018年01期 v.34;No.119 39-45页 [查看摘要][在线阅读][下载 311K]
  • 知识图谱概念获取研究进展

    边慧珍;哈斯;

    随着Web技术的不断更新与发展,知识图谱以其强大的语义处理能力与开放互联能力吸引了各行各业的关注。各行各业都在纷纷构建所属领域的知识图谱,如何从不同数据源抽取构建知识图谱所需概念,成为知识图谱构建的关键技术,概念抽取得越完整,所构建的知识图谱越全面,利用价值越高。本文对不同数据源抽取知识图谱概念进行阐述说明,以期引导学者选择合理的方法进行学术分析,提升知识图谱应用水平。

    2018年01期 v.34;No.119 46-50页 [查看摘要][在线阅读][下载 146K]

实验研究类

  • 基于规范字符集的多语种统一字符编码方案

    付勇;郭公;

    本研究提出了一种锡伯文、满文、传统蒙古文和托忒文的多语种统一字符编码方案。该方案的编码字符集是对应文种的规范字符,且采用统一的拉丁字母顺序排列,更适合国际化的发展趋势。采用这一方案的计算机处理系统与基于名义字符编码的系统相比,就锡伯文、满文而言,完全不需要自由变体选择符,对传统蒙古文等其他语种也能极大的减少自由变体选择符的使用,更符合一般用户的使用习惯,方便文字信息的查询、搜索和处理。

    2018年01期 v.34;No.119 51-56页 [查看摘要][在线阅读][下载 662K]
  • 朝鲜语特殊短语结构的语言特征分析及自动提取

    毕玉德;扈毅;安帅飞;

    朝鲜语中存在大量特殊短语结构,因此在朝汉翻译中,如何准确翻译这些特殊短语显得尤为重要,此举有利于提高机器翻译的精度与效率。本文基于韩国"世宗计划"标注语料库,通过对特殊短语结构进行语言特征分析,构建规则库,以迭代方式提取特殊短语结构及其分布,并以中心词为""的特殊短语为例,进行自动提取实验,取得满意的效果。

    2018年01期 v.34;No.119 57-62页 [查看摘要][在线阅读][下载 3680K]
  • 蒙古文复杂文本布局引擎的标准符合性测试

    呼斯勒;白双成;确精扎布;

    以蒙古文编码国家标准的研制及其系统实现方面的工作为基础,针对蒙古文复杂文本布局引擎(CTL Engine)及其OpenType字库的系统结构,提出蒙古文复杂文本布局引擎的标准符合性测试(Conformance Test for Standards)方案,定义蒙古文复杂文本布局引擎的测试点及其测试实例,并以关键软件系统为依托测试和分析Uniscribe和HarfBuzz等支持蒙古文的复杂文本布局引擎。

    2018年01期 v.34;No.119 63-67页 [查看摘要][在线阅读][下载 452K]
  • 蒙古语词向量评测研究

    乌云塔那;王斯日古楞;

    词向量具有良好的语义特性,可用于改善和简化许多自然语言信息处理应用。本研究利用CBOW和Skip-gram两种模型架构在不同数据和不同维度下训练蒙古语词向量,然后结合蒙古语特征设计一个语义语法综合测试集,并在此测试集上用语义和语法相似度来评测词向量质量。研究结果表明,蒙古语语义和语法相似性任务上,Skip-gram模型优于CBOW模型,Skip-gram模型的窗口大小为5的情况下,词向量质量最好,且随着词向量维度或训练数据的增大,词向量质量有明显的提高。

    2018年01期 v.34;No.119 68-71页 [查看摘要][在线阅读][下载 302K]
  • 蒙古语媒体资产编目问题研究

    娜仁图雅;白双成;

    通过调查汇总内蒙古广播电视台蒙古语媒体资产编目现状,分析了现行的蒙古语媒体资产通过汉译,用汉文编目方法中存在的问题,提出直接用蒙古文编目的可能性和需要重点解决的问题。蒙古文标准编码环境逐步成熟,尤其Windows平台上的编辑输入和显示问题容易解决,重点在于蒙古文字符编码与字形之间的多对多复杂转换关系及录入不规范等众多原因,容易导致编目文本存在严重的拼写多样化现象和字形拼写错误。为此本文提出使用智能输入法避免错误录入、使用智能校对纠错、使用智能搜索模糊匹配等多手段结合的解决方案。随着这些技术的成熟,相信蒙古文媒体资产编目问题一定能得到解决并投入实际应用。此项工作的研究对其他蒙古语文资源建设及大数据建设和应用具有广泛的参考价值。

    2018年01期 v.34;No.119 72-77页 [查看摘要][在线阅读][下载 2787K]
  • 基于谱减法的藏语语音减噪研究

    都格草;才让卓玛;南措吉;

    语音信息的采集过程中难免会有各种噪声的干扰,噪声降低了语音的可懂度及清晰度,甚至严重影响语音处理的准确性和可靠性。谱减法是语音减噪中最常用的方法,该方法基于人的感觉特性,对语音短时幅度谱进行估计,适用于受加性噪声污染的语音。本文通过统计分析谱减法的增益补偿因子和过减因子参数,研究基于谱减法的藏语语音减噪处理,并取得较为理想的实验结果。

    2018年01期 v.34;No.119 78-82页 [查看摘要][在线阅读][下载 811K]

  • 刘连芳;

    <正>语言文字是表达思维的工具,没有语言文字,人类无法把文明成果流传下来;语言文字是最重要的交流工具,是共享个人智能并将其转化为社会智慧的载体和渠道。用计算机对语言文字的音、形、义等信息进行处理和加工,即自然语言信息处理。这是一门与计算机科学、语言学、数学、信息学、声学等多种学科相关联的综合性学科。中文信息处理是自然语言信息处理的一个分支。

    2018年01期 v.34;No.119 4+84页 [查看摘要][在线阅读][下载 2362K]
  • 投稿指南

    <正>1来稿要求1.1稿件要素稿件内容必须包括:题目、作者姓名、作者所在单位、所在省份和城市、邮政编码、中文摘要、关键词、英文题目、作者英文姓名、作者英文单位、英文摘要、英文关键词、正文、致谢(非必选)、参考文献等内容。1.2题目应以简明、确切的语言反映稿件的重要思想和内容,一般不超过20字。1.3作者与单位多位作者姓名用逗号隔开。所有作者均须注明所在单位全称、省份城市及邮编。

    2018年01期 v.34;No.119 56页 [查看摘要][在线阅读][下载 60K]
  • 下载本期数据