内容摘要:本文在潜在歧义理论的基础上,对汉语中的“n+n+n”结构做较全面的研究,以期找出这种结构产生句法功能歧义原因和消解策略。
关键词:歧义短语;实例;真歧义;语义特征;冯志伟;汉语信息处理
作者简介:
摘 要:
本文在潜在歧义理论的基础上,分析了三项名词同类词短语中三个名词的语法、语义、语用特性,对汉语中的“n+n+n”结构做了比较全面的研究,目的在于找出这种结构产生句法功能歧义的原因和消解这种歧义的策略。
关 键 词:
格式真歧义短语 实例真歧义短语 语义特性
相关信息:
本文得到北京师范大学青年教师社会科学研究基金项目资助。
〇、引 言
歧义问题一直是计算语言学及语言学本体中的研究热点,国外计算语言学界对歧义结构的研究重点主要在于机器自动消解结构歧义的理论和方法。在搜索策略的安排上,国外的方法大概经历了从不可回溯到可回溯再到确定性的不可回溯的方法。在具体的消歧方法上运用统计或规则的方法,统计方法在当今计算语言学界应用得非常广泛,用于许多机器翻译系统中确实可以解决很多问题,但对于许多数据稀疏现象却无能为力,本文所涉猎的实例真歧义短语恰恰属于这类稀疏现象,而且中文信息处理有其自身的特殊性,不能直接照搬国外的理论和方法,因此我们还是以规则的方法为主,采用选择限制和语义层级体系(参见杨泉、冯志伟2005)相结合的办法,尽量找到一种可供计算机直接操作的消歧方法。当然,我们并不排斥统计的方法,如果能够找到可与本文研究的方法完美结合的统计方法,我们会考虑兼容并蓄。
一、研究概况
语言学界研究歧义主要是为了找出人与人在交际过程中产生歧义的原因及歧义的全部类型;而计算语言学家的任务则是在语言学专家研究成果的基础上,考察机器在处理自然语言的过程中产生歧义的原因及自动消解歧义的办法,对于中文信息处理来说包括歧义字段切分、多义词义项选择、歧义格式分化等。本文以“n+n+n”这种同类词短语[1]为切入点,重点研究如何让计算机自动消解同类词短语中的句法功能歧义。







