1. 1. 计算角度下的语义
  2. 2. 语义知识简述
  3. 3. 语义知识的应用
  4. 4. 讲义最后的文献

语义学(Semantics),也作“语意学”,是一个涉及到语言学、逻辑学、计算机科学、自然语言处理、认知科学、心理学等诸多领域的一个术语。

虽然各个学科之间对语义学的研究有一定的共同性,但是具体的研究方法和内容大相径庭。语义学的研究对象是自然语言的意义,这里的自然语言可以是词,短语(词组),句子,篇章等等不同级别的语言单位。但是各个领域里对语言的意义的研究目的不同:

  • 语言学的语义学研究目的在于找出语义表达的规律性、内在解释、不同语言在语义表达方面的个性以及共性;
  • 逻辑学的语义学是对一个逻辑系统的解释,着眼点在于真值条件,不直接涉及自然语言;
  • 计算机科学相关的语义学研究在于机器对自然语言的理解;
  • 认知科学对语义学的研究在于人脑对语言单位的意义的存储及理解的模式。

计算角度下的语义

语义的通俗理解

首先,我们从正常的通俗概念上来理解语义是什么。在日常的对话和各种场合的表述中,通常一句话表达的信息和含义,我们能够用不同的方式进行体现。在我们还是孩提的时候,老师就曾经教过我们采用不同的方式对同一个句子进行改写以表达同样的信息。例如:

“张三打了李四” ——> “李四被张三打了”

在这样的两个句子中,句子本身的形式不同,但是其信息中表示的不同实体之间的关系是一致的。这里在语义的层面上,同样都是:张三 “打” 李四。但是,很多时候我们并不会进行深入的思考,这种对同样语义进行的不同形式的展现,究竟意味着什么。尤其是在复杂场景下,更是这种情况。某一种表述和原先的表述可能信息表述的信息相同,但是在其特定的环境下,究竟应该选择哪一种方式,很多的时候,我们并不能精确的描述出来。

符号学上的意义

我们从纯符号学的角度来看意义,可能并没有什么意义————意义就是符号变换的游戏,纯粹从符号世界的角度来理解:“A的意思是B” or “A意味着B”。然而,所谓知道一个符号串的意义,包含两层意思:

  • 你可以把一个符号串A变换为符号串B;
  • 原则上,关于这个符号串A的变换游戏没有止尽;

在英文中有一个词,用来表示同样意思之间的形式转换:Paraphrase,下面我们看一下Collins字典中对这个英文词的解释。

If you paraphrase someone or paraphrase something
that they have said or written, you express what they
have said or written in a different way.

—— Collins COBUILD Dictionary

在上述的特点下,自然语言系统中因为形式与意义的非一一对应性,导致了在计算语言学中对其语言材料的处理是一个极其困难的过程。

一个形式 —— 多个意义:
自然语言理解必须面对的问题

一个意义 —— 多个形式:
自然语言生成必须面对的问题

这两种不对应,如果要进行具体的分类可以基本上涵盖以下的不同类型:

1.一个形式多重意义的情况:

概念多义:如“编辑”这个词同时具有不同的词性,当然也就用法不同。

指称多义:如“张三把他出卖了。”和“张三把他的朋友出卖了。”两句中他到底指的是谁?

泛指与特指:略

量化词组:略

常见歧义结构:常见的语言中各种特例,如牛奶饼干,晒太阳等。

隐喻:如”董永这回算是背上口大黑锅了.”

2.一个意义多种形式的情况:

同义词:如“衣服 — 衣裳”等。

同义结构:如“去看看”和“看看去”

在自然语言中上述的这类情况非常多,具体的语言材料零碎,且很多时候这些语言信息和不同的民族文化又有很大的关联。在面对这些问题的时候,就需要耗费一番功夫。

语义知识简述

语义知识从词义聚合和词义组合两种基本基本的特性上可以大致按照这两个方向进行划分。

关于词义聚合关系的知识:

1.语义特征(义素)分析

2.语义关系分析:
语义分类(语义场)—— 上、下位关系
同义关系;反义关系;
整体 - 部分关系 …

上述两种不同的分析,如果深入进去会有更详细的阐述,以后有机会的话,深入专题。这里只做简单的整理分类,以便从宏观的角度看整体的方向。

关于词义组合关系的知识:

理想目标:描述任意词语之间的组配关系

配价理论:
典型的配价关系:动词 - 名词之间的组配关系
可分为三个层次来描述这种组配关系知识:

1.论元个数 —— 价数

2.论元类型 —— 论旨角色

3.对论旨角色的选择限制

在词义组合的方面,有着更为详细的处理,细节很多,这里也不做深入。

语义知识的应用

语义知识跟句法知识的差别主要在于知识颗粒度的不同,从某种意义上说,语义知识就是细化了的句法知识。

语义知识的应用:

  • 帮助判断一个形式的合语法性,帮助做句法结构分析
  • 帮助做形式变换:得到同义表达式,进行推理,等等

从本质上来说,语义知识本身也是一种形式化的数据集合。在不同的情况下,语义本身的原则对语言材料做出一定的指导作用。上面所说的两种应用,第一种是在语义知识的基础上用来对实际的语言特征进行筛选。第二种,则是在变换规则的基础上,对某种符合语义知识的语言材料进行映射的过程。

详细的例子,这里也不做过分的细说。在此过程中,会产生很多的问题,接下来在理论工具的发展下,来一步步了解:对这些具体的问题,怎样用计算的方式进行解决?这是一个艰苦的过程。

讲义最后的文献

  • 冯志伟等译(2005)《自然语言处理综论》第14,15,16章。
  • 詹卫东,2001,《确立语义范畴的原则及语义范畴的相对性》,载《世界汉语教育》
    2001年第2期。
  • 徐烈炯,1995,《语义学》,语文出版社
  • Geoffrey Leech, 1983, Semantics: The Study * of Meaning, Penguin Books.
  • 蒋严,潘海华,1998,《形式语义学引论》,中国社会科学出版社
  • Shalom Lappin, ed., 1996, The Handbook of Contemporary Semantic Theory, Oxford:
    Blackwell.
  • 姚天顺 等, 1995, 《自然语言理解》,清华大学出版社,第四章,pp50-81, (语义网络)
  • 张普,1991,《信息处理用现代汉语语义分析的理论与方法》,载《中文信息学报》1991
    年第3期。