Document

网络, 逻辑,与知识社会
--论语义网的逻辑基础及其应用
Web, Logics, and Knowledge-based Society
--On the Logical Foundation of the Semantic Web and its
Applications
黄智生
Zhisheng Huang
荷兰阿姆斯特丹自由大学计算机科学系
Vrije University Amsterdam
[email protected]
Outline
•
•
•
•
•
逻辑,推理与知识社会
网络与知识社会
语义网的逻辑基础
语义网与本体技术应用实例
结论
2009 Beijing
2
逻辑,推理与知识社会

一个现代中国知识分子不断探寻的问题:
中国文化与如何走向现代化
2009 Beijing
3
2009 Beijing
4
逻辑,推理与知识社会
无所不在的逻辑推理与决策判断问题
 逻辑推理, 管理水平与执政能力
 网络信息资源与知识社会

2009 Beijing
5
逻辑与科学
Logics and Sciences
一部人类文明史就是一部人类
思想发展史,也就是一部基于
逻辑分析的科学思维的发展史。
 基于逻辑的分析方法已经成为
现代科学的基石,贯串着科学
领域的方方面面。
 它不仅是所有自然科学领域的
方法论基础,也是所有社会科
学领域的方法论基础。

2009 Beijing
6
避免对逻辑的一个常见误解
Avoiding a Pervasive
Misunderstanding on Logics

逻辑理论实际上是一个规范性的
(normative)理论,而不是一个描述
性的(descriptive)理论, 也就是说,
它并不是来描述人类究竟是采用何种
形式来推理的,而是来研究人类应如
何更有效地进行推理的。
2009 Beijing
7
现代科学与逻辑思辩方法
斯宾诺莎(1632-1677)(荷):伦理学
 笛卡尔(1596-1650)(法):第一哲学的沉思
 牛顿(1643-1727)(英):力学体系
 罗素 (1872-1970)(英)数理逻辑与现代数学
 布劳维尔(1881-1966)(荷):直觉主义逻辑

2009 Beijing
8
分析性思维的基本法则





(定义优先原则)避免在基本定义上的误解,先
要把基本定义说清楚;
(公理约定原则)基本公理是一种约定,而不必
证明;
(逻辑推论原则)只要同意了基本定义和基本公
理,结论从逻辑推理中自然获得;
(公理自明原则):由于公理是一种约定,故要
尽可能地自明;
(最少公理原则):由于公理是容易引起争议的,
要尽可能地少。
2009 Beijing
9
从我们身边每天发生的事情说起
2009 Beijing
10
众说纷纭话“感恩”
不应该取消,既然主动资助别人,主观上
就不应图回报
 应该取消,不知感恩的人很难期望他们将
来回馈社会。
 鄙视这些要求大学生感恩的企业家。贫穷
的大学生不是叫花子!他们一心放在学习
上,将来为社会做了贡献就是对你最大的
回报。

2009 Beijing
11
众说纷纭话“感恩”




这是一个社会问题,中国应该把素质教育当做重点
课程,都读大学还不会感恩这是中国教育界的失败
人是社会动物,对别人的善意做出正确的反馈是
基本的道理,如果连这点游戏规则都不懂的话,
那读这么多书简直 就是浪费!
上学是他们应有的权利!靠别人捐助施舍才得到,该
感谁的恩?
滴水之恩,涌泉相报!
2009 Beijing
12
感谢的逻辑

Thank i,j [doj(a)]   [doj(-a)]  done(j,a)
(Ui()> Ui())  (Uj ()> Uj()).
某甲应该就某事感谢某乙当且仅当
某乙是该事的
行动者而且某甲从中得到好处(utility)而某乙从中
失去好处。
2009 Beijing
13
弱感谢标准

Thank i,j [doj(a)]   [doj(-a)]   done(j,a)
(Ui()> Ui())
某甲应该就某事感谢某乙当且仅当
某乙是该事
的行动者而且某甲从中得到好处。
2009 Beijing
14
感谢与义务

Thank i,j [doj(a)]   [doj(-a)]   done(j,a)
Ojdone(j,a)  (Ui()> Ui())  (Uj ()> Uj ())
某甲应该就某事感谢某乙当且仅当 某乙是该事的行
动者而且某甲从中得到好处而某乙从中失去好处
而且某乙没有义务必须这么做。
2009 Beijing
15
感谢与认知

Thank i,j Ki[doj(a)]   Kj[doj(-a)]   done(j,a)
 Ki(Ui()> Ui())  Ki(Uj()> Uj())
某甲应该就某事感谢某乙当且仅当
某乙是该事
的故意行动者以使某甲从中得到好处。
2009 Beijing
16
感恩
某甲应该就某事感恩某乙当且仅当
某乙是该事的行动者而且某甲从中得到极大好
处而某乙从中蒙受许多损失。

Gratitude i,j [doi(a)]   [doi(-a)]   done(j,a)
 (U i()-U i())>Gi (Uj()-Uj()) >Gj).
2009 Beijing
17
弱感恩标准I
某甲应该就某事感恩某乙当且仅当
某乙是该事的行动者而且某甲从中得到好处而
某乙从中蒙受许多损失。

Gratitude i,j [doi(a)]   [doi(-a)]   done(j,a)
 (Uj()>Uj()) (Uj()-Uj()) >Gj).
2009 Beijing
18
弱感恩标准II
某甲应该就某事感恩某乙当且仅当
某乙是该事的行动者而且某甲从中得到极大好
处。

Gratitude i,j [doj(a)]   [doj(-a)]   done(j,a)
 (Ui()-Ui()) >Gi.
2009 Beijing
19
感谢与信息传递

Thank i,j [doj(a)]   [doj(-a)]   done(j,a)
Ojdone(j,a)  (Ui()> Ui())  (Ui()> Ui())
说声谢谢 等于 进行下列言语确认行动:
1) (主体角色的确认):是您为我作了这件事;
2)(利益转移的确认):从中我得了好处而您蒙受
了损失;
3)(义务免除的确认)您本没有义务这么做。
2009 Beijing
20
不感谢意味着什么?

使用逻辑方法进行推算:
Thank i,j  ([doj(a)]   [doj(-a)]   done(j,a)) V
Ojdone(j,a) V ( (Ui()> Ui())  (Ui()> Ui()) )
不道谢 等于 作了下列言语行动之一:
1) (主体角色的否认):不是你为我作了这件事;
或者 2)(利益转移的否认):从中我没得了好处或
你没蒙受什么损失;
或者 3)(义务的确认)你这么做是应该。
2009 Beijing
21
分析的结论

贫困大学生不必感恩企业家的资助,应为
每年一千元的支持不构成该感恩的标准。
贫困大学生应该向企业家致谢,应为无论采
取何种标准,都构成应该致谢的事情。
懂得致谢是所有文明人都应该知道的一种行
为规范。
企业家有理由终止资助,因为没有信息渠道
可以表明受助大学生懂得文明规范。
2009 Beijing
22
2009 Beijing
23
逻辑的作用

Thank i,j Ki[doj(a)]   Kj[doj(-a)]   done(j,a)
Ojdone(j,a) (Ui()> Ui())  (Ui()> Ui())






Ki : 知识与相信的逻辑(Logic of knowledge
and belief)
[doj(a)]: 动态逻辑(Dynamic Logic)
Ui()> Ui() : 偏爱逻辑(Preference Logic)
Oj done(j,a):义务逻辑(Deontic Logic)
命题逻辑(Propositional Logic)
一阶谓词逻辑(First Order Predicate Logic)
2009 Beijing
24
推理与模糊性
不确定性通过多种定义来体现
 多个前提的共同结论构成模糊推理的下界
 从至少一个前提推出的结论构成模糊推理
的上界

2009 Beijing
25
逻辑与判断:更多的例子

南京彭宇案:概率推理,常识推理与司法论证
中国牙膏:二甘醇问题:关于安全的推理

何祚庥炮轰中医:陈晓旭就是被中医害死的: 因
果推理问题
岳飞文天祥是否是民族英雄?语言哲学与时间推
理问题
接受库哈斯的央视大楼解释也是崇洋媚外:关于信
息来源权威性的推理和寓意的逻辑
。。。。
2009 Beijing
26
2009 Beijing
27
2009 Beijing
28
郑州官员“说话门”事件

据中央人民广播电台经
济之声2009年6月17日
报道,河南郑州市须水
镇西岗村原本被划拨为
建设经济适用房的土地
被开发商建了别墅和楼
中楼,记者对郑州市规
划局进行采访时遭到副
局长质问:是准备替党
说话,还是准备替老百
姓说话?
2009 Beijing
29
一个来自实际生活的例子
Disjoint(执政者, 执政者)
即执政者与非执政者是(完全)不一样的

• Disjoint(从执政者角度说话, 从非执政者角度
说话)
即从执政者角度说话与从非执政者角度说话是
(完全)不一样的
• 从X角度说话=>替X说话
即从X角度说话就表明了是替X说话
2009 Beijing
30
一个来自实际生活的例子(续)
党 =执政者
即党等于执政者

老百姓=非执政者
即老百姓等于非执政者

是否可以推出下列结论?
Disjoint(替党说话, 替老百姓说话)
你是准备替党说话,还是准备替老百姓说话?
2009 Beijing
31
万维网: 影响和展望
WWW: Its impacts and
visions
2009 Beijing
32
网络1.0
Web1.0
2009 Beijing
33
网络2.0
Web2.0
2009 Beijing
34
对网络3.0的期待
Expectations
on
Web3.0
从字面上看对Web3.0的特征期待:

新颖性(Novelty): 它不同于已有的Web1.0和
Web2.0的技术,它能提供全新的一代网络服务
模式(即为什么不是Web1.0或Web2.0)
• 可行性(Achievability):它在现有的网络环境下,经过努力是
可能实现的, 它并不存在不可逾越的技术障碍(即为什么不
是Web4.0或更高)。
• 迫切性(Urgency):它提供网络服务是当前社会迫切需要的,
它的技术引入是能够对社会产生重大影响。(即为什么只能是
Web3.0)
2009 Beijing
35
网络3.0的种种说法
Varieties of Web 3.0

网站内的信息可以直接和其他网站相关信息进行
交互,能通过第三方信息平台同时对多家网站的
信息进行整合使用;用户在互联网上拥有自己的
数据,并能在不同网站上使用;完全基于Web,
用浏览器即可以实现复杂的系统程序才具有的功
能。
• 机器要思考了, 采用人工智能技术,这就是Web3.0。
• Web3.0将以网络化和个性化为特征. 一是数据和应用不需要
在计算机上运行,可以全部存储在网络服务端;二是在任何
一台电脑上,甚至在电话和电视上,只要打开浏览器就能进
入自己的世界。
• Web3.0将由一些很小的网上应用程序组成 , 即不同网站
2009 Beijing
间的服务的融合和集成 。
36
网络3.0
Web3.0
2009 Beijing
37
网络1.0 – 网络2.0 – 网络3.0
Web1.0 – Web2.0 – Web3.0
• 网络1.0: 文件网
Web1.0: Web of documents
• 网络2.0: 人际/社会网
Web2.0: Web of persons
• 网络3.0: 数据网
Web3.0: Web of data (semantics)
2009 Beijing
38
网络发展整体观
2009 Beijing
39
语义联接的好处:从一个实
例说起
Advantages of Linked
Data
2009 Beijing
40
数据联接的好处:小结
• 现有的网页是供人们阅读的,不便于机器自动处
理,数据联接便于机器自动处理
• 文件联接在局部文字上只允许一个链接,而数据
联接对局部文字支持多重链接
• 文件联接只提供部分文字链接,而数据联接保证
全文链接
• 基于关键词的搜索引擎如Google虽然看起来支持
全文检索,但它不能区分同一个词的不同含义,
这对于人名,地名等重复性频率较高的问题领域
处理尤其困难,而且在许多具体应用领域一词多
义的情形比比皆是。
2009 Beijing
41
数据联接的统一概念格式
三元组(Triple)方法: <subject, predicate, object>
例子:<zhishengHuang, isStaffof, VrijeUnivAm>
 提供网络资源的描述能力
例子:<http://wasp.cs.vu.nl/~huang, isStaffof,
http://www.vu.nl>
 提供语义的唯一标识
 让数据内容独立于表达形式
 提供初步的语义推理能力

2009 Beijing
42
为什么推理支持是必要的?
例子:从ZhishengHuang是自由大学的雇员
和自由大学在阿姆斯特丹,能够推出
ZhishengHuang在阿姆斯特丹工作。
<ZhishengHuang, isStaffof, VrijeUnivAm>
<VrijeUniv, inCity,Amsterdam>,
<?x, isStaffof, ?y>,<?y,inCity,?z> ><?x,worksin,?z>
=》<ZhishengHuang, worksin, Amsterdam>
2009 Beijing
43
语义网与本体
Semantic Web and
Ontologies
2009 Beijing
44
资源描述框架
Resource Description Framework(RDF)
•
Metadata is machine understandable information about web resources or
anything that has an URI, it is represented as a set of independent assertions:
Triple: T(subject, attribute, values)
Creator
Zhisheng
Creator
Cees
http://wasp.cs.vu.nl/sekt/dig/dig.pdf
<rdf:Description about="http://wasp.cs.vu.nl/sekt/dig/dig.pdf">
<dc:Creator rdf:ressource="http://www.cs.vu.nl/~huang"/>
<dc:Creator rdf:ressource="mailto:[email protected]"/>
</rdf:Description>
2009 Beijing
45
资源描述框架模式
RDF Schema (RDFS)
• RDFS defines vocabulary for RDF
• Organizes this vocabulary in a
typed hierarchy
– Class, subClassOf, type
– Property, subPropertyOf
– domain, range
2009 Beijing
46
RDFS
Person
subClassOf
subClassOf
domain
PhDStudent
hasSuperVisor
range
type
Professor
type
Prof. Qu
Hu,W
2009 Beijing
47
本体的主要特征
Key features of an Ontology
•概念层次性Concept hierarchy,
–概念包含关系concept subsumption
•特殊与一般关系 InstanceOf Relation
(Instances)
•部分与整体关系 PartOf Relation
(property)
2009 Beijing
48
描述逻辑 Description Logic
Man ´ Human u Male
Happy-Father ´ Man u 9 has-child
Female u …
Abox (data)
John : Happy-Father
hJohn, Maryi : has-child
2009 Beijing
Interface
Tbox (schema)
Inference System
Knowledge Base
49
Basic Description Logic: AL

Concept Expressions:
– A (atomic concept)
–  (universal concept)
–  (bottom concept)
–  A (atomic negation)
– C ⊓ D (intersection)
– R.C (value restriction)
– R.T (limited existential quantification)
where A is a concept name, C and D are
concept expressions, and R is a role
expression
2009 Beijing
50
Family of AL language






C ⊔ D (Union)
R.C (Full Existential Quantification)
 C (Complement)
Number restriction
– ( n R) (at least restriction)
– ( n R) (at most restriction)
Qualified number restriction
– ( n R.C) (at least restriction)
– ( n R.C) (at most restriction)
Transitive Role: R+
Inverse of Role: I

R S:
BeijingH
 Role Hierarchies2009
51
Examples
woman ≡ person ⊓ female
man ≡ person ⊓ woman
mother ≡ woman ⊓ hasChild.person
father ≡ man ⊓ hasChild.person
2009 Beijing
52
Example
whitehorse ≡ horse ⊓ white.
 color(white).

•whitehorse ≡ horse ⊓ hasColor. {white}.
这里white是一个列名(nominal)
•whitehorse ≡ horse ⊓ hasColor. {white} ⊓ 
hasColor. {white}.
2009 Beijing
53
Description Logics

Decidable Subset of First-Order Logic
– Equivalent to 3 Variable Fragment (Borgida 1996)
– Model theoretic semantics by mapping to abstract domain

Provides Primitives for defining Conceptual Knowledge
– Concept Expressions (Formulas with 1 free variable) for
describing Sets of Objects
• Boolean Operators: C D, C  D, C
• Quantifiers: (R.C), (P.C)
• Cardinality Constraints: (= n R), (> n R), (< n R), ( n R), ( n
R)
– Axioms define relations between concepts
• Subsumption: C  D
• Equivalence: C  D
• Disjointness: C  D  
2009 Beijing
54
DL Semantics

Interpretation function extends to
concept expressions in an obvious(ish)
way, i.e.:
2009 Beijing
55
网络本体语言
Web Ontology Language (OWL)
•
•
•
•
•
•
OWL is built on top of RDF
OWL is for processing information on the
web
OWL was designed to be interpreted by
computers
OWL was not designed for being read by
people
OWL is written in XML
OWL is a web standard
2009 Beijing
56
2009 Beijing
57
五句话介绍语义网的主要思
想:
Why the Semantic Web?
•任任何信息系统都需要数据;
•数数据表示要独立于具体的应用和平台,以保证最大程度地可重用;
•采用统一的数据概念表示以保证数据表示独立于具体系统(即可采用
Triple/Tuple形式) ;
•数数据应能描述网络资源(即要采用RDF/RDFS或其他类似的语言
)
•数数据应提供初步的推理支持(即要采用OWL或其他知识表示语言
)
(注意;RDF/RDFS/OWL均采用Triple语义模型)
2009 Beijing
58
发展趋势
根据美国著名市场研究公司Gartner的
2007五月份报告, 到2012年,70%的
公开网页将带有一定程度的语义标注,
20%将使用更强的基于语义网的本体。
Gartner (May 2007):
"By 2012,
70% of public Web pages will have some level of semantic markup,
20% will use more extensive Semantic Web-based ontologies”
2009 Beijing
59
海量语义数据的一部分
•
•
•
•
•
•
•
•
•
•
•
Ontologies and Metadata: Billion
Triples dataset
(十亿三元组数据集)
雅虎数据
东南大学数据
马里兰大学
英国open大学
SemWebBase
(DERI)
维基百科
地理名字
出版物
英文语义词典
Freebase
美国政府数据
2009 Beijing
60
Linked Data 2009
2009 Beijing
61
一个具体的数据联接的实例
http://sindice.com/apiv2/search?q=%22zhisheng%20huang
%22&format=atom&page=1&qt=term
2009 Beijing
62
一个具体的数据联接的实例
http://sindice.com/apiv2/search?q=%22zhisheng%20huang%22&f
ormat=atom&page=5&qt=term
2009 Beijing
63
让数据内容独立于表达形式
2009 Beijing
64
Key Issues of Web3.0

数据,知识与语义
data, knowledge,and semantics
语义相关性, 语义相似性,与语义距离
Semantic relevance, semantic similarity, and
semantic distance
 知识表示与推理
Knowledge representation and reasoning
 海量语义数据处理Scalability
 近似推理 Approximate reasoning

2009 Beijing
65
语义网应用的一些实例:
DBpedia Mobile


http://beckr.org/DBpediaMobile/?location=Beijing
http://beckr.org/DBpediaMobile
2009 Beijing
66
芬兰医疗语义网HealthFinland –
Health Information on the Semantic Web


http://www.seco.tkk.fi/applications/tervesu
omi/
provide a new kind of solution approach to
these problems on a national Finnish level.
The system consists of three main
components:
– Metadata, ontology, and service infrastructure.
– Semantic content creation process. A content
creation and harvesting system has been
implemented for producing semantically annotated
contents, based on the shared metadata model and
ontologies.
– Semantic portal HealthFinland (TerveSuomi) and its
services. The material is published via a semantic portal that
creates a single national entry-point for health information,
Beijing
health promotion and2009
health-related
news.
67




National Semantic Web
Ontology Project in Finland
National Semantic (FinnONTO),
Web Ontology Project in Finland
(FinnONTO), 2003-2007
A large national continuation project of FinnONTO, called
Semantic Web 2.0 (FinnONTO 2.0), started in the beginning of
2008.
The research is directed and is mostly carried our by the Semantic
Computing Research Group (SeCo) at the Helsinki University of
Technology (TKK) and the University of Helsinki. Also the University
of Tampere is contributing to the work.
The consortium behind the project included 37 public organizations
and companies funding the research during the final year 2007. This
consortium represents a wide area of functions of the society
including museums, libraries, business, health organizations,
government, media, and education. Public organizations,
companies, and universities are participating in the project.
2009 Beijing
68
http://www.ontology-advisory.org/
2009 Beijing
69
2009 Beijing
70
2009 Beijing
71
语义网应用于政治分析
实例研究:2006年荷兰大选
Reality + SP
Balkenende – Bos
Reality - VVD
Balkenende: Bos - Ideal
Polls: SP at 25 seats
larger than VVD
According to a poll conducted by
TNS/NIPO, the SP has risen to be
the third largest party.
(7/11/06)
VVD – VVD
VVD – Verdonk
Balkenende attacks Bos
Unrest in VVD over Rutte
“You’re a twister and dishonest”,
said the Christian Democrat about
his most main opponent (30/10/06)
Liberal MP’s also complain about
personal campaign by Rita
2009 Beijing
Verdonk.
(1/11/2006)
72
Relational Content Analysis
2009 Beijing
73
2009 Beijing
74
趋势分析与预测
2009 Beijing
75
2009 Beijing
76
时间推理
2009 Beijing
77
逻辑的作用
使用混合逻辑(Hybrid Logic)与事态逻辑
描述性质:如 Internal Disagrement等
 详情见论文
http://www.cs.vu.nl/~wva/pub/HL.pdf

2009 Beijing
78
Questions and Discussions
2009 Beijing
79