厦门大学市场营销专业-繁星春水读后感
基于
AAAI
年会论文的国际人工智能领域计量与可视化研究 p>
张春博
?
,丁
,贾龙飞
(大连理工大学
21< /p>
世纪发展研究中心暨
WISE
实验室,大连
116024
)
摘
< /p>
要:
人工智能是当代工程科技前沿研究中的学科领域之一,也是国家科技发展规划的 重
点领域和优先主题。以
EI
Compendex p>
数据库收录的国际人工智能领域权威学术会议
AAAI
在
p>
2002
~
2011
年的会议论文为研究对象,运用科 学计量学方法和可视化技术,绘制出当代
国际人工智能领域的知识图谱,
对包括国别、
机构和作者在内的研究力量分布以及热点、
前
沿和所涉学科在内的主题内容进行了分析和总结。
此外,
通过对知识图谱的深度 解读,
发现
科学计量及可视化方法在探析学科领域研究主题时,
既需改进自身的方法工具,
也应与内容
分析及作者行文模式等研究
相结合。
关键词:
科学计量;知识图谱;人工智能;
EI Compendex
;研究前沿
中图分类号:
G301
,
TP3
Research by Scientometrics and
Information Visualization in International
Artificial
Intelligence Field Based on
AAAI Conference Proceedings
Zhang
Chunbo
,
Dingkun and Jia Longfei
(WISE Lab & 21st Century Research
Center
,
Dalian University of Technology
,
Dalian 116024
,
China)
Abstract
:
Artificial Intelligence is currently one of the frontier subject in the field of engineering
and
technology study
,
and also main area and priority topic in national program for science and
technology
development.
Based
on
proceeding
papers
in
AAAI
conference
on
Artificial
Intelligence from EI Compendex during
the period 2002 to 2011
,
the methods of scientometrics
and
visualization
technology
are
used
to
draw
up
scientific
knowledge
mapping
of
domains
of
international
artificial
intelligence currently.
And
then
,
the
paper
analysed
and
summarized
the
research
power
(including
country
,
institution
and
author)
and
research
theme
referring
to
hot
topics
,
research frontier and related classifications. In addition
,
based on the deep interpretation of
the
knowledge
mapping
,
the
paper
revealed
that
the
method
of
scientometrics
and
information
visualization
should
be
combined with
content
analysis
method
,
behavioral
patterns
in
writing
scientific articles and other factors
to explore disciplinary themes.
Key words
:
sientometrics p>
;
knowledge mapping
;
artificial intelligence
;
EI Compendex
;
research
fronts
人工智能(
artificial intelligence
,简称
AI
)是在计算机科学、控制论、信息论、神经心
< br>理学、
哲学和语言学等多学科研究的基础上发展起来的一门综合性很强的交叉学科。
从计算
机应用系统的角度出发,
人工智能是研究如何制造智能机 器或智能系统,
来模拟人类智能活
动的能力,以延伸人们智能的科学。自
1956
年在
Dartmouth
专题研讨会上正 式提出“人工
智能”
这个术语并把它作为一门新兴学科的名称以来, p>
人工智能获得了迅速的发展,
在知识
处理、模式识别、自然语
言处理、博弈、自动定理证明、自动程序设计、专家系统和智能机
器人等多个领域取得举
世瞩目的成果,
引起了人们的高度重视,
也受到了很高的评价。
它 与
空间技术、原子能技术一起被誉为
20
世纪三大科学技 术成就。
?
收稿日期:
2012-08-
基金项目:
高等学校博士学科点专项科研基金(
NO. 24
)
;国家自然科学基金(
NO.
71073015
)
作者简介:
张春博(
1980-
) p>
,男,河北沧州人,博士研究生,研究方向为科学计量与技术政策。
丁
堃(
1962-
)
,女,辽宁海城人,教授,博士,研究方向为学科知识计量与创新管理。
贾龙飞(
1989-
)
,男,陕西宝鸡 人,硕士研究生,研究方向为科学计量与文本挖掘。
作为一门新思想、
新观念、
新理论和新技术不断出现的新兴学科和应用价值巨大的前沿
学科,
对近些年人工智能领域的发展进行梳理也显得非常必要。
经过检 索和调查,
目前有关
国际人工智能领域的信息计量研究和可视化分析的学
术论文并不是很多。
赵玉鹏等人以期刊
[1]
[2] p>
文献为载体,分别对
AI
领域
和机器学习领域
的研究前沿进行可视化探析;蒋蓓基于科
学计量学的方法和指标,
探讨了人机交互学的发展态势,
并运用可视化软件分析了该领域的
科研合作网络和学科交叉网络
;
Alfonso
等人以计算机科 学和人工智能期刊数据为案例,
借助贝叶斯网络挖掘了文献计量指标间的关系
[4]
;贾积有则通过典型案例法和文献计量法,
对
2007-2009
年间国外人工智能教育应用的热点问题进行了探讨
。有鉴于此,本文以
EI
数据库中收录的国际人工智能领域权威学
术会议
AAAI
会议文献的题录及文摘信息为基础,
采用
科学计量学、
社会网络分析等方法及信息可视化技术,
对国际人工智能领域的研究 力量
分布和主题内容进行分析和总结,希冀能为人工智能领域的学者提供一定意义的学术
参考,
同时也在分析过程中对科学计量学的一些理论方法提出些许思考。
[5]
[3]
1
数据来源与研究方法
1.1
数据来源及预处理
在各种学术会议中,
学术年会是一种最具制度性的会议形式,
尤其是某一学科领域的权
威学会
组织主办的学术年会,
更具有主题性、
学术性、
高层次和规模性的 特点。
而在该学术
年会上录用的学术论文汇集了学科领域最新的研究成果
,
所讨论的内容具有新颖性、
专业性
和前瞻性,
较之学术期刊更能即时、
综合地反映学科的新理论、
新技术等方面的研究。
因而,
对权威的学术年会会议文章信息的计量和可视化分析,是揭示学科
领域发展状况的较好途
径。
尽管人工智能涉及
多个领域,
各领域也几乎都有自己的顶级会议,
但国际人工智能联合
会议
(
International Joint Conference on Artificial Intelligence
,
< p>简称IJCAI
)
和国际人工智能协
会
(
The Association for Advancement of Artificial Intelligence
,
简称
AAA I
)
的学术年会
(
AAAI
Conference on Artificial Intelligence
p>
,通常也简称为
AAAI
)是人工智能领域公认的权威的综
< p>合性学术会议。
由于
IJCAI
的会议论文只有少部 分收录在
EI Compendex
、
CPCI-S
等数据库,
而
EI
Compendex
较为完整地收录了
AAAI
会议论文的文摘信息,因而笔者选择了近十年
(
2002-2011
年)
AAAI
< p>会议收录的学术论文作为分析样本。AAAI
会议在十年来的八届会议
上共收录
2506
篇文献(表
1
)
,也基本上能够反映出人工智能研究的发展状况。
表
1 AAAI
学术年会收录文章篇数(
2002-2011
年)
届次
年份
18
19
20
21
22
23
24
25
2002
2004
会议地点
Edmonton,
Alberta
San Jose, California
收录文章篇数
179
195
331
366
372
360
354
349
2005
Pittsburgh, Pennsylvania
2006
Boston, Massachusetts
2007
V
ancouver, British Columbia
2008
Chicago, Illinois
2010
2011
Atlanta, Georgia
San
Francisco, California
注:
2003
年和
20009
年没有召开会议,故
10
年 共召开
8
届年会
由于本文用于文献计量
和信息可视化的软件主要识别
ISI
数据格式,
因而需要对下载的
EI
数据进行预处理,而核心工作就是进行数据格式的转换。数据格式转 换主要分为字段标
识转换和内容格式转换两部分。前者是把
EI
的字段转换为
ISI
的字段,如对作者字段的转
换
,是将
EI
数据中的
“
Auth ors
”转化为
ISI
数据中的“
AU
< p>”字段;后者是对字段具体内
容的格式转换,
涉及内容撰写形式和字 符空格表征形式等的转换。
数据格式转换后,
还需要
对数
据进行更为细致的清洗和测试。
1.2
研究方法与工具
本文主要采用科学计量学和知识图谱的
理论方法进行研究。在科学计量方法的应用上,
一方面通过词频统计来展现人工智能领域
的主要研究力量
(包括高产的国家地区、
机构和作
者)和
主要研究主题(包括文献的主要主题词和涉及较多的学科)
,另一方面通过共现的理
论和方法来探讨作者的合作、
主题间的关联以及学科间关系等话题。
对 于词频的统计和共现
关系的构建,笔者主要采用了普赖斯奖得主、瑞典科学计量学家
p>
Persson
开发的文献计量学
研究软件
B ibexcel
来实现。
知识图谱是新近兴起的,
p>
以科学学为基础,
将应用数学、
信息科学、
计算机科学 和图论
等学科知识综合在一起的学科领域和研究方法。
其基本原理是分析 单位
(科学文献、
科学家、
关键词等)的相似性分析及测
度,然后根据不同的方法和技术绘制不同类型的图谱
。由于
知识图谱是以
科学知识为计量研究对象,
且以科学计量方法为理论基础,
因而应属于科学计 p>
量学的范畴。
知识图谱把科学知识的发展进程与结构关系以可视化的图形直接 反映出来,
对
于窥探和解释学科领域隐藏和潜在的规律具有重要作用。<
/p>
本文主要采用
Dexel
大学的陈超美教 授开发的信息可视化软件
Citespce
Ⅱ进行知识图谱
的绘制。
Citespce
Ⅱ是一种基于
Java
语言平台开发的多元、分时、动态的应用程序和可视化
软件。
Cite spce
Ⅱ其应用广泛,它使用户可以将某个领域顺时进行“抓拍”
,然后将这些 抓拍
的图片连接起来,
从而探索一个知识领域的发展机制和热点趋势。< /p>
此外,
笔者也运用社会网
络分析软件
Paj ek
进行人工智能领域学科的共现和分析。
[6]
2
人工智能的研究力量分布
2.1
国别与机构分析
经统计可知,
2506
篇论文共涉及
46
个国家和地区,
其中美国以 p>
833
篇遥遥领先
(表
2
)
< p>。
美国发文量之高,
与其雄厚的经济、
科技实力以及 较高的科研投入是分不开的,
同时也不能
忽视
AAAI< /p>
会议主要在美国举办(表
1
)以及主办机构
AAAI
前身为美国人工智能协会这些
因素。
加拿大以
< p>196篇文章高居次席,
反映了其在人工智能领域的较强科研实力;
而近十年
来,
加拿大也是举办了两届会议。
中国以
190
篇文章紧随其后,
与加拿大共同构成第二集团。
< p>值得注意的是,
香港地区的高校在中国发文起了主要作用,
尤其是香 港科技大学已成为国际
人工智能领域的重要研究阵地。
而南京大学计算机 软件新技术国家重点实验室和浙江大学计
算机学院这些年也异军突起。
其 他主要发文国家及地区还包括德国、
英国、
澳大利亚和以色
列等。
表
2 AAAI
学术年会发文
20
篇以上的高产国家及地区(
2002-2011
年)
序号
发文篇数
1
2
3
833
196
190
国别
US
Canada
China
序号
发文篇数
6
7
8
102
88
66
国别
Australia
Israel
France
序号
发文篇数
11
12
13
45
39
38
国别
Singapore
Ireland
Spain
4
119
Germany
9
60
Iataly
14
29
Austria
5
111
UK
10
53
Japan
15
21
Netherlands
通过对这
2506
篇文献机构的统计分析发现, 国际人工智能研究的力量分布呈现较高的
集中度。
图
1< /p>
是发文量不少于
15
篇的
15
所高产 机构。
卡内基
-
梅隆大学以
67
篇 文章在各机
构中独领风骚。
事实上,
卡内基
-
梅隆大学的计算机学科在全美的
US NEWS Ranking
< p>中常年
排名第一,
人工智能研究也处于世界顶尖水平。
有关研究主要集中在该校的计算机科学学院
(
School of Computer Science
)
,
而学院有下设计算机科学 系
(
Computer Science Department
)
、
机器人研究所(
Robotics Institute
)
、人机交互研究所(
Human- Computer Interaction Institute
)
和机器学习系
(Machine Learning Department)
等多个研究机构从事人工智能的专门研究,
呈现
“集团优势”
。香港科技大学的人工智能研究在全球也处于领 先地位,其学术带头人杨强教
授现任
ACM
人工智能专委 会(
ACM Special Interest Group on Artificial Intelligence
)的副主
席,
是国际人工智能 领域的重要学者。
林方真教授则是著名人工智能刊物
Journal of Artificial
Intelligence Research
的副主编,
并因其在人工智能领域的卓越研究成就,
而获颁
“裘槎 优秀
科研者奖”
。阿尔伯塔大学是全加拿大五所最大的以科研为主的综合 性大学之一,人工智能
以及机器人和控制系统是该校的优势研究领域。
多 伦多大学的人工智能研究组主要研究计算
语言学、知识表示和推理、机器学习、规划、计
算机视觉和神经网络等领域,其中杰出学者
Geoffrey Hinton
2012
年度的加拿大国家最高科学奖基廉奖(
Ki llam Prize
)
。从图
1
中还可
以看到,微软研究院和
IBM
沃森研究院这样的公司研究机构也位列其中,这再次 表
明人工智能领域的研究成果具有巨大的应用潜力和商业价值。事实上,谷歌、微软、<
/p>
IBM
和雅虎公司的研究都是
AAAI
会议 较固定的赞助机构,
英特尔、
通用电气甚至波音公司也曾
赞助该会议。
0
C
AR
NE
G
IE
ME
L
L
ON UNIV
HONG
K
ONG
UNIV S
&T
UNIV AL
B
E
R
T
A
UNIV
T
OR
ONT
O
UNIV MAS
S
AC
HUS
E
T
T p>
S
UNIV
T
E
XAS
UNIV S
O C
AL
IF
NAT
L
UNIV S
ING
APOR
E
MIC<
/p>
R
OS
OF
T
R
E
S
UNIV WAS
HING
T
ON
S
T
ANF
OR
D UNIV
UNIV
MIC
HIG
AN
IB
M WAT
S
ON R
E
S
MIT
N
C
AR
OL
INA S
T
AT
E
UNIV
1
0
20
30
34
34
32
29
29
28
25
21
20
20<
/p>
19
19
18
4
0
50
60
70
67
80
15
图
1 AAAI
学术年会发文≥
15
篇以上的高产机构(
2002-2011
年)
2.2
作者分布及合著分析
2506
篇论文是 由
1889
位作者贡献完成。随着新学科和大量分支学科的出现,学术科研
合作在现代科学发展的进程中扮演着越来越重要的角色。
学术科研合作可以使不 同的知识实
现集成,
以及不同知识背景的研究人员之间进行知识的碰撞< /p>
[7]
。
在这
2506
< p>篇文献中,有
2166
篇文章为合著论文,
其中
2
人合著的有
817
篇,
3
人合著的有
629
篇,
4
人合 著的有
378
篇,
5
人合著的有
167
篇,
6
人及以上合著的达
175 p>
篇之多。表
3
是对历届会议论文合作度和合
著
率的统计。
论文合作度是指论文的作者总数与全部论文篇数之比,
合著率是合著的 论文篇
数与全部论文篇数之比,
两个指标在科学计量学通常用来表征某一 学科领域的合作状况。
从
表中可以看到,论文合作度较十年前有明显的提
高,不过近些年基本在维持
3
人
/
篇左右;
而合著率则是呈现逐渐上升的趋势,到了
2011
年的会议已达 到
0.92
,即有
92%
的论文为合
著而成。
这体现了人工智能领域学者有着良好的合作精神,
更表明了该 领域学科交叉的程度、
涉及领域的广度和学术研究的深度。
表
3 AAAI
学术年会论文合作度与合著率统计( p>
2002-2011
年)
年份
文献篇数
作者数量(人)
合著篇数
合作度
合著率
2002
2004
179
195
471
572
134
160
2.63
2.93
0.75
0.82
2005
2006
2007
2008
2010
331
366
372
360
354
1010
1062
1125
1085
1077
281
320
324
315
312
3.05
2.90
3.02
3.01
3.04
0.85
0.87
0.87
0.88
0.88
2011
349
1134
320
3.25
0.92
在可视化分析中,首先运用
Citespce
Ⅱ软件绘制作者合作网络图谱。基于发文篇数、合
作篇数和余弦相似系数指标,笔者选定阈值(
2
,
2
,
30
;
2
,
2
< p>,30
;
2
,
2
,
30
)
,结果如图
2
所示。图中是三个最大的作者合著连通网络,根据作者机构信息的统计和对照,可以将三
个连通网络划分为
9
个合作群或团队。
澳大利亚
NICTA
合作群
南加州大学团队
北美机构
合作群
马里兰大学团队
以色列机构
合作群
德州大学奥斯汀
分校团队
日本机构
合作群
欧洲机构
合作群
香港科技大学
合作群
图
2 AAAI
学术年会作者 合著网络图谱(
2002-2011
年)
经过进一步的统 计和更详细的调研,
可以发掘出国际人工智能领域学术合作主要存在这
样
几个特征。
第一,
合作类型可以分为机构内的团队合作和跨机构合作两种模式,< /p>
而著名学
者和年青学者是合作的主要连接点。著名学者一方面是团队内的核
心,指导团队研究方向,
另一方面或是曾经在多个机构工作过,
或是有着 重要而熟悉的科研合作关系
(如学术兼职或
科研邀请)
, 因而成为学术合作的重要发起者。从图上可以看到,美国凭借其强大的科研实
力,成为这
种合作模式的典型。优秀的年青学者常常就读于人工智能领域顶尖的研究机构,
甚至师从
著名学者,
然后毕业后回到本国从事科研,
因而成为不同区域机构间合作的重要桥
梁。
以色列的科研建设和人才培养具有高度的开放性,
鼓 励学生出国深造,
既发挥了重要的
国际合作连通作用,
又 增强了本国机构的科研实力。
第二,
区域内机构合作是人工智能领域
的重要合作形式。
尽管人工智能领域的国际合作越来越多,
但从图中可 以发现,
区域内的机
构合作仍很普遍。
如以色列机构合作 群就涉及巴依兰大学、
本古里安大学、
耶路撒冷希伯来
大
学、以色列理工学院和
IBM
海法研究所间的合作。在澳大利亚,国际信息与通讯 技术中
心(
National Information & Communication Technology Australia
,简称
NICTA
)会聚了该国
人工智能领域的顶尖研究力量。
该中心通过共建实验室、
聘请研究员和设立项目组等形式与
国内研究机
构建立合作关系,
致力于人工智能技术的研发和商用。
第三,
华人 已成为国际人
工智能领域的重要研究力量,
该领域的中国国际合作也呈现 出
“华人现象”
。
通过统计发现,
除了前
述的香港科技大学杨强教授外,
任职于帕洛阿尔托中心的
ZHOU Rong p>
以及先后就学
于清华大学和美国杜克大学、现在哈佛大学做博士后的夏立荣等
也为该领域的高产作者。