-
专
/
题
世界最大的自然语言处理和
语音技术实验室
——
哈尔滨工业大学语言语音教育部-微软重点实验室
赵铁军
朱聪慧/文
p>
哈尔滨工业大学语言语音教育部
-
微软重点实验
室,
以哈工大计算机学院语言技术研究中心为主要依
托,
p>
由机器智能与翻译实验室、
智能技术与自然语言
处理实验室、
信息检索实验室和语音处理实验室联合
组成,由教育部和微软亚洲研究院
联合支持并资助。
到目前为止,
先后有
200
< p>多名教师和学生加入实验室
进行研究工作,
是目前世界上规模最大的 自然语言处
理和语音技术实验室。
定培养计划
,
然后哈工大派遣研究生到微软亚洲研究
院实习,
由微软 亚洲研究院帮助培养;
双方互相派遣
学者访问,
增进了解 ,
互通有无;
共同邀请国内外专
家学者,
举办研讨会,
决定研究规划和研究策略;
研
究院将部分基
础性研究,
委托联合实验室进行;
研究
院资助联合实验室
一定的相关软硬件等。
在这一阶段
的探讨中,不仅积累了宝贵的合作经验
,而且获得了
丰硕的研究成果,
具体包括双语
(
英汉
)
语料库词汇对齐
工具研究、双语
英汉
)
语料库加工、双语
(
英汉
)
语料库
自动对齐算法研究、翻译知识自动获取技术
研究、便
携式实例翻译系统、中英文统计句法分析器等研究课
题
和项目。而且还培养了一批优秀的研究人员,这是
双方合作的第一个高潮。
1
发展历程
在微软亚
洲研究院的成立之初,
微软就与哈尔滨
工业大学计算机学院开展了密切的
合作,
为如今深入
广泛的合作打下了深厚的基础。
首先,
早在
2000
年
6
月,
哈工大
80
周年
校庆之际,
时任微软亚洲研究院院长的李开 复
博士和任哈工大党委书记的李生教授就对具
体合作事宜达成了
一致意见。
“哈工大
-
微软机
器翻译技术
联合实验室”
在哈工大校庆期间揭
牌,开辟了双方合作之路。合作之初,
哈工大
方面的合作主体是机器智能翻译研究室,
当时
约有师生
40
人。这是微软在中国设立的唯一
的机器
翻译联合实验室,
随后的
4
年中,
双方
< p>探讨并尝试了多种合作方式,
并将其中成功的
合作经验,延
续至今。例如:双方首先共同确
赵铁军教授
|
计算机教育
2007.6
|
11
专
/< /p>
题
2
人员构成与组织结构
“哈工大语言语音教育部
-
微软重点实验室”
现由李生教授
(
哈工大
)
、周明博士
(
微软
)
总 体上负
责和规划,
并分别担任各方的主任;
由王晓龙教授 、
赵铁军教授、
韩纪庆教授和刘挺教授分别主持负责
相关研究室的具体工作,
担任副主任。
为了加强重
点
实验室的学术研究实力和研究氛围,
我们还为此
成立了学术委员会,
p>
包括微软亚洲研究院洪小文副
院长在内的海内外多名知名专家担任委员,
p>
极大加
强了重点实验室的整体研究实力。
朱聪慧
在
2004
年
6
月,基于“哈工大
-
微软机器翻译技
术联合实验室”
所做出的成绩以及哈工大在语言语音
处理研究方面的
研究成果,
将已有实验室进一步扩大
成为必然。
2004
年
6
月
4
日至
6< /p>
日,时值“哈工大
-
微软机器翻译联合实验室”
4
周年之际,
微软亚
洲研究院院
长沈向洋博士等一行
7
人访问哈工大。
鉴
于过去四年联合实验室取得的成绩,
双方一致同意把
合作范围从原来单纯
的机器翻译进一步扩展到自然
语言和语音技术的研究,
“哈工大
-
微软机器翻译联合
实验室”的名称也相应地改
为“哈工大
-
微软自然语
言处理及语音
技术联合实验室”
。这是双方合作进一
步深入和广泛的明显标志。
哈工大的合作主体,
也由
原来单独的机器智能与翻译研究室扩展
到了智能技
术与自然语言处理研究室、
信息检索研究室和语音处
理研究室,
这不但丰富了双方合作所涉及的范围,
而
且也加强了联合实验室整体研究的能力,
这种合作框
架一直保
留至今。同年
11
月份,经教育部批准,联
合实验室被批
准为教育部重点实验室,
这是我们与微
软亚洲研究院合作历史上的里程碑
,
也是对我们之前
合作的极大肯定,
联合实验室的合作被 提到了新的高
度,
从此双方合作更加正式规范,
重点实验 室正式诞
生,双方的合作进入了第二个高潮。
在
2006
年
7
月,
“教育部 p>
-
微软语言语音重点实
验室”
深圳分部成立,
双方开始共同探讨深入研究的
新策略,这是双方合作过程中的一个重大尝
试和突
破,双方合作日益成熟。
重点实验室现
有教师
21
人
(
其中教授
7
人,
博
导
6
人
)
,
在校博士研究生
51
人,
本部硕 士研究生
95
人,深圳分部
40
余人以及 部分本科生,构成了一个
完善的立体的研究体系,
重点实验室下设四个研 究室
和一个分部,
分别是:
机器智能与翻译研究室、 p>
智能
技术与自然语言处理研究室、
信息检索研究室、
语音
处理研究室和深圳分部
(
哈工大深圳研究生院
)
。其中
前四个研究室位于哈工大本部,
主要致力于相关方向
的科学研究,
注重培养研究型人才;
而深圳分部,
主
要侧重于将研究室的研究成果转化为实际应用,
偏重
培养工程型人才。
3
研究内容
重点实验室研究领域广泛,
主要集中在语言和语
音两个重点上。
语言处理方向上的具体研究集中在智
能中文信息处理平台设计与搭建,
语句级中文输入法
模型研究,机器翻译技术、资源、评价的研究,面向
互联网的信息检索,
信息抽取与文本挖掘,
自动文摘,
词法、
句法和语义分析,
自然语言生成等,
基本上涵盖了自然语
言处理研究的各个方面;
语音处
理的具体研究围绕在顽健语音识别与声控
技术,
基于
语音的信息安全技术和音频信息检索技术等方面。
这些研究领域,
重点实验室都投入了大量人力和物力
进行相关研究。
其中
“短语翻译对评价”< /p>
由已经毕业的一位博士
负责,
在其攻读博士学位期间, p>
曾在微软亚洲研究院
实习。
短语翻译对是指互为翻译的源语言 与目标语短
12
|
计算机教育
2007.6
|