黄学东,IEEE/ACM院士(IEEE/ACM Fellow) ,
微软首位华人“全球技术院士”、微软首席语音科学家、微软云计算与
人工智能事业部认知服务团队全球技术院士/全球人工智能首席技术官、
美国国家工程院院士。他先后获得
湖南大学学士,
清华大学硕士学位和
爱丁堡大学博士学位。
1993年,他作为高级研究员加入了微软研究所并负责组建Microsoft's
语音识别技术研究团队。
2000年到2004年,他作为
微软's语音识别技术研究团队的总经理,负责微软语音技术和产品的研究、开发和市场拓展。他领导微软语音技术的开发和产品的市场行销,包括获奖的Speech Server 2004。在加入微软之前,他在
卡耐基·梅隆大学致力于发展CMU's Sphinx-II语音识别系统。
2020年1月,黄学东出任微软全球
人工智能首席技术官,全面负责微软Azure云、人工智能(AI)的工作,包括语音、机器翻译、计算机视觉、自然语言和人工智能认知服务。
2023年2月8日,美国工程院公布了新增院士名单,黄学东当选
美国国家工程院院士。
在期刊和会议上发表了一百多篇论文,并合著出版了两本非常有影响的专著即:Hidden Markov Models for Speech Recognition (Edinburgh University Press 1990)(语音识别中的隐含马尔可夫模型(爱丁堡大学出版社1990))和Spoken Language Processing (Prentice Hall 2001)(口语处理(普林斯顿出版社2001))。曾获中国教育部的科技进步奖、IEEE信息论文奖、Allen Newell杰出研究奖章,及SpeechTek的语言领域十大领军人物称号。
2015年以来,黄学东领导着
微软在美国、中国、
德国、
埃及、
以色列的团队研发包含语音识别及合成,微软企业
人工智能客服对话解决方案、cris.ai以及luis.ai等认知服务、CNTK开源深度学习工具等人工智能产品和技术。
2017年,黄学东被评选为微软技术院士(Technical Fellow),这代表着微软技术人员的最高荣誉,获得这一荣誉的人还包括
图灵奖得主Butler W Lampson、
查尔斯·萨克尔等。黄学东也是
微软首位华人技术院士。同时,他也是国际电子电气工程师学会(IEEE)和美国计算机学会(ACM)的双科院士,微软认知工具包CNTK的缔造者之一。
在黄学东的带领下,微软
人工智能团队取得了多项里程碑式的技术突破,最新创造的成就如下:
2017年8月,在黄学东的带领下,其团队在产业标准Switchboard语音识别基准测试中实现了对话语音识别词错率(word error rate,简称WER),低至5.1%,创造了当时该领域内错误率最低纪录,首次达成与专业速记员持平而优于绝大多数人的表现。
2018年3月份,黄学东带领的团队在机器翻译领域拿下一项里程碑式的成就:其研发的机器翻译系统在通用新闻报道的newstest2017中译英测试集上,达到了人工翻译水平。这是首个在新闻报道的翻译质量和准确率上媲美人工翻译的翻译系统。
2019年,在斯坦福对话式问答任务中,
微软机器阅读理解系统刷新记录,成为目前排行榜上唯一一个模型分数超过人类分数的团队。
2019年11月,微软推出了基于深度神经网络
语音合成技术的声音定制服务(Custom Neural Voice)平台,将高质量的语音合成引擎开放给第三方,使得微软合作伙伴和客户可以通过简单的自助服务定制有标识度和个性化的声音。