聂再清(清华大学智能产业研究院首席研究员)

聂再清

清华大学智能产业研究院首席研究员

聂再清，男，美国亚利桑那州立大学攻读计算机科学博士，现任清华大学国强教授、智能产业研究院首席研究员。

聂再清1991年进入清华大学学习。1996年至1998年在清华大学攻读计算机应用硕士学位。1999年至2004年在美国亚利桑那州立大学攻读计算机科学博士学位。2004年加入了微软亚洲研究院，从副研究员开始，历任主管、高级研究员、首席研究员。2017年加入了阿里巴巴集团，期间带领团队从无到有实现天猫精灵的所有相关算法研发和创新工作。2020年回到清华大学，担任智能产业研究院的首席研究员。带领团队着手构建了多模态生物医药领域基础模型-BioMedGPT。

聂再清专注于研究大数据和知识图谱相关技术，包括实体信息挖掘、关系抽取技术和实体名消歧技术等。聂再清在微软期间被授予Microsoft Golden Star奖。2019年他所带领的团队获得吴文俊人工智能科技进步奖。

人物经历

早年经历

20世纪80年代，聂再清对科技创新产生了兴趣，并受到痴迷计算机技术的哥哥影响，哥哥曾叮嘱他一定要考上计算机系。

聂再清1991年进入清华大学学习计算机科学与技术，1996年获得学士。随后在1996年至1998年，他在清华大学攻读计算机应用硕士学位。1999年至2004年，他在美国亚利桑那州立大学攻读计算机科学博士学位。

工作经历

博士毕业后，聂再清于2004年加入了微软亚洲研究院，从副研究员开始，历任主管、高级研究员、首席研究员，他在这一职位上一共工作了13年，在微软亚洲研究院工作期间，他主要负责微软自然语言理解、实体搜索和挖掘的研发工作，是微软亚洲研究院几个深受用户喜爱的创新产品（如人立方、微软学术搜索、微软自然语言开发者平台）的发起人和技术负责人，提出的基于实体的互联网搜索和大数据实体关系挖掘工作，引领了业内大数据驱动的知识图谱（knowledge graph）挖掘和应用相关技术的创新，在微软期间被授予Microsoft Golden Star奖。2009年发布论文《StatSnowball：a Statistical Approach to Extracting Entity Relationships》。2012年又发表《Statistical Entity Extraction from Web》。

在2017年10月，聂再清离开了微软亚洲研究院，加入了阿里巴巴集团，担任阿里巴巴人工智能实验室北京研发中心负责人和阿里巴巴天猫精灵首席科学家，也是教育部人工智能专家组咨询组专家。2019年他所带领的团队获得吴文俊人工智能科技进步奖。在阿里巴巴的工作持续了3年，直到2020年，期间带领团队从无到有实现天猫精灵的所有相关算法研发和创新工作。

2020年开始，聂再清再次回到了清华大学，成为智能产业研究院的首席研究员。带领团队着手构建了多模态生物医药领域基础模型-BioMedGPT，旨在将生物世界分子、文本与知识进行统一表示学习以达到在各项下游任务上能力的整体提升；同年发表论文《Large-Scale Unsupervised Pre-Training for End-to-End Spoken Language Understanding》。2023年12月，谷歌（Google）演示其最新出炉的多模态AI大模型Gemini，聂再清接受第一财经记者采访表示：“大模型技术的发展比想象中快，虽然现阶段AI没有对人类造成即刻威胁，但确实需要更多关注如何保证机器能够一直服务于人，而不会反过来被坏人利用。”

研究领域

研究方向

聂再清专注于研究大数据和知识图谱相关技术，包括实体信息挖掘、关系抽取技术和实体名消歧技术。此外，他还致力于对象级别的信息搜索技术以及语音语义一体化理解技术的研究。而且还被广泛应用于互联网搜索引擎、聊天机器人、以及智能助手等领域。

主要成果

微软学术搜索

微软学术搜索（Microsoft Academic Search）是微软研究院开发的免费学术搜索引擎。它为研究员、学生、图书馆馆员和其他用户提供了一个更加智能、新颖的搜索平台，方便用户查找学术论文、知名学者、国际会议、权威期刊等信息。同时，微软学术搜索作为一个研究试验平台，展现了研究院在对象级别垂直搜索、命名实体的提取和消歧、数据可视化等研究领域的最新研究成果。

微软人立方关系搜索

微软人立方关系搜索是由微软亚洲研究院网络搜索与挖掘组研发的对象级别（object-level）互联网搜索引擎。人立方关系搜索从超过十亿的中文网页中自动抽取出人名、地名、机构名以及中文短语，计算出它们之间存在关系的可能性，并索引了支持它们之间关系的网页文字。人立方关系搜索还自动找出人名之间最可能的关系描述词、与人名最可能相关的称呼、作品等词条，从网页中自动辨别出人名所对应的人物简介文字并进行排序。用户设定任意搜索关键词，它就能够找出与关键词最可能相关的人名、地名和机构名，并且根据它们与关键词之间的相关度排序。除此之外，人立方关系搜索还提供基于人名的新闻浏览功能，可视化关系搜索功能等。

发明专利

截至2021年，聂再清申请了近30项专利，已经授权的有5项全球专利、18项美国专利、和1项中国专利奖。

主要论文

截至2021年，聂再清发表了学术论文50余篇，以下为部分论文。

社会职务

人才培养

聂再清博士热衷于与来自各高校的硕士生、博士生和博士后进行科研合作。在微软亚洲研究院工作期间，他指导了八名实习生，并与高校合作培养了多名博士生。在阿里巴巴期间，他同样亲自指导博士后的科研工作，为培养新一代科研人才贡献力量。

社会活动

2022年12月10日，聂再清出席了人工智能合作与治理国际论坛（主论坛II-人工智能治理技术论坛），并发表了《可信AI技术与应用》的主旨演讲。聂再清教授表示：安全可信是人工智能治理核心诉求。2023年4月，接受搜狐科技《思想大爆炸-科学多面体》栏目的采访，表示中国至少要有一个大模型可以给咱们中国人使用，多一些做大模型的人是一件好事。4月19日，在以“大模型时代AI生物医药的创新融合”为主题的第三期AIR学术工作坊上，聂再清介绍了团队在生物医药领域大模型方向上的最新进展，并开源了轻量级科研版基础模型BioMedGPT-1.6B。

2023年8月，聂再清在“2023全球数字经济大会·云融技术创新引领论坛”上做了题为《AI大模型行业机遇与挑战》的主题报告，在会上指出：“触类旁通”和“智能涌现”能力，开启了通向通用人工智能之路的曙光，基础大模型+行业大模型会成为人工智能时代的操作系统，链接行业应用。并结合自己的工作实践，就大模型分别在自动驾驶和生物医药领域中的应用，分享了自己的见解，表示ChatGPT是一个非常具有影响力的进展，它有触类旁通的能力，让我们感觉到了通用人工智能时代的曙光。未来基础大模型一定会成为AI时代的操作系统。每个行业也都会有属于自己行业的垂直大模型，会把该行业的工具、数据总结在一起，解决行业里面的各种任务。

2023年12月，谷歌（Google）演示其最新出炉的多模态AI大模型Gemini，聂再清接受第一财经记者采访，表示：“大模型技术的发展比想象中快，虽然现阶段AI没有对人类造成即刻威胁，但确实需要更多关注如何保证机器能够一直服务于人，而不会反过来被坏人利用。”

所获荣誉

参考资料

1991-1996 清华大学计算机科学与技术学士.清华大学计算机科学与技术系.2023-12-09

AIR学术|开源轻量版BioMedGPT!聂再清:最终目标是生物医药领域基础大模型.清华大学智能产业研究院.2023-12-09

聂再清.清华大学智能产业研究院.2023-12-09

打开封面新闻，阅读体验更佳.封面新闻.2023-12-09

生成式AI上演“超级星期三”，科技厂商和监管各自祭出王牌.百家号第一财经.2023-12-09

学术搜索引擎简介.四川大学图书馆.2023-12-09

阿里巴巴人工智能实验室北研中心负责人聂再清: 智联网时代将减少低头族丨70年70人·科技⑧.手机凤凰网.2023-12-09

“人立方”搜索你的社会关系.新浪网.2023-12-09

微软亚洲研究院专家报告会之五聂再清博士报告会.中国科学技术大学计算机科学与技术学院.2023-12-09