唐杰,四川南充人,出生于1977年1月,清华大学
计算机科学与技术系长聘教授,计算机系副主任、清华工程院知识智能联合实验室主任,国家杰出青年基金获得者。
唐杰2002年于
燕山大学获得计算机科学与技术专业硕士学位;2006年获得清华大学计算机科学与技术专业工学博士学位,并留任清华,开始从事社会网络影响力模型研究以及智能型科技情报挖掘的研究,直至2015年取得了阶段性的成果。2012年,唐杰获得国家自然科学基金优秀青年科学基金资助。 2013年,唐杰受聘为
安徽大学讲座教授。2015年,唐杰开始考虑下一个研究方向。2018年,他确定了要做认知智能方向的研究。同年,唐杰获得国家自然科学基金杰出青年科学基金资助。2019年,其成为
清华大学计算机系
微众银行讲席教授。2020年11月,唐杰当选国为际电气和电子工程师学会会士。2022年1月,其当选为国际计算机学会会士。2023年1月,唐杰当选国际人工智能促进协会会士。
唐杰研究领域包括
人工智能、社交网络、
数据挖掘、机器学习、知识图谱。其研发出的网络挖掘与搜索系统ArnetMiner,收集了175万名研究者信息、400多万篇论文信息、5400多万条引用关系和8000多个会议信息,并在学术界得到了广泛的应用,吸引全球220个国家/地区2000多万用户独立IP的访问量;主持研发了超大规模预训练模型“悟道”,参数规模超过1.75万亿。唐杰发表论文730余篇,被引43671余次,H-index为102,曾获ACM SIGKDD Test-of-
时间 Award(十年最佳论文)。曾获国家科技进步
二等奖、北京市专利奖
一等奖、
中国计算机学会夏培肃奖青年科学家奖、北京科技新星、
清华大学优秀员工等荣誉。
唐杰出生于
四川省,
高中时物理成绩优异。他的父亲发现他对
无线电、编程感兴趣,便给他买了人生中第一台可编程学习机,唐杰与
计算机的缘分由此开始。
之后,唐杰本科在
燕山大学学习自动化专业,后来还是因为喜欢计算机、喜欢编程,硕士又转为计算机专业。2002年,唐杰进入清华大学
计算机科学与技术专业攻读博士,师从
王克宏教授,博士期间主要从事语义Web和
数据挖掘等相关研究。
2006年唐杰博士毕业,并留任
清华大学,开始一直从事社会网络影响力模型研究以及智能型科技情报挖掘的研究,直至2015年取得了阶段性的成果。2012年,唐杰获得国家自然科学基金优秀青年科学基金资助。2013年,唐杰受聘为
安徽大学讲座教授。
2021年3月和6月,时任智源研究院学术副院长的唐杰,作为“悟道”模型技术委员会主任,带队先后发布了中国首个超大规模智能模型“悟道1.0”和“悟道2.0”。2023年8月,基于唐杰团队的开源双语预训练模型,
北京智谱华章科技有限公司推出了生成式AI助手“智谱清言”上线,并具备“通用问答、多轮对话、
创意写作、代码生成以及虚拟对话”等能力。
2006年,唐杰率领团队建立了AMiner(),即科技情报
大数据挖掘与服务系统平台,这是一个具有完全自主知识产权的新一代科技情报分析与挖掘平台。之后十年,唐杰一直在此基础上,不断地提出问题、解决问题、完善系统。AMiner自2006年上线以来,服务于全球科研人员,覆盖了220个国家和地区3000多万独立IP用户,服务21万余家企事业单位及各类机构,提供科研数据下载230万次。平台为中国工程院、国家自然基金委、科技部等科研管理部门提供专家智库、科技发展战略规划等科技情报挖掘服务。唐杰也因此项研究获得了诸多荣誉——国家科技进步
二等奖、北京市科技进步
一等奖、
北京市发明专利奖一等奖、
中国人工智能学会科技进步一等奖、KDD'18杰出贡献奖等。
2021年3月和6月,唐杰带队先后发布了中国首个超大规模智能模型“悟道1.0”和“悟道2.0”。2023年8月,基于唐杰团队的开源双语预训练模型,
北京智谱华章科技有限公司推出了生成式AI助手“智谱清言”,截至2024年4月已具备“通用问答、多轮对话、
创意写作、代码生成以及虚拟对话”等能力,未来还将开放
多智能体等更多功能。
截止2024年初,唐杰从事认知智能领域的研究已经五年了,他主持设计了拥有完整知识产权的大模型技术体系GLM,研发了千亿级开源双语预训练模型GLM-130B,性能与GPT-3原版基座模型相当,目前全球已有70多个国家上千家机构申请使用。开源的ChatGLM全球下载超过1000万,在开源网站
GitHub上Star数超过LLaMA,达到5万;2023年获HuggingFace评选的全球最受欢迎开源机构第五名(国内唯一上榜,超过
微软、Open AI、
谷歌等机构)。
唐杰连续三届担任
燕山大学信息科学与工程学院讲座教授,指导硕士研究生,培养青年教师。他推动
清华大学和
燕山大学共同承担国家重大战略需求(包括国家安全局、军委科技委等),并开展国家级科研项目以及校企产学研的深入合作,还前瞻性地提倡创建“
北戴河区知识·智能论坛”,搭建国际性的科研学术交流及沟通平台,为促进燕山大学计算机学科的建设与发展贡献了重要力量。
据2024年9月清华大学教师个人主页数据,唐杰已培养毕业本科生80余位,毕业硕士生30位左右,毕业博士生10位左右。学生的毕业去向包括:
麻省理工学院、
卡耐基·梅隆大学、美国
斯坦福大学、
加利福尼亚大学伯克利分校、美国
哥伦比亚大学、
密歇根大学、美国
佐治亚理工学院、美国
伊利诺伊大学厄巴纳-香槟分校厄巴纳—香槟分校、美国
康奈尔大学、
南加州大学、
纽约大学、
普林斯顿大学、帝国理工学院、
清华大学、
北京交通大学、中山大学、浙江大学、
中国人民大学、
青海大学、
字母控股、推特公司、
旷视科技公司等。
据2024年9月AMiner平台数据,唐杰在《IEEE知识与数据工程汇刊》(IEEE Transaction on Knowledge and Data Engineering)、《ACM知识发现与数据挖掘国际会议》(ACM SIGKDD International Conference on Knowledge Discovery and
数据 Mining)、《网络搜索与数据挖掘国际会议》(International Conference on Web Search and Data Mining)等
学术期刊和会议发表论文730余篇,被引43671余次,H-index为102。其论文曾获ACM SIGKDD Test-of-
时间 Award(十年最佳论文)。
唐杰热爱运动,喜欢迎接挑战,其中包括
芝加哥马拉松赛和铁人三项等运动。此外,他还喜欢潜水、赛车,射箭,爱看心理学和哲学的书籍。
唐杰抱利他之心,行利他之事,顶天立地,造福社会。(
北京大学王选计算机研究所 评)
唐杰对信息和社交网络挖掘作出了贡献(For contributions to information and social network mining)。(国际
计算机学会 评)