“讯飞星火认知大模型”是
于2023年5月6日发布的产品,它具有七大维度的能力,包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力,其中在文本生成、知识问答、数学能力上取得较好的成效。截至2023年8月,该产品已在教育、办公、汽车及数字员工四大领域发布相关应用成果。
“讯飞星火”APP是一款搭载讯飞星火认知大模型核心底座能力的“超能助手”应用,其不但拥有跨领域的知识和语言理解能力,还能够基于自然对话方式理解与执行任务。截止至2023年11月24日,讯飞星火APP用户数量已超过1200万,其助手功能在“职场、营销、出行、生活、公文、客服”等场景都有涉及。
2023年5月9日,中文通用大模型综合性评测基准SuperCLUE发布,讯飞科技研发的星火认知大模型位列全球第三、中国第一。
发展历程
2022年12月,
科大讯飞启动“1+N”大模型技术攻关。其中, “1”指的是通用认知智能大模型算法研发及高效训练方案底座平台, “N”指的是将认知智能大模型技术应用在教育、医疗、
、办公、翻译等多个行业领域。
2023年4月24日,
星火认知大模型官网正式上线,并开展
需求调研,部分用户还进行了内测体验。在调研页面,讯飞星火认知大模型大模型依托于用户个人信息,更好地与用户的需求进行匹配,与此同时,在行业应用场景上,大模型给予用户在“办公、客服、营销、金融、媒体、汽车、教育、医疗”等方面重点领域的选择。
2023年5月6日,
科大讯飞旗下的讯飞星火认知大模型V1.0发布,作为以中文为核心的认知智能大模型,在多领域多任务上可基于自然语言对话的方式实现用户需求理解与任务执行。讯飞星火认知大模型不仅能够在与人对话互动的过程中,为用户提供文本、语言理解、知识问答、逻辑推理、数学思维、代码理解等多种能力,而且能够持续从
海量数据和大规模知识中不断学习进化。与此同时,讯飞星火认知大模型一经发布,科大讯飞就确定了2023年的三个阶段目标:6月9日,明显提升开放式问答和多轮对话的能力、再升级数学能力;8月15日,进行代码能力、多模态交互能力的升级;10月24日,实现通用模型对标
ChatGPT,并且达到中文能力超越ChatGPT,英文能力与ChatGPT相当。
2023年5月9日,中文通用大模型综合性评测基准SuperCLUE正式发布,该基准测试主要关注三大问题,包括中文大模型在不同任务上的表现、相较国际代表性模型中文大模型的表现达到的程度,以及中文大模型相较人类的表现。此测试中讯飞科技研发的星火认知大模型则位列全球总榜第三、中国第一。
2023年6月9日,
科大讯飞星火认知大模型V1.5正式发布,与此同时,讯飞星火开放式知识问答有所突破,多轮对话能力、逻辑能力与数字能力也有所升级。对于开放式知识问答,
科大讯飞总裁
吴晓如认为“大模型真正强大之处在于以自然语言理解为核心,结合类搜索等
插件能力,从而解决更加复杂的问题。”通过结合大模型的语言理解能力、概括表达能力以及类搜索插件,讯飞星火认知大模型的开放式知识问答能力得到增强,与此同时,多轮对话能力的提升,也让对话体验更接近真人,比如模拟面试官,通过多轮对话与追问,为用户提供仿真的面试场景。在长链条思维推理和数理逻辑推理能力的加持下,
科大讯飞星火认知大模型面对各类数学逻辑难题可以综合应用各种数学方法,并给出用户答案,比如农夫、狼、羊、菜过河问题,直线相交问题,概率问题等。
2023年6月20日,
科大讯飞星火认知大模型联合C端智能硬件在新加坡成功举办产品发布会暨讯飞AI TechDay·新加坡站活动。
2023年6月28日,讯飞AI TechDay ·
无锡站暨科技生活成果分享会成功举办。在该分享会上,科大讯飞开放平台研发部总监郑贵指出,在AI工程技术面临着“智能涌现”等新挑战的背景下,科大讯飞推出了讯飞大模型研发服务一体化平台——讯飞火石平台以及讯飞认知大模型,并提到了星火认知大模型已实现PC、H5、APP、小程序全端覆盖,全新打造的Prompt“应用开发”场景,可与用户共创星火助手。
2023年7月6日,科大讯飞高级副总裁、认知智能全国重点实验室主任胡国平在昇腾
人工智能产业高峰论坛上,公布了讯飞与
华为的合作。胡国平指出,“中国大模型安全和发展的关键是,基于自主创新的硬件及软件的大模型生态快速进步。”中国大模型研发高度依赖高端AI芯片、集群及生态,然而单AI芯片进步速度还未跟上大模型对大算力的需求。因此科大讯飞为了实现打造中国通用智能新底座,并保证大模型算力的安全可控,一方面,以昇腾AI为核心,软硬件协同优化,另一方面,基于训练推理一体化设计实现大模型稀疏化、低精度量化的技术突破,并且高效适配昇腾AI,构建了算力集中、供给稳定、数据安全的大模型训练集群。与此同时,讯飞星火形成了立体化的‘内容安全’保障机制,解决了内容安全方面的问题。
2023年8月12日,据
新华出版社研究院中国企业发展研究中心发布的《人工智能大模型体验报告 2.0》显示,讯飞星火在被报告选取的8种大模型产品中以1013的总分位列第一,其AI大模型智商指数、AI大模型提效指数均排名第一。
2023年8月15日,
科大讯飞旗下的讯飞星火认知大模型V2.0正式发布,同时发布和升级的还有搭载讯飞星火认知大模型V2.0能力的多项应用和产品,比如“代码生成、图片生成、视频生成、星火
插件”等新功能,另外该大模型还升级了发布代码能力和多模态能力。科大讯飞董事长
刘庆峰指出,“讯飞星火V2.0代码能力实现大幅度提升,从业界参考测试集上的效果对比来看,星火V2.0基于
Python和
C++进行代码写作能力已高度逼近ChatGPT,差距仅为1%和2%。”从Python语言的代码生成、补齐、纠错、解释和单元测试生成这几个维度都可以看到,讯飞星火V2.0代码生成和补齐已经超过了Chat GPT,其他几项能力也在快速追赶中。其中,讯飞星火认知大模型2.0版本中,文本生成能力提升了72%,语言理解能力了提升78%,知识问答能力提升了70%,逻辑推理能力提升60%,数学能力提升72%。
2023年8月17日,在《麻省理工科技评论》中国发布的大模型评测报告中,讯飞星火认知大模型V2.0依托于自然语言处理、语音识别、图像识别等领域的强大的处理能力在评测中以81.5的总分位列第一。该评测使用的测试集包含600道题目,覆盖了语言专项、数学专项、理科综合、文科综合、逻辑思维、编程能力、综合知识、安全性共8个一级大类。
2023年9月5日凌晨,讯飞星火认知大模型正式向全民开放,星火API、星火助手与星火
插件均已全面开放,用户可以通过各大应用商店下载“讯飞星火”APP或在“讯飞星火”官网进行注册后直接使用。上线之初,讯飞星火认知大模型便与超过10000家企业合作对接,诞生了超过12000款AI助手应用,覆盖多种应用场景,包括营销、创作、编程、聊天、学习、推理等场景。除了软件之外,C端软硬件也纷纷落地应用,比如
科大讯飞AI学习机、讯飞智能办公本、
讯飞听见、星火语伴等。
2023年10月24日,讯飞星火认知大模型V3.0在
第六届世界声博会暨2023科大讯飞全球1024开发者节上正式发布。科大讯飞的董事长
刘庆峰认为"大模型想要赋能民生百业,需要实现从多轮对话、主动对话再到启发式对话的跨越",并指出"大模型不仅要有专业的知识,还要具备个性化的AI人设"。因此在应用场景方面,讯飞星火认知大模型面向不同的受众群体分别推出了星火科研助手、AI心理伙伴、
科大讯飞星火医疗大模型,以及业界首个集“大模型+具身智能”一体的人形机器人。另外讯飞星火认知大模型V3.0新增了虚拟人格功能,用户可对其进行人格赋予从而使大模型具有个性化的表达风格和情绪,除此之外,还可以对讯飞星火认知大模型V3.0进行特定历史知识和历史的聊天记录的导入,让大模型形成个性化的记忆。
2023年11月13日,据有关报道显示,
科大讯飞进一步升级了讯飞星火认知大模型V3.0,比如数学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力。然而与
GPT-4相比,讯飞星火认知大模型V3.0在复杂知识推理、小样本快速学习、超长文本处理等方面与其还存在差距。与此同时,为了实现2024年上半年对标GPT-4,科大讯飞正式启动了更大参数规模的星火大模型训练,并联合了昇腾生态共同发布“飞星一号”大模型算力平台。
2023年11月20日,据新华社研究院中国企业发展研究中心最近发布的年度第三份关于大模型的评测报告——
人工智能大模型体验报告3.0评测结果显示,由
科大讯飞研发的讯飞星火认知大模型在人工智能大模型评测中获得1775的最高分,并在基础能力指数、智商指数、工具提效指数三项评测指标中获得第一,这次评测中主流大模型综合指数3.0是以“技术实力”和“发展潜力”为坐标系,选取了包括讯飞星火在内的10家最新版本国产主流大模型产品。值得一提的是讯飞星火曾在同年8月的《人工智能大模型体验报告2.0》中获得总分、智商指数和工具提效指数的第一。
功能与服务
核心功能
多模交互
多模交互涉及了多模理解、视觉问答、多模生成、虚拟人视频四种功能。用户上传图片素材以后,大模型进行识别理解,然后返回关于图片的准确描述,从而实现多模理解,与此同时,视觉问答可围绕着用户已上传的图片素材响应、回答用户的问题。多模生成以及虚拟人视频则是根据用户的描述,生成符合用户期望的合成音频和视频,而且用户可以描述期望的视频内容,整合AI虚拟人,快速生成匹配视频。
代码能力
代码能力包括代码生成、代码解释、代码解释以及单元测试。讯飞星火认知大模型能够智能生成单行、函数级代码建议或者根据注释、函数名自动生成代码。用户如果需要精准解读代码,讯飞星火认知大模型的代码解释功能可以将类、函数及其作用逐一详解,并支持逐行代码注释。如果用户需要对代码进行查漏补缺,讯飞星火认知大模型的可精准定位拼写、语法、逻辑错误,并支持新老代码比较、一键修改,实现代码纠错的功能。用户如果想要对代码进行单元测试,只需要选中代码,便可一键生成单测用例、多主流单元测试框架,并智能生成单元测试数据。
文本生成
讯飞星火认知大模型可生成各类文本,包括商业文案、营销方案、英文写作、新闻通稿。比如根据用户要求,创作各式各样内容丰富的商业文案、营销方案, 也可以根据新闻要素,创作严谨详实的新闻通稿,并且能够使用英文实现多风格、多任务的的长写作任务。
数学能力
讯飞星火认知大模型具备多题型解析的数学能力,可以综合应用各种数学方法对不同类型的数学题目进行解答,包括方程求解、几何问题、微积分以及概率统计。
语言理解
讯飞星火认知大模型可实现多层次跨语种语言理解,包括机器翻译、文本摘要、语法检查以及情感分析。机器翻译支持多种常用语种的翻译,包括中文、英语、
法语等。文本摘要则是根据文本内容提取简洁而准确的摘要,帮助用户快速理解文章的核心观点。语法检查功能可以检查文本的语法错误并给用户提供正确的语法建议。情感分析指的是通过分析文本中的情感色彩,如正面、负面或中性,从而帮助用户更好去了解文章内容的观点和态度。
知识问答
讯飞星火认知大模型的知识问答涵盖了用户日常所需要了解的生活常识、工作技能、医学知识以及历史人文模块,并可以为用户提供有关日常生活、工作方面的知识、基本的健康保健知识以及疾病预防、诊断和治疗方面的建议以及有关历史事件、文化传承、名人故事、名言警句等方面的文案。
逻辑推理
讯飞星火认知大模型的逻辑推理包括思维推理、科学推理以及常识推理。思维推理指的是通过分析问题的前提条件和假设来推理出答案或解决方案,给出新的想法和见解;科学推理指的是使用已有的数据和信息进行推断、预测和验证等科学研究中的基本任务;常识推理指的是在进行对话交流时,运用已有的常识知识来分析、解释和回应用户的提问或需求。
其他功能
星火助手
星火助手包括了成千上万的智能助手,比如PPT大纲助手、标题达人、模拟面试助手、市场分析师、周报小助理、文本扩写、小说合成助手、代码工程师等,具备强大的文本生成能力,并深入了各类场景去解决用户的刚需问题,用户可以在星火助手中找到适合自己的场景,寻求帮助。
语音输入及播报功能
用户通过语音输入对大模型发起指令的同时对大模型对话框下方“播放按钮”进行点击后,即可使文本内容实现自动阅读。此外,在设置选项中用户还可以对中英文发音人和语速进行切换和调节,而安卓端的用户还可以通过输入“#spark talking”指令来开启纯享语音对话模式。
指令模板推荐功能
用户可以通过指令模板推荐功能来快速地制作指令并驱动大模型来进行精准优质的回答。系统会根据用户在讯飞星火认知大模型对话框输入的“/”符号来为用户推荐指令模板,并以用户输入的关键词来匹配更精准的模板,该功能提升了用户与大模型的交互效率。
图片输入功能
大模型会对用户发送图片中的内容进行识别、翻译、理解,同时用户可针对图片的信息与大模型进行对话和追问。
虚拟人格功能
虚拟人格功能可以根据性格模拟、情绪理解、表达风格来形成一个初始的人设,并结合特定知识学习、对话记忆学习来形成一个更个性化的AI人设,而虚拟人格应用“星火友伴”已上线,用户可以通过友伴来进行人格的创建。
实时搜索
实时搜索功能大幅提升回答当下热门事件的能力,其可以根据用户输入的相应搜索热词来提供准确的回答,该紧跟实事的功能大幅提升了讯飞星火的可玩性和实用性。
基本服务
星火API接入
星火API接入服务具备高效处理、持续进化、个性化定制、安全可靠的特点。一方面星火API采用了流式的接口设计,首帧响应最快可达毫秒级,另一方面因其借助了高效算法与架构,能在极短时间处理大量用户请求。星火API具备多元的能力,而且能够持续从
海量数据和知识中学习与进化。个性化定制指的是星火API能够提供丰富的参数设置,从而实现个性化的模型体验以及专属的模型解决方案。安全可靠则是因为星火API采用了千亿级流量的公有云架构,并结合数据加密与访问控制等多重手段确保用户隐私安全,使得云服务达到等保三级标准。
插件市场可以实现和讯飞星火认知大模型其他业务系统的交互,极大地拓展大模型的功能和应用范围,包括拓展模型的应用场景、帮助模型获取最新资讯以及为企业提供定制化需求。拓展模型的应用场景指的是插件可以使讯飞星火认知大模型能够适应更多的场景和需求,如实时天气查询、电影票预订等,让用户无需离开聊天窗口就能完成这些任务。帮助模型获取最新资讯指的是对于一些可能过时的信息,插件可以帮助大模型接入互联网,并且获取到特定领域的最新咨询。为企业提供定制化需求指的是
插件可以让大模型为企业提供定制化的解决方案,提供私有化部署的插件,保证大模型查询内部信息的安全性、隐私性,从而使其能够更 好地服务于特定的行业和用户。
应用领域
营销行业
讯飞星火认知大模型可以通过对大量营销数据进行分析并挖掘来为营销策略制定提供有力支持,最终实现精准营销,另外大模型还会结合智能语音和语言理解技术来提高客户服务效率和用户体验,其内容生成和语言理解的能力能帮助实现智能营销文案创作和创意生成,同时还会给营销领域提供更高效、智能的运营管理。
文旅行业
讯飞星火认知大模型可以把其语义理解和自然语言生成的能力与语音、虚拟人等技术相互结合来为游客提供语音交互和对话服务,以此来满足游客的各种需求,同时大模型还可以给用户提供天气、路线、景点等实时信息查询以及餐饮、住宿等服务推荐,另外还会提供个性化的旅行建议,以此来丰富用户的旅行体验。
航空行业
航空行业中,讯飞星火认知大模型可以结合飞行安全、飞机运维知识库来实现飞行安全的监控、机场运营优化、航班调度、乘客服务等功能,从而提升飞行安全性,实现智能化机场和客舱服务,提高航空系统运营效率。
运输行业
讯飞星火认知大模型可以通过物流运输数据和信息的深度学习及自然语言处理技术来对物流运输的数据进行智能分析和预测,并对货主和司机进行智能匹配调度以及为
物流企业提供决策支持和智能化服务。
教培行业
讯飞星火认知大模型能够以教培行业的智能培训师和辅导员的角色来帮助解决企业员工实际工作中遇到的问题、丰富企业的学习资源和课程内容,同时结合企业的内部系统来实现个性化推荐,以此帮助企业员工提升学习效率和学习体验。
金融行业
讯飞星火认知大模型应用于金融领域的风险控制、投资管理、客户服务、
产品设计、欺诈监测等多个环节,在这些环节中,大模型通过风险评估、投资建议、流程自动化等功能来帮助金融机构更准确地评估风险并及时做出更明智的业务决策,同时还能给用户提供更个性化的服务。
汽车行业
在汽车行业,
科大讯飞为数千个车型提供业界领先的智能语音交互服务,提供多轮、多人、多区域、多模态的语音交互。截至2023年8月,科大讯飞累计服务用户超过4610万,在中国汽车智能语音应用市场保持占有率第一。2023年11月14日,据有关报道显示,讯飞星火已与奇瑞、
广汽集团、
长城汽车、长安等几十家车企及合作伙伴建立合作关系,合作内容包括汽车AI星火生态的构建以及中国汽车产业智能化革新的共同推动,同时会继续落实大模型在汽车领域的深度运用。这也标志着讯飞星火在汽车行业取得有效进展。
影响评价
2023年11月,据国研经济研究院的一项横评报告显示,星火大模型3.0版的综合能力超越ChatGPT3.5,其在医学、法律、教育、零售、汽车工程、
计算机和
工业设计等行业领域的准确率分别达到69.3%、71.4%、82.2%、61.2%、78.4%、76.9%和66.4%。
根据OpenAI在其官网发布的英文任务测试集测试数据并通过比较星火认知大模型V3.0与ChatGPT可以发现,星火认知大模型V3.0在48项任务中已经做到了85.1%,略微领先ChatGPT的84.3%;而在《通用认知智能大模型评测体系》构建测试集测试中,星火认知大模型V3.0的中文能力经过客观评测已经超越ChatGPT。