业界首个!说一句话就能复刻声音!“合肥造”认知大模型再度升级

合肥在线2024-04-27  21

导读:4月26日,“合肥造”认知大模型——讯飞星火大模型V3.5(以下简称“讯飞星火”)春季“上新”。面向用户高效准确知识获取的痛点,科大讯飞发布业界首个长文本、长图文、长语音大模型,不仅能够把各种信息来源的海量文本、图文资料、会议录音等进行快速…

4月26日,“合肥造”认知大模型——讯飞星火大模型V3.5(以下简称“讯飞星火”)春季“上新”。面向用户高效准确知识获取的痛点,科大讯飞发布业界首个长文本、长图文、长语音大模型,不仅能够把各种信息来源的海量文本、图文资料、会议录音等进行快速学习、归纳总结,还能够在各种行业场景中给出专业、准确回答。

为什么科大讯飞要推出长文本、长图文、长语音的大模型?科大讯飞董事长刘庆峰介绍,通过讯飞星火APP收集到的用户数据,大部分用户在知识获取和学习的过程中,拿到的资料往往是报刊书籍等长文本,还有各种会议的PPT、笔记、录音和视频等。

能不能把这些文本、图片、语音等都上传到讯飞星火中,快速地获取知识?对此,科大讯飞推出首个支持长文本、长图文、长语音的大模型,来解决用户真实场景中多源信息的获取需求。

本次讯飞星火长文本功能全新升级后,具备长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等能力,总体已经达到GPT-4 Turbo 4月最新长文本版本的97%水平。值得一提的是,在银行、保险、汽车、电力等多个垂直领域的知识问答任务上,讯飞星火长文本总体水平已经超过GPT-4 Turbo。

面对上百万甚至上千万的文字,长文本大模型消耗的运算资源非常大。为了解决大模型应用效率和准确率问题,刘庆峰介绍,基于讯飞星火V3.5对长文本的理解、学习、回答能力,科大讯飞进行了重要的模型剪枝和蒸馏,从而推出业界性能最优的130亿参数的大模型,在效果损失仅3%以内的情况下,使得星火在文档上传解析处理、知识问答的首响时间以及文字生成方面都获得了极大的效率提升。

测试显示,在保障长文本效果的情况下,无论是10K、64K、128K token,还是更长的文本上,星火大模型的性能都做到了业界最优。

此外,这次讯飞星火的升级,还首发了多情感超拟人合成,具备情绪表达能力,并推出一句话声音复刻功能,让科技更有温度。

合肥通客户端—合报全媒体记者 刘小容

本文来自“合肥在线”,版权归原网站所有,点击阅读原文

本文地址: https://www.5ihefei.com/read-63814.html
免责声明:本文仅代表作者个人观点,与合肥生活网(本网)无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
    本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表合肥生活网(本网)赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们联系,本网站将在规定时间内给予删除等相关处理.


为您推荐

最新回复(0)