CMMLU中文向排名第一!快手自研大模型来了, 在国外微软、谷歌和Met
08月23日 01:03
在国外微软、谷歌和Meta因为AI打得不可开交的时候,国内的互联网公司们也开始了新一轮的AI内卷。
(相关资料图)
一开始各家都想着自己要做出跟GPT一样的大模型,比如百度、360等大厂。但是算力、算法、数据这三大项,在国内的情况都心知肚明,根本和国外没得比。
尽管百度的文心一言、讯飞的星火还有360的智脑等等大模型都陆续上线,但是最后的效果都不怎么尽如人意。看到国内首屈一指的头部大厂都只能做成这样,一下子让不少公司回过味儿来,只要大模型能达到自己的需求就成,不去盲目拼什么参数和成绩,拼也拼不过。
前段时间,字节跳动代号为Grace的对话式AI项目,开启了内测。最近,这个名叫Grace的项目,改叫“豆包”了。在一众不是神仙就是神兽的AI面前,“豆包”倒显得有点可爱捏~
尽管字节的负责人说这个项目还不成熟,但是和抖音的结合还是值得期待。而另一边的快手,似乎也等不及要秀秀肌肉了。
最近频繁亮相的AI综合中文评估基准CMMLU等榜单上,一个KwaiYii-13B的模型成绩相当亮眼,更是一跃夺得CMMLU中文向排名第一!而这个KwaiYii-13B,就是来自快手的自研大模型“快意”(KwaiYii)。
异军突起的“快意”
在CMMLU榜单中,KwaiYii-13B同时位列five-shot和zero-shot项目下的中文向第一名,在人文学科、中国特定主题等方面较强,平均分超61分。
根据GitHub的页面显示,“快意”是由快手 AI 团队研发的大规模语言模型,而本次引发关注的正是其新版本 KwaiYii-13B。
目前,快意覆盖了预训练模型(KwaiYii-Base)、对话模型(KwaiYii-Chat),主要特点包括:
1、KwaiYii-13B-Base预训练模型具备优异的通用技术底座能力,在绝大部分权威的中/英文Benchmark上取得了同等模型尺寸下的State-Of-The-Art效果。
例如,KwaiYii-13B-Base预训练模型在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前处于同等模型规模的领先水平。
2、KwaiYii-13B-Chat对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明KwaiYii-13B-Chat超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近ChatGPT(3.5)同等水平。
据透露,快意目前已开启内测,并为业务团队提供了标准 API 和定制化项目合作方案。至于目的,明显是冲着字节的“豆包”去的。
哭死,这回豆包真成干粮了!
快手不光有“快意”
7 月 8 日,快手宣布正在内测智能问答产品。8月8日,快手就宣布“快手AI对话”开启小范围测试,而这俩其实都是基于“快意”大模型打造的对话式AI产品。
8 月 18 日,“快手AI对话”功能已经在快手 APP 安卓版本开放内测,成为短视频直播首个基于大语言模型落地的对话式AI产品。
在推出“快手AI对话”的时候,快手高级副总裁、研发线负责人于冰表示,AI大模型作为当下最重要的革命性技术,进入爆发期,有望开启AGI时代,而多模态内容生成与理解是其核心能力。
至于为什么要投入到这场AI大潮中去,于冰也有着这个行业的共同看法。他觉得短视频、直播作为最典型的多模态媒介,快手也应该抓住平台基因,在AI大模型领域重度投入,全方位探索技术突破。
他介绍说,目前,快手在AI大模型的布局体系分为三个层级:基于具备高性能、高并发、高算力的“大基建”,构建快手多模态的AI“大模型”,进而在搜广推、内容创作、用户增长、研发效能等领域内打造“大应用”。
有了AI辅助,影视创作的成本会明显地降低,周期也会缩短,这不管是对创作者来说还是对平台来说,都是好事,能形成良性循环。
短视频双雄的AI赛跑
字节有“豆包”,快手有“快意”。目前来看没有谁比谁强,只是侧重点相对不同。
“豆包”其实只是字节对外公开的AI对话大模型的一个模型而已,此外字节还提供“超爱聊天的小宁”“英语学习助手”“全能写作助手”三个不同的AI对话角色。
豆包大体上就和百度的文心一言一样,问答、续写、解析、推理等基础功能都有,主要还是内容生成服务。
而快手AI对话的功能主要是为用户提供快速、简便的查找功能,用户可以通过对话的方式来快速查找自己感兴趣的内容,也可以通过对话的方式找到对应的短视频、达人或是其他内容。
说人话就是,“快手AI对话”其实更像Bingchat,更多的充当一个搜索引擎,让用户去搜索快手内容库里的数据。快手和字节的差异主要在于算法优化和数据训练规模,训练数据越多,其智能化程度就越高。
结语
短视频平台在走过AI算法推荐的路子之后,在生成式AI的加持下,到底能玩出什么花来呢?
而现在短视频的同质化会不会因为AI的到来,有所改变,则是广大用户们更为关心的。
如果最后只是为了更方便直播带货,或者单纯为了让创作者更轻松,但不在乎质量,那这个AI,还不如没有。
关键词:
CMMLU中文向排名第一!快手自研大模型来了, 在国外微软、谷歌和Met
08月23日 01:03
升级超级能力及海量指令一图看懂小爱同学升级大模型
08月23日 01:03
为促进家校双方互通信息、建立共识,形成教育合力,全方位为学生服务,
08月23日 01:02
朱家,是一个真正侠义的人,他知道这个人是季布,但仍然买下了他。 朱
08月23日 01:03
据报道,小米计划在今年晚些时候推出小米14系列手机的两款新品,而该系
08月23日 00:56
大模型进入医疗领域:AI能替代医生吗?作者:董慧发于2023 8 21总第
08月23日 00:47
8月13日,前美国国家安全事务助理约翰·博尔顿在为华尔街日报撰写的专
08月23日 00:48
相信很多人都看过奥特曼吧?奥特曼可以说是在国内有着很高的人气,也是
08月23日 00:50
近日,2023年中国国际服务贸易交易会& 65381;环境服务专题媒体对接
08月23日 01:00
作者:张翼轸来源:雪球在A股市场,嘲讽证监会的救市举措,已经成为多
08月23日 00:53
女子20天被骗走400万全家积蓄被掏空深陷网络杀猪盘今天的关注度非常高
08月23日 01:01
每经AI快讯,有投资者在投资者互动平台提问:公司德国业务目前是否正常
08月23日 00:54
每经AI快讯,光伏产业链再度下挫,固德威跌超8%,阳光电源跌超6%,振邦
08月23日 00:51
仪式现场。红网时刻新闻8月21日讯(通讯员贺上升)“请念到名字的同学
08月23日 00:50
夏日生活给电视 每年夏天的衣服还是千篇一律,没有想过创新的小姐姐今
08月23日 00:52
天府大道北延线又有新进展
08月23日 00:52
海上训练中,中国自主研制的首艘两栖攻击舰海南舰舰长张美玉观察海空态
08月23日 00:49
【鲁泰A:海外高档面料产品线项目(一期)预计11月份主要生产】!!!今天
08月23日 00:43
很多人对暴的部首再查几画,暴的部首不是很了解那具体是什么情况呢,现
08月23日 00:51
08月23日 00:44
二、如何通过芯片测试座socket做芯片功能性测试?1 连接测试座soc
08月23日 00:46
以下是新华网在北京时间8月22日14:50分盘口异动快照:8月22日14点50分
08月23日 00:42
北京时间今天,世界羽毛球锦标赛在丹麦的首都哥本哈根开战。本届大赛也
08月23日 00:48
上市公司半年报陆续披露,不少被参股的公募基金上半年经营情况也曝光。
08月23日 00:42
据法媒《队报》报道,拜仁接受了国米对帕瓦尔的第二份报价,转会费2800
08月23日 00:45
2023年08月22日06时45分土耳其里拉 人民币汇率最新报价
08月23日 00:43
2022年退市股票名单一览表1、退市海医(600896):退市时间2022年7月26
08月23日 00:54
8月22日电综合外媒报道,当地时间8月21日,法官对英国护士露西·莱特比
08月23日 00:52
中新网8月22日电综合报道,当地时间21日,美国驻白俄罗斯大使馆在一份
08月23日 00:45
来源:媒体滚动转自:法治日报调查动机“酒精冰淇淋算不算酒?孩子能不
08月23日 00:39