加入收藏

CMMLU中文向排名第一!快手自研大模型来了

2023-08-23 01:03:40 来源:OFweek人工智能网

在国外微软、谷歌和Meta因为AI打得不可开交的时候,国内的互联网公司们也开始了新一轮的AI内卷。


(相关资料图)

一开始各家都想着自己要做出跟GPT一样的大模型,比如百度、360等大厂。但是算力、算法、数据这三大项,在国内的情况都心知肚明,根本和国外没得比。

尽管百度的文心一言、讯飞的星火还有360的智脑等等大模型都陆续上线,但是最后的效果都不怎么尽如人意。看到国内首屈一指的头部大厂都只能做成这样,一下子让不少公司回过味儿来,只要大模型能达到自己的需求就成,不去盲目拼什么参数和成绩,拼也拼不过。

前段时间,字节跳动代号为Grace的对话式AI项目,开启了内测。最近,这个名叫Grace的项目,改叫“豆包”了。在一众不是神仙就是神兽的AI面前,“豆包”倒显得有点可爱捏~

尽管字节的负责人说这个项目还不成熟,但是和抖音的结合还是值得期待。而另一边的快手,似乎也等不及要秀秀肌肉了。

最近频繁亮相的AI综合中文评估基准CMMLU等榜单上,一个KwaiYii-13B的模型成绩相当亮眼,更是一跃夺得CMMLU中文向排名第一!而这个KwaiYii-13B,就是来自快手的自研大模型“快意”(KwaiYii)。

异军突起的“快意”

在CMMLU榜单中,KwaiYii-13B同时位列five-shot和zero-shot项目下的中文向第一名,在人文学科、中国特定主题等方面较强,平均分超61分。

根据GitHub的页面显示,“快意”是由快手 AI 团队研发的大规模语言模型,而本次引发关注的正是其新版本 KwaiYii-13B。

目前,快意覆盖了预训练模型(KwaiYii-Base)、对话模型(KwaiYii-Chat),主要特点包括:

1、KwaiYii-13B-Base预训练模型具备优异的通用技术底座能力,在绝大部分权威的中/英文Benchmark上取得了同等模型尺寸下的State-Of-The-Art效果。

例如,KwaiYii-13B-Base预训练模型在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前处于同等模型规模的领先水平。

2、KwaiYii-13B-Chat对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明KwaiYii-13B-Chat超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近ChatGPT(3.5)同等水平。

据透露,快意目前已开启内测,并为业务团队提供了标准 API 和定制化项目合作方案。至于目的,明显是冲着字节的“豆包”去的。

哭死,这回豆包真成干粮了!

快手不光有“快意”

7 月 8 日,快手宣布正在内测智能问答产品。8月8日,快手就宣布“快手AI对话”开启小范围测试,而这俩其实都是基于“快意”大模型打造的对话式AI产品。

8 月 18 日,“快手AI对话”功能已经在快手 APP 安卓版本开放内测,成为短视频直播首个基于大语言模型落地的对话式AI产品。

在推出“快手AI对话”的时候,快手高级副总裁、研发线负责人于冰表示,AI大模型作为当下最重要的革命性技术,进入爆发期,有望开启AGI时代,而多模态内容生成与理解是其核心能力。

至于为什么要投入到这场AI大潮中去,于冰也有着这个行业的共同看法。他觉得短视频、直播作为最典型的多模态媒介,快手也应该抓住平台基因,在AI大模型领域重度投入,全方位探索技术突破。

他介绍说,目前,快手在AI大模型的布局体系分为三个层级:基于具备高性能、高并发、高算力的“大基建”,构建快手多模态的AI“大模型”,进而在搜广推、内容创作、用户增长、研发效能等领域内打造“大应用”。

有了AI辅助,影视创作的成本会明显地降低,周期也会缩短,这不管是对创作者来说还是对平台来说,都是好事,能形成良性循环。

短视频双雄的AI赛跑

字节有“豆包”,快手有“快意”。目前来看没有谁比谁强,只是侧重点相对不同。

“豆包”其实只是字节对外公开的AI对话大模型的一个模型而已,此外字节还提供“超爱聊天的小宁”“英语学习助手”“全能写作助手”三个不同的AI对话角色。

豆包大体上就和百度的文心一言一样,问答、续写、解析、推理等基础功能都有,主要还是内容生成服务。

而快手AI对话的功能主要是为用户提供快速、简便的查找功能,用户可以通过对话的方式来快速查找自己感兴趣的内容,也可以通过对话的方式找到对应的短视频、达人或是其他内容。

说人话就是,“快手AI对话”其实更像Bingchat,更多的充当一个搜索引擎,让用户去搜索快手内容库里的数据。快手和字节的差异主要在于算法优化和数据训练规模,训练数据越多,其智能化程度就越高。

结语

短视频平台在走过AI算法推荐的路子之后,在生成式AI的加持下,到底能玩出什么花来呢?

而现在短视频的同质化会不会因为AI的到来,有所改变,则是广大用户们更为关心的。

如果最后只是为了更方便直播带货,或者单纯为了让创作者更轻松,但不在乎质量,那这个AI,还不如没有。

关键词:

相关新闻

资讯

没想到,今年流行的“裙子”比宽裤还百搭!遮肉显瘦又时尚
没想到,今年流行的“裙子”比宽裤还百搭!遮肉显瘦又时尚

夏日生活给电视 每年夏天的衣服还是千篇一律,没有......更多>

CRM系统定制-CRM管理平台定制公司方案
CRM系统定制-CRM管理平台定制公司方案

CRM系统定制是企业在管理客户关系和提高销售效率方面......更多>

图解长城电工中报:第二季度单季净利润同比增4.58%
图解长城电工中报:第二季度单季净利润同比增4.58%

长城电工2023中报显示公司主营收入106亿元同比上升445......更多>

低买高卖奢侈品 被骗111万
低买高卖奢侈品 被骗111万

海沧警方破获一起“杀猪盘”案件,为受害者全额追回被......更多>

高碑店灾后重建一线见闻
高碑店灾后重建一线见闻

面对暴雨洪灾威胁,河北省高碑店市在灾前成功组织了10......更多>

郑州市回民高级中学举行基础教育国家级优秀教学成果推广应用工作培训会
郑州市回民高级中学举行基础教育国家级优秀教学成果推广应用工作培训会

基础教育国家级优秀教学成果推广应用工作培训会在郑州......更多>

梁靖崑被林高远超越,王皓接班人现世,他的反应太惊人了!
梁靖崑被林高远超越,王皓接班人现世,他的反应太惊人了!

梁靖崑被林高远超越,王皓接班人现世,他的反应太惊人......更多>

吃透弄通、高效落实!长风新村街道“五经普”培训进行时
吃透弄通、高效落实!长风新村街道“五经普”培训进行时

为切实做好第五次全国经济普查工作,提升“两员”业务......更多>

每天支付宝小鸡庄园答题答案:庄园小课堂今天答案5月14日庄园小课堂今天答案最新
每天支付宝小鸡庄园答题答案:庄园小课堂今天答案5月14日庄园小课堂今天答案最新

相信现在大家对于小鸡庄园每日问答都是非常关心的吧,......更多>

艺术之巅门槛安装与创意刻字完美结合
艺术之巅门槛安装与创意刻字完美结合

你需要的东西新门槛杠杆锤子和木块或橡胶锤钻头3 16......更多>

关注

文物里的故事丨“唐·湘思”:七夕携君梦回大唐
文物里的故事丨“唐·湘思”:七夕携君梦回大唐
07:47“君生我未生,我生君以(已)老。君恨我生迟,... 更多>
文物里的故事丨“唐·湘思”:七夕携君梦回大唐
07:47“君生我未生,我生君以(已)老。君恨我生迟,... 更多>
俄乌局势进展:荷兰、丹麦承诺向乌提供F-16战机 俄称挫败乌无人机袭击
中新社北京8月21日电综合消息:荷兰和丹麦政府当地时... 更多>
抖音“搅局”跨境电商
而且从整个行业角度,如上文所述,目前国内跨境进口电... 更多>
如何隐藏Excel图表坐标轴中的“0”刻度 excel 坐标 部分隐藏 刻度
通常Excel图表中坐标轴中会显示“0”刻度值,如果要隐... 更多>
qq游戏大厅安装包(qq游戏大厅安装)
来为大家解答以上问题,qq游戏大厅安装包,qq游戏大厅... 更多>
8月21日基金净值:鹏华双债保利债券最新净值1.168,跌0.33%
8月21日,鹏华双债保利债券最新单位净值为1 168元,... 更多>
天风证券原副总裁“八问”老东家
来源:阿尔法工场研究院导语:“去年因亏损严重被问责... 更多>
巧定计划促成长
北京市初一学生家长张女士  又到了放暑假的日子,现... 更多>
柬埔寨国民议会通过新一届政府内阁名单
当地时间8月22日上午,据柬埔寨通讯社消息,柬埔寨国... 更多>
李光洁隋雨蒙七夕官宣二胎,幸福甜蜜
李光洁妻子隋雨蒙在社交平台晒照,官宣二胎,李光洁转... 更多>
国家统计局:2022年我国经济发展新动能指数比上年增长28.4%
为动态监测我国经济发展新动能变动情况,国家统计局统... 更多>
17家机构拟大手笔自购 看好A股中长期表现
业内人士表示,A股目前处于多周期共振的底部区域,无... 更多>