发布日期:2025-02-26 04:09 点击次数:172
昨晚,杭州大模子又双叒不睡,给大伙儿 拜 年 啦~
就在春晚直播进行时,阿里通义 Qwen 发布新春节礼第三弹:
Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡 DeepSeek V3。
Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond 等基准完全拿下,Qwen2.5-Max 合座阐扬优于 DeepSeek V3、Llama-3.1-405B 以及闭源模子 GPT-4o,和 Claude-3.5-Sonnet 也能比一比。
基座模子对比中,Qwen2.5-Max 相通超越 DeepSeek V3、Llama-3.1-405B,在针对模子常识意会和推理才调的 MMLU-Pro 等基准上均阐扬出奇。
更令 AI 社区眷注的是,Qwen2.5-Max 同 DeepSeek V3 一样是超大限制的 MoE 模子,经超 20 万亿 token 的预磨砺数据及悉心策画SFT+RLHF 后磨砺决策磨砺而成。
Qwen2.5-Max 这份春节礼包被网友们皆刷刷收入囊中。前有 DeepSeek,还有阿里通义 Qwen,网友们不忘艾特奥特曼:
祝人人新年好意思瞻念,相配祝 Sam。
阿里辩论员在模子发布后也都还不睡,纷繁当起了自个儿的自来水。
阿里高等算法人人林俊旸开麦:
Qwen2.5-Max 在基准测试中阐扬精好意思,但愿人人不错碰运道,新年好意思瞻念!
之前曾自曝阿里大模子职工 996 作息表的 Binyuan Hui 也再次现身:
外面的烟花照亮了天外,我却坐在电脑跟前。
底下是 Qwen2.5-Max 在四个使用场景上的演示。
领先是联网搜索功能,输出的每句话开头出处都有标注,合座运转也很丝滑。
代码才调上,Qwen2.5-Max 粗略匡助用户完成多样可视化创作,一句话就能作念出底下这么旋转的球体:
有网友矫正了一下,让球体里面有三个弹跳的黄色小球。
恶果只尝试了一次就胜利了,而且三个小球长久在大球里面指引,能正确处罚碰撞:
Qwen2.5-Max 也有Artifacts功能,相通一句话,能成就多样小哄骗、小游戏。
比如制作一个扫雷小游戏,秒秒钟"啪"一下平直就能玩:
另外 Qwen2.5-Max 数单词中的特定字母数目也不在话下。
当今,Qwen2.5-Max 已在 Qwen Chat 中上线。
此外也有 Hugging Face 的 Demo 可玩,还上线了 Any Chat,何况可通过阿里云工作使用 API。
感酷爱的童鞋迅速试试吧~
参考一语气:
[ 1 ] https://qwenlm.github.io/blog/qwen2.5-max/
[ 2 ] https://x.com/JustinLin610/status/1884263803451498794
[ 3 ] https://x.com/_akhaliq/status/1884278071093502253
[ 4 ] https://x.com/huybery/status/1884263539675934860🔥买球·(中国大陆)APP官方网站
Powered by 🔥买球·(中国大陆)APP官方网站 @2013-2022 RSS地图 HTML地图