分享好友 最新资讯首页 最新资讯分类 切换频道
我用Qwen3-Coder和Kimi k2打了个PK,它真的更强了!
2025-07-29 15:04

作者|子川

来源AI先锋官


建议直接把“卷王”的称号直接焊在阿里千问团队的头上!

昨天还在感叹Qwen3-235B-A22B登顶开源模型,没想到今天又放了个大招——Qwen3-Coder!

相关阅读:

重要的是,效果针不戳,实测下来,速度贼快!

在 Agentic Coding(智能体编程)、Agentic Browser-Use(智能体浏览器使用)和Agentic Tool-Use(智能体工具调用)这些 Agent 评测中。

Qwen3-Coder 刷新了开源模型纪录,甚至超越了 GPT-4.1,直接登顶开源编程模型的宝座。

可以与 Claude Sonnet4 媲美。

图片

Qwen3-Coder包括多个尺寸,其中此次开源的是最强版本Qwen3-Coder-480B-A35B-Instruct。

这是一个450B的MoE模型,其中激活参数为35B,支持 256K 上下文,并且可以通过 YaRN 扩展到 1M 长度。

可能很多朋友不了解YarN,这里给大家简单介绍一下。

YaRN(Yet another RoPE extensioN method)是一种计算高效的上下文窗口扩展方法,用于解决基于Transformer的语言模型(如LLaMA、GPT-NeoX等)在训练后无法泛化到比训练时更长的序列长度的问题 。

简单来说:YaRN 的作用就是让 AI 模型在不重新训练整个模型的情况下,直接能处理的文字长度变长,比如把原本只能回答 2 千字的问题,扩展到能回答 2 万字的问题。

好了,废话不多说,此次开源的Qwen3-Coder到底有多强?

老规矩,我们亲手测一测,看看它是不是真的有官方说的那么厉害,这次直接上代码题!

顺便和kimi k2打个PK。

先来一道经典测试题,天气卡片。

提示词:Create a single HTML file containing CSS and JavaScript to generate an animated weather card. The card should visually represent the following weather conditions with distinct animations: Wind: (e.g., moving clouds, swaying trees, or wind lines) Rain: (e.g., falling raindrops, puddles forming) Sun: (e.g., shining rays, bright background) Snow: (e.g., falling snowflakes, snow accumulating) Show all the weather card side by side The card should have a dark background. Provide all the HTML, CSS, and JavaScript code within this single file. The JavaScript should include a way to switch between the different weather conditions

Qwen3-Coder:

kimi k2:

从呈现出的效果来看,Qwen3-Coder和kimi k2都把天气卡片这个任务跑通了,但Qwen 3的审美明显要比kimi要高出不少。

再来一个,让它们制作一个可以运行的贪吃蛇小游戏。

提示词:你是一位资深游戏开发者,帮我创建一个完整的贪吃蛇游戏。

需要包含以下功能: 

蛇的移动和身体增长。随机生成食物。 死亡判断(撞墙或撞自己)。 显示得分。


Qwen3-Coder:

kimi k2:

图片

为什么kimi k2只放了一个截图出来呢,因为游戏无法动。。。

这局结果很明显,Qwen3-Coder不仅能完整的生成出一个可以动的贪吃蛇游戏,而且它的提示词遵循功能相当不错,所描述的功能都一一实现了。

再来一题。

提示词:写一个漂亮的p5js粒子动画,随鼠标的移动而变化。

Qwen3-Coder:

kimi k2:

结果一目了然,两者都把效果跑出来了,不过kimi k2的更加炫酷。

再来一个难度系数高一点的,喂给它们比亚迪的财务报表,让他们生成可视化网页。

提示词:将这个【比亚迪2025年一季度财报】生成一个Html动态网页,要求:

1.使用Bento Grid风格布局,纯黑色底配合比亚迪红色#e70114作为高亮。 

2.提炼文档内容,用超大字体或数字突出核心要点。画面中有超大视觉元素强调重点,与小元素文字形成反差。 

3.运用高亮色自身透明度渐变制造科技感,但是不同高亮色不要互相渐变。 

4.数据可以引用在线的图表组件,样式需与主题一致。 

5.简洁的勾线图形化作为数据可视化或者配图元素。 

6.中英文混用,中文大字体粗体,英文小字作为点缀。 

7.模仿apple官网的动效,向下滚动鼠标配合动效。 

8.使用HTML5、TailwindCSS 3.0+(通过CDN引入)和必要的JavaScript。 

9.使用专业图标库如Font Awesome或Material Icons (通过CDN引入)。

10.避免使用emoji作为主要图标。


Qwen3-Coder:

kimi k2:

这效果是不是比较酷炫,而且重点都是一次性就生成出来了,完整度很高,如果要说谁生成的更好一些,小编会投给Qwen3-Coder。


原因很简单,视觉冲击感更强,美感更好。


虽然此次测试没有测试一些比较高端的编程玩法(主要是小编一个小卡拉米),但或多或少可以直观的感受到,Qwen3-Coder的编程能力确实强。


此次除了发表Qwen3-Coder外,阿里还推出并开源了一款用于代理式编程的命令行工具:Qwen Code


这是一个CLI工具,据介绍,Qwen Code 基于 Gemini Code 进行二次开发,但团队进行了 prompt 和工具调用协议适配以最大激发Qwen3-Coder的能力。


同时,它也支持在Claude Code、Cline等编程工具上使用。


 .END.

往期文章回顾
最新文章
赤水润京华| 习酒·品酒师以智雅盛宴,敬呈北京君子
千年古城韵,一脉习酒香。7月16日至19日,习酒・品酒师北京站活动如约而至,在古都的烟火与风雅间,铺展开一场关于北京生活新范
具身智能,正在翻越三座大山
过去十几年,科技圈最不缺的就是“风口”。VR眼镜、虚拟货币区块链、元宇宙,这些概念哪个曾经不是看着前途无量,到最后却都“哑
致敬峥嵘岁月,八一慰问传递社区温情
在“八一”建军节来临之际,为弘扬拥军优属光荣传统,表达对退役军人的关怀,7月29日,姑苏区双塔街道杨枝社区组织开展八一走访
销售易14周年:14载同行以数智之力,共绘增长新篇
14年,在时间的长河中,是信任沉淀的年轮,也是无数客户与我们共同书写增长故事的旅程。2011年,销售易怀揣着“让销售更容易”的
TCL华星“屏宇宙”进阶亮相ChinaJoy2025
8月1日-4日,第二十二届中国国际数码互动娱乐展览会(下称“ChinaJoy2025”)开幕,作为为数不多硬件展商之一,TCL华星携手三星
关于警惕黄金投资领域非法金融活动的风险提示
(一)认准持牌机构。根据中国人民银行《关于黄金资产管理业务有关事项的通知》(银办发〔2018〕215号)规定,黄金资产管理业务是指银
触摸非遗 传承匠心 狮山横塘街道狮山一社区开展御窑金砖博物馆亲子研学
为弘扬中华优秀传统文化,增强文化自信,丰富青少年暑假生活,8月7日下午,狮山横塘街道狮山一社区新时代文明实践站组织辖区15组
沈阳2斤装巴拿马茅台酒瓶整套回收日常收购价在线查看
沈阳2斤装巴拿马茅台酒瓶整套回收日常收购价在线查看1、30年茅台酒瓶子回收:常年高价提供30年茅台酒瓶子、30年贵州茅台酒瓶、30
离家3年不见父母,这个老兵这样劝
东新分局茅店派出所社区民警舒德强1995年入伍2018年转业这位从陆军工程大学军械士官学校转业的老兵现已在警营里坚守了7年从穿军
腾讯又上一层楼?连续两年狂增后,瓦手暑期压轴登场!
昨晚(8月3日),在上海复星艺术中心举办的发布会上,《无畏契约:源能行动》官宣定档8月19日,一下点燃了国内射击玩家圈子。原
推荐文章