国内最强Coding模型GLM-4.6上线，一手实测 - 知识铺

昨天晚上正在香港转机去悉尼，途中看到了DeepSeek3.2的新闻，赶紧停下来录了个视频，结果DeepSeek还没仔细体验完，智谱的GLM-4.6又来了，话说每次都要赶在假期搞个突然袭击，还让不让人休假～

话是这么说但模型还是得测，因为昨天转机耽误了时间已经有不少大V发了DeepSeek3.2的内容，所以黄叔今天先仔细聊聊GLM-4.6。

同样作为能比肩世界一流模型的国产开源模型之光，GLM-4.6首先是在AIME 25、LCB v6、HLE、SWE-Bench Verified、BrowseComp、Terminal-Bench、τ^2-Bench等7大权威基准测试中有了全面提升，在tokens消耗上相比Glm-4.5可以节省30%以上，在PPT可用性和前端代码美观度上也都有提升：

下面就带来这几方面的实测过程，首先是前端UI设计方面，这里我们通过Z.ai生成几种不同的APP也没来看看效果

前端页面设计

黄叔之前曾实测过GLM-4.5和DeepSeek、CLaude的效果，这里我们用GLM-4.6生成相同的前端页面方便对比效果。

1、待办APP首页

最左侧是GLM-4.6的效果，从顶部卡片来看相对于自家的4.5似乎对复杂的布局支持更好的，对产品信息设计页更完整一些，在每个待办信息中增加了优先级标签。

相对于Claude4.0和Deepseek R1来看复杂布局领先一些，整体视觉效果处于同一水平线。

2、音乐APP播放页面

这里我首先注意到的是这个渐变配色，淡淡的粉紫渐变非常漂亮，按钮形状页多了一些变化，不再是呆板的正圆形，UI设计中的导航栏部分相对4.5也更规整了，封面图部分在4,5中是个弱项，之前Claude4.0输出的设计图中歌曲封面图就支持了大图+旋转，现在GLM-4.6也达到同样的效果了。

3、知识付费APP首页

这个Case中进步也比较明显，首页使用大图+小图+头像的多级视觉强度形式区分了不同类目的权重，金刚区图标也更精致，减少了不必要的色块背景装饰反而让整体质感更好。只是底部tab部分强调色和默认色的使用不够突出，可能与提示词中设计风格部分的要求有关，因为我在提示词里面使用的都是偏向轻柔感的配色，但对辅助色没有明确的要求，导致这里默认色反而比辅助色更抢眼了。

4、运动健身APP首页

这个测试结果第一眼看上去颜色有些过于鲜艳了，仔细看的话倒是有个亮点可以与前面案例中的进步呼应，就是复杂布局方面的能力。

今日调整部分这个大卡片，内部其实包含了多层布局嵌套，一共是三层布局，第一层是大卡片，第二层是完成度与下方3个小卡片（时间、热量那里）的相对布局，第三层的小卡片内部icon、数据、辅助文字的布局。这张较复杂布局在之前的GLM4.5、CLaude4.0、Deepseek R1中都支持的不是很好。

5、社交APP对话页面

依然从细节处来对比（实际上现在各个模型输出UI设计图越来越需要从细节处、专业层面对比了），GLM-4.6生成的这张图在配色上有个优势是饱和度降低了，饱和度降低的优势是长时间使用时眼睛会更加舒适，如果使用鲜艳的颜色虽然第一眼看上去冲击力比较强，但长时间使用会更容易导致眼部疲劳，最近几年一些用户会长时间使用的产品基本都是这个设计趋势。

另一处细节是GLM-4.6生成的图在对话页面不仅与文字对话，还加入了语音消息类型，这也是之前几大模型包含GLM4.5自身也没有的。

网页游戏开发

1、俄罗斯方块

再来测试一下简单的网页游戏，这里还是先试试俄罗斯方块，只输入很简单的要求看看GLM-4.6能发挥到什么程度

大概5分钟左右，产出的网页结果：

游戏在基本功能是齐全的，下一个方块、暂停继续、重新开启、元素旋转等都正常使用，而且还有“预览”功能，上方正在落下的方块在底部会有个嗲透明度的虚影，来显示当前方块会落到什么位置，这个设计非常赞，相当于俄罗斯的瞄准器了。

实际上在上次GLM4.5发布的时候我也测试过俄罗斯方块网页开发，但当触发消除时网页会直接卡死。这次使用4.6开发则一次完成了所有功能，暂时没发现BUG。

游戏结束之后的分数统计、重新开始引导也都是正常的，游戏界面中的操作说明也很完善。如下图

PPT设计

PPT能力测试部分更换了多种不同的设计风格要求和内容主题，这里直接给大家放出封面+多张内容页大家看看精美程度。

1、茶艺知识介绍PPT-日式风格

封面：

部分内容页：

2、漫画发展史PPT-美漫风格

再来看另一份PPT，是关于漫画发展史的，并且指定了美漫设计风格

封面：

部分内容页：

总结

完整的测试了一大圈各种场景之后，只能说模型的进化速度太快了，卷模型能力、卷处理速度、卷token价格都是明显的趋势，未来AI应用也必然迎来爆发，今天介绍的GLM-4.6可以在智谱 MaaS 平台（bigmodel.cn）、Z.ai、智谱清言等入口使用。

模型能力方面，除了上面所说的PPT设计和前端美观度，这次GLM-4.6还支持了200K的超长上下文窗口，可以避免编程过程中细节记忆损失带来的bug，能记住更多信息自然能避免重复错误，或者是把代码反复修改、使用重复的解决方案修复问题。

当然这么长的上下文其意义不止体现在编程使用场景中，对更广泛用户的超长文档理解总结需求，大量数据分析需求，长内容输出等使用场景都有更好的体验。

与AI编程常青树模型Claude4.0对比，价格只需要七分之一，部分能力还更强，对于习惯使用不同开发工具的用户来说接入也更容易，支持了Claude Code，Roo Code，Kilo Code，Cline等10多个主流AI编程工具。

海外用户可通过 z.ai、OpenRouter 使用 API，企业用户可通过 bigmodel.cn 直接购买 Coding Plan 企业版套餐。企业版的数据安全和用量监测能力上还有加成，曾经订阅 GLM Coding Plan 包月套餐的用户，也会自动升级至 GLM-4.6。（很良心了，而且企业版好像还在打折）

感兴趣的朋友可以去试试，关注黄叔查看更多最新实测内容~

文章目录