昨天晚上正在香港转机去悉尼,途中看到了DeepSeek3.2的新闻,赶紧停下来录了个视频,结果DeepSeek还没仔细体验完,智谱的GLM-4.6又来了,话说每次都要赶在假期搞个突然袭击,还让不让人休假~

话是这么说但模型还是得测,因为昨天转机耽误了时间已经有不少大V发了DeepSeek3.2的内容,所以黄叔今天先仔细聊聊GLM-4.6。

同样作为能比肩世界一流模型的国产开源模型之光,GLM-4.6首先是在AIME 25、LCB v6、HLE、SWE-Bench Verified、BrowseComp、Terminal-Bench、τ^2-Bench等7大权威基准测试中有了全面提升,在tokens消耗上相比Glm-4.5可以节省30%以上,在PPT可用性和前端代码美观度上也都有提升:

Image

下面就带来这几方面的实测过程,首先是前端UI设计方面,这里我们通过Z.ai生成几种不同的APP也没来看看效果

前端页面设计

黄叔之前曾实测过GLM-4.5和DeepSeek、CLaude的效果,这里我们用GLM-4.6生成相同的前端页面方便对比效果。

1、待办APP首页

Image

最左侧是GLM-4.6的效果,从顶部卡片来看相对于自家的4.5似乎对复杂的布局支持更好的,对产品信息设计页更完整一些,在每个待办信息中增加了优先级标签。

相对于Claude4.0和Deepseek R1来看复杂布局领先一些,整体视觉效果处于同一水平线。

2、音乐APP播放页面

Image

这里我首先注意到的是这个渐变配色,淡淡的粉紫渐变非常漂亮,按钮形状页多了一些变化,不再是呆板的正圆形,UI设计中的导航栏部分相对4.5也更规整了, 封面图部分在4,5中是个弱项,之前Claude4.0输出的设计图中歌曲封面图就支持了大图+旋转,现在GLM-4.6也达到同样的效果了。

3、知识付费APP首页

Image

这个Case中进步也比较明显,首页使用大图+小图+头像的多级视觉强度形式区分了不同类目的权重,金刚区图标也更精致,减少了不必要的色块背景装饰反而让整体质感更好。只是底部tab部分强调色和默认色的使用不够突出,可能与提示词中设计风格部分的要求有关,因为我在提示词里面使用的都是偏向轻柔感的配色,但对辅助色没有明确的要求,导致这里默认色反而比辅助色更抢眼了。

4、运动健身APP首页

Image

这个测试结果第一眼看上去颜色有些过于鲜艳了,仔细看的话倒是有个亮点可以与前面案例中的进步呼应,就是复杂布局方面的能力。

今日调整部分这个大卡片,内部其实包含了多层布局嵌套,一共是三层布局,第一层是大卡片,第二层是完成度与下方3个小卡片(时间、热量那里)的相对布局,第三层的小卡片内部icon、数据、辅助文字的布局。这张较复杂布局在之前的GLM4.5、CLaude4.0、Deepseek R1中都支持的不是很好。

5、社交APP对话页面

Image

依然从细节处来对比(实际上现在各个模型输出UI设计图越来越需要从细节处、专业层面对比了),GLM-4.6生成的这张图在配色上有个优势是饱和度降低了,饱和度降低的优势是长时间使用时眼睛会更加舒适,如果使用鲜艳的颜色虽然第一眼看上去冲击力比较强,但长时间使用会更容易导致眼部疲劳,最近几年一些用户会长时间使用的产品基本都是这个设计趋势。

另一处细节是GLM-4.6生成的图在对话页面不仅与文字对话,还加入了语音消息类型,这也是之前几大模型包含GLM4.5自身也没有的。

网页游戏开发

1、俄罗斯方块

再来测试一下简单的网页游戏,这里还是先试试俄罗斯方块,只输入很简单的要求看看GLM-4.6能发挥到什么程度

Image

大概5分钟左右,产出的网页结果:

Image

游戏在基本功能是齐全的,下一个方块、暂停继续、重新开启、元素旋转等都正常使用,而且还有“预览”功能,上方正在落下的方块在底部会有个嗲透明度的虚影,来显示当前方块会落到什么位置,这个设计非常赞,相当于俄罗斯的瞄准器了。

实际上在上次GLM4.5发布的时候我也测试过俄罗斯方块网页开发,但当触发消除时网页会直接卡死。这次使用4.6开发则一次完成了所有功能,暂时没发现BUG。

游戏结束之后的分数统计、重新开始引导也都是正常的,游戏界面中的操作说明也很完善。如下图

Image

PPT设计

PPT能力测试部分更换了多种不同的设计风格要求和内容主题,这里直接给大家放出封面+多张内容页大家看看精美程度。

1、茶艺知识介绍PPT-日式风格

封面:

Image

部分内容页:

Image

Image

Image

2、漫画发展史PPT-美漫风格

再来看另一份PPT,是关于漫画发展史的,并且指定了美漫设计风格

封面:

Image

部分内容页:

Image

Image

Image

总结

完整的测试了一大圈各种场景之后,只能说模型的进化速度太快了,卷模型能力、卷处理速度、卷token价格都是明显的趋势,未来AI应用也必然迎来爆发,今天介绍的GLM-4.6可以在智谱 MaaS 平台(bigmodel.cn)、Z.ai、智谱清言等入口使用。

模型能力方面,除了上面所说的PPT设计和前端美观度,这次GLM-4.6还支持了200K的超长上下文窗口,可以避免编程过程中细节记忆损失带来的bug,能记住更多信息自然能避免重复错误,或者是把代码反复修改、使用重复的解决方案修复问题。

当然这么长的上下文其意义不止体现在编程使用场景中,对更广泛用户的超长文档理解总结需求,大量数据分析需求,长内容输出等使用场景都有更好的体验。

与AI编程常青树模型Claude4.0对比,价格只需要七分之一,部分能力还更强,对于习惯使用不同开发工具的用户来说接入也更容易,支持了Claude Code,Roo Code,Kilo Code,Cline等10多个主流AI编程工具。

海外用户可通过 z.ai、OpenRouter 使用 API,企业用户可通过 bigmodel.cn 直接购买 Coding Plan 企业版套餐。企业版的数据安全和用量监测能力上还有加成,曾经订阅 GLM Coding Plan 包月套餐的用户,也会自动升级至 GLM-4.6。(很良心了,而且企业版好像还在打折)

感兴趣的朋友可以去试试,关注黄叔查看更多最新实测内容~