百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

真够卷的!DeepSeek更完智谱更:GLM-4.6,代码国内最强

haoteby 2025-10-08 17:10 10 浏览

金磊 发自 凹非寺

量子位 | 公众号 QbitAI

好好好,都赶着国庆节之前开卷是吧。

前脚DeepSeek更新到了V3.2,现在智谱又更新了——

正式推出GLM-4.6,代码能力直接推到了国内最强

根据智谱的测试结果,他们在Claude Code环境下进行了74个真实场景编程任务测试:GLM-4.6实测超过Claude Sonnet 4,超越其他国产模型。

类似的结果还出现在了其它测评中。

例如在通用能力评测上,GLM-4.6在AIME 25、GPQA、LCB v6、HLE、SWE-Bench Verified、BrowseComp、Terminal-Bench、τ^2-Bench、GPQA,这八大榜单中大部分都已经对齐了Claude Sonnet 4,国内第一。

分数高还只是一方面,智谱的GLM-4.6甚至还把“平均token消耗”给打了下来——比GLM-4.5节省30%以上,为同类模型最低。

而且智谱这次还大大方方地把全部测试题目与Agent轨迹亮了出来,方便大家复现验证:

https://huggingface.co/datasets/zai-org/CC-Bench-trajectories

有一说一,卷,是真的卷。

实测GLM-4.6

根据量子位的老传统,新模型一出,那必须是得安排一波实测。

我们先小试牛刀地来一道题:

生成一个射击类的小游戏。

从实测体验来看,代码生成的速度是相当之快,不到一分钟,游戏就被设计出来了。

进阶一下,我们再让GLM-4.6再做一个交互动画:

用p5js创建多彩的可交互动画。

可以看到,鼠标点到哪里就会产生交互效果。

编程这块,我们最后来测一道经典的题目:

显示球在旋转的六边形内弹跳。球应该受到重力和摩擦力的影响,并且必须逼真地从旋转的墙壁上反弹。

嗯,小球是按照物理规律在运转。

在编程能力之后,我们再来测试一下GLM-4.6的数学能力。

请听一道AIME 2025的试题:

在这次测试中,我们是直接把题目截图“喂”给了GLM-4.6,不仅考察了解数学题的能力,同时还检测了一下它识图的多模态能力。

可以看到,GLM-4.6完美地给出了正解:70。

整体来看,智谱这次新模型能力提升可以概括如下:

  • 高级编码能力:在公开基准与真实编程任务中,GLM-4.6的代码能力对齐Claude Sonnet 4,是国内已知的最好的Coding模型。
  • 上下文长度:上下文窗口由128K→200K,适应更长的代码和智能体任务。
  • 推理能力:推理能力提升,并支持在推理过程中调用工具。
  • 搜索能力:增强了模型在工具调用和搜索智能体上的表现,在智能体框架中表现更好。
  • 写作能力:在文风、可读性与角色扮演场景中更符合人类偏好。

寒武纪、摩尔线程都跟进了

昨晚DeepSeek更新的时候,一个新现象伴随着诞生——

很多国产芯片公司立即宣布“Day0适配”

这一现象在GLM-4.6身上也是发生了。

据了解,GLM-4.6 已经在寒武纪的国产芯片上实现了FP8+Int4的混合量化部署,这是国产芯片上第一次真正落地的FP8+Int4模型芯片一体化方案。

在保证精度不受影响的同时,还大幅降低了推理成本,也为国产芯片本地运行大模型提供了一条可行的新路径。

在vLLM推理框架的支持下,摩尔线程新一代GPU能够用原生FP8精度稳定运行GLM-4.6,这充分体现了MUSA架构和全功能GPU在生态兼容性和快速适配上的优势。

接下来,GLM-4.6将与寒武纪、摩尔线程的国产芯片组合,通过智谱MaaS平台正式对企业和大众开放服务。

最后,划个重点。

智谱在能力提升的同时,还把价格给打下来了!

智谱同步升级的GLM Coding Plan(最低20元包月畅玩套餐):用1/7的价格,可以享受到Claude的9/10智商。

GLM-4.6体验地址:
chat.z.ai

智谱MaaS平台:
bigmodel.cn

— 完 —

量子位 QbitAI · 头条号

关注我们,第一时间获知前沿科技动态

相关推荐

如何为MySQL服务器和客户机启用SSL?

用户想要与MySQL服务器建立一条安全连接时,常常依赖VPN隧道或SSH隧道。不过,获得MySQL连接的另一个办法是,启用MySQL服务器上的SSL封装器(SSLwrapper)。这每一种方法各有其...

OpenVPN客户端配置_openvpn客户端配置文件解析

...

k8s 证书问题排查_k8s dashboard 证书

从去年开始一些老项目上陆陆续续出现一些列的证书问题,(证书原理这里就不说了,官方文档一堆)多数刚开始的表现就是节点的kubelet服务起不来,节点状态NotReady表现日志如下failed...

企业级网络互通方案:云端OpenVPN+爱快路由器+Win11互联实战

企业级网络互通方案:OpenVPN搭建公有云+爱快路由器+Win11三地互联实战指南「安全高效」三地局域网秒变局域网实施环境说明...

OpenV** Server/Client配置文件详解

Server配置详解...

接口基础认知:关键信息与合规前提

1.核心技术参数(必记)...

S交换机通过SSH登录设备配置示例(RADIUS认证+本地认证独立)

说明:●本示例只介绍设备的认证相关配置,请同时确保已在RADIUS服务器上做了相关配置,如设备地址、共享密钥、创建用户等配置。●通过不同的管理域来实现RADIUS认证与本地认证两种方式同时使用,两...

SSL证书如何去除私钥密码保护_ssl证书怎么取消

有时候我们在生成证书的时候可以加入了密码保护。然后申请到证书安装到了web服务器。但是这样可能会带来麻烦。每次重启apache或者nginx的时候,都需要输入密码。那么SSL证书如何去除私钥密码保护。...

SSL证书基础知识与自签名证书生成指南

一、证书文件类型解析...

S交换机通过SSH登录设备配置示例(RADIUS认证)

说明:本示例只介绍设备的认证相关配置,请同时确保已在RADIUS服务器上做了相关配置,如设备地址、共享密钥、创建用户等配置。假设已在RADIUS服务器上创建了用户名yc123,密码test#123。对...

HTTPS是什么?加密原理和证书。SSL/TLS握手过程

秘钥的产生过程非对称加密...

HTTPS TLS握手流程_进行tls握手

1.客户端向服务器发送`ClientHello`消息,包括支持的TLS版本、加密套件、随机数等信息。2.服务器收到`ClientHello`消息后,解析其中的信息,并根据配置选择一个加密套件。3....

Spring Boot 单点登录(SSO)实现_spring boot 单点登录jwt

SpringBoot单点登录(SSO)实现全指南单点登录(SingleSign-On,SSO)是一种身份验证机制,允许用户使用一组凭证登录多个相关但独立的系统。在微服务架构和企业级系统中,SS...

源码分享:在pdf上加盖电子签章_pdf如何加盖电子公章

在pdf上加盖电子签章,并不是只是加个印章图片,。而是要使用一对密钥中的私钥对文件进行签字。为啥要用私钥呢?很简单,因为公钥是公开的,其他人才可以用公钥为你证明,这个文件是你签的。这就是我们常说的:私...

微信支付商户API证书到期 怎么更换

微信支付商户API证书到期更换是一个非常重要的操作,需要仔细按照流程进行。如果证书过期,所有通过API的支付、退款等操作都会失败,将直接影响您的业务。请按照以下详细步骤进行操作:重要前提:分清...