欧易数字货币交易所
更快、更好、更强

数字货币交易，我们是专业的

正面硬刚OpenAI智谱AI推出第三代基座模型功能对标

2022-06-12 11:36 • By 欧易

　　自研大模型ChatGLM3，不止是底层架构，就连模型功能都进行了全方位大升级。

　　性能上，最直观的表现就是“疯狂屠榜”，所有50个大模型公开性能测评数据集中，拿下44个全国第一；

　　产品上，率先搞定了用户关注度MAX的代码解释器功能，能生成甚至直接跑通代码！

　　所以，从智谱AI发布的ChatGLM3中，究竟能深挖出什么最新的技术细节？

　　稍早之前，量子位就获悉了智谱AI将发布迭代后基座模型的消息，取名ChatGLM3。

　　发布会上，升级后的ChatGLM第三代正式对外披露，主要在4个方面秀出亮点，对比上一代有不小提升。

　　据介绍，结合此前ChatGLM系列模型的开发经验，智谱AI采用了独创的多阶段增强与训练方法，同时丰富了训练数据，优化了训练方法，使训练更为充分。

　　评测结果显示，与ChatGLM2系列模型相比，ChatGLM3一出，性能屠榜：

　　同尺寸模型中，ChatGLM3拿下了44个中英文公开数据集测试国内第一。

　　官方介绍，ChatGLM3系列模型采用了最新的高效动态推理和显存优化技术。

　　相同硬件、模型条件下，当前的推理框架相较于目前的最佳开源实现——UC伯克利分校提出的vLLM以及Hugging Face TGI的最新版本，推理速度提升了2-3倍。

　　同时成本降低一倍。目前ChatGLM3系列模型的推理成本，每千tokens仅需要0.5分。

　　智谱AI介绍说，本次迭代后的ChatGLM3集成了自研的AgentTuning技术，激活了模型智能代理能力。

　　由此也使得ChatGLM3作为国产大模型，能够原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。

　　值得注意的一点是，纵使进行全方位的升级迭代，智谱AI在大模型道路上还是继续秉承着开源的开放思想。

　　智谱AI CEO张鹏在发布会现场提到，此前智谱AI开源的ChatGLM-6B，已经有超过千万的下载量。开放的态度对于智谱AI现在4个月发展出新一代基座模型，是功不可没的。

　　是以发布领先、好用的模型，吸引开发者和B端用户，逐步构建起自研大模型和合作伙伴筑建的模型生态——智谱AI正是这条路线的实践者。

　　交上答卷，方方面面的数据详情，能看出智谱AI对此次第三代ChatGLM模型比以往发布模型和产品还要重视。

　　一方面，清华KEG实验室研究成果出身决定了，智谱AI既是一家面向市场化的大模型公司，但其本身还是带有浓厚的学术氛围和技术追求。

　　另一方面，智谱AI确实是国内最早投身大模型技术研究的玩家之一，有4年多的积累，也明确过会持续深耕下去。

　　再者说，在百模混战中谋生存，又通过开拓朋友圈寻发展，以技术为核心出发点和竞争力，是一家大模型创企的应有之义。

　　这一次，有了ChatGLM3加持，智谱清言在功能上直接对标GPT-4V，最直观的就是增加了这3大点“新玩法”——

　　和单纯的“分析代码”和“读代码”不同，代码解释器不仅可以读代码，甚至能在一个沙盒中运行代码，并返回生成结果。

　　在经过一番“急速分析”后，智谱清言竟然真的调用Python库，生成了一个饼图表情包，正经而不失幽默感。

　　从图中可以看出，您的摸鱼能力非常突出，得分最高；而工作能力和沟通能力则相对较低。

　　没想到，它不仅能收集到数据单位和时间等“关键信息”，快速将之做成横纵坐标轴，还能对图表进行简单分析：

　　除此之外，用代码解释器画函数也是轻松手到擒来。以常用的ReLU函数为例：

　　不仅准确生成了函数的图像，还会顺带介绍ReLU函数的常见用法，属实是非常萌新友好了。

　　在WebGLM新技术的加持下，智谱清言也能更好地结合搜索引擎，来增强回答的准确性。

　　不仅快速介绍了梗的来历，还温馨提示了一句“这个梗并非近期才火起来的”，属实是比我追热点还快了。

　　智谱清言的这个图像解读功能基于CogVLM实现，可以根据图片解读其中的内容，并结合聊天功能来使用。

　　但区区菜谱怎么可能满足我们的需求（doge），要想试试它的真实水平，当然是解读表情包了。

　　智谱清言快速提取了图片中的细节元素，包括短袖和短裤、以及拖鞋和电视屏幕，并意识到这个场景似曾相识。

　　嗯，让我们恭喜“跳过台阶”表情包，在模仿自己中取得了第二名的好成绩（手动狗头）

　　总结一下，智谱清言确实已经具备了代码解释器、搜索和解读图片的能力，而这也确实是当前大模型落地的产品能力刚需。

　　目前大部分国产大模型仍然在云端运行，并且只出了对外的API接口，如果企业厂商想要接入，在不少场景中仍然有不方便的地方。

　　尤其是终端侧的不少厂商，用户对隐私能力要求较高，这时候如果将个人数据上传到云端处理，势必会带来不小争议。

　　智谱AI考虑到了这一点，率先把ChatGLM3大模型“做小”，能塞进汽车甚至是手机。

　　具体来说，ChatGLM3除了上述提到的模型以外，还推出了可手机部署的端侧模型ChatGLM3-1.5B和3B。

　　目前，这个模型已经能支持包括Vivo、小米、三星在内的多种手机以及车载平台——

　　但这并不意味着性能就有所下降，在精度方面，1.5B和3B模型在公开benchmark上接近ChatGLM2-6B模型的性能。

　　全面支持10余种国产芯片，包括昇腾、神威超算、海光DCU、海飞科、沐曦曦云、算能科技、天数智芯、寒武纪、摩尔线程、百度昆仑芯、灵汐科技、长城超云。

　　以昇腾生态为例，ChatGLM3在升级之后，在它上面的推理速度提升了3倍多，运行起来也更快了。

　　从上述三个“更”可以感受到，发布ChatGLM3的智谱AI，似乎在大模型各个层面寻求更脚踏实地的平稳着陆和生态合作。

　　或许不排除智谱AI下一阶段的主要计划就是冲向落地，从底层技术，从产品能力。

　　并且显而易见的，这次对外发布，完全对应了前几日公布年内融资时，智谱AI说的计划：

　　这种雷厉风行的速度，从某种角度来说也是一种实力体现。并非每一个大模型创业公司都能在基座大模型稳打稳扎，或者不是有了钱和人才就能立马亮出计划内的产品。

　　更有意思的一点，在基座大模型和生态朋友圈的簇拥下，ChatGLM3系列模型发布后，基于这一代基座大模型，智谱AI和OpenAI产品线，对上了：

　　也就是说，智谱AI成为了国内目前唯一一个拥有对标OpenAI全模型产品线的公司，这在大模型玩家中近乎于一种手中牌很齐全的“炫富”。

　　而且从时间线来看，初代GLM到ChatGLM2再到ChatGLM3，迭代速度不是领域内最快的，但是不疾不徐，也已经用实际效果占有了市场与口碑。

　　不得不提，智谱AI这次新基座模型的发布选择在10月底，这个时间点，ChatGPT诞生将满一年。

　　过去的这一年也是AI最疯狂的一年，大模型当之无愧，成为目前争夺最激烈、也最有可能取得突破的领域。

　　更令人期待和审视的是，距离年初国内各家大模型公司喊出的“年底要做到xxx”的种种flag，时间越来越逼近。

　　为了实现这个目标，各个大模型公司在技术、人才、路线、资金甚至社会责任方面，都轮番展示了一把。

　　原标题：《正面硬刚OpenAI！智谱AI推出第三代基座模型，功能对标GPT-4V，代码解释器随便玩》

　　本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。