专栏名称: 七牛云

七牛云作为一站式中立音视频云+AI 平台，自 2011 年成立以来，专注于给广大企业提供音视频云和 AI 相关的服务，致力于音视频相关场景的深耕，提供社交娱乐、视频营销、视频监控、智慧新媒体、元宇宙等场景的产品和解决方案。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

领英公司动态RSS订阅方法

RSS代理RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

大模型 Council 评比，GPT-5.2/Gemini 3 Pro 出题，DeepSeek-V3...

七牛云 · 公众号 · 科技自媒体 · 2025-12-12 16:12

主要观点总结

本文介绍了AI大神卡帕西发布的一个趣味编程项目——大模型议会（LLM Council）。该项目让多个委员模型互相评分、排序，最终由Chairman模型给出一个统一评估答案。文章详细描述了项目的流程、环境准备、问题收集以及初步评选结果。

关键观点总结

关键观点1: 项目介绍

卡帕西发布的大模型议会项目，让多个模型互相评价，最终由Chairman模型汇总答案。项目主要分为三步流程：多个模型同时回答一个问题，所有模型进行匿名互评，Chairman模型汇总最终回答。

关键观点2: 环境准备

需要克隆仓库并安装必要的软件和工具，编辑配置文件以修改KEY、参赛模型列表、Chairman和URL等。

关键观点3: 初步评选结果

DeepSeek-V3.2表现最佳，答出问题数量最多。Minimax-M2和GLM-4.6表现并列第二。Chairman模型（Qwen3-235B）在某些情况下无法履行评估。评测问题、过程及结果仅供娱乐，不代表具体业务场景的参考依据。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

雷递 · 金矿企业Merdeka Gold上市破发：公司市值370亿港元募资27亿港元

9 小时前

MacTalk · AI 时代，我没有忠诚度。今天豆包正式上线三档付费订阅服务：最低 68/月，最高 500 元/月，接入了 2.1 系列大模型。有朋友问我，你会付费吗？\n\n我用豆包不算多，我的重度场景是 Coding 和 Agent，平时更多用 gpt 和 glm 这样的模型和 Agent 工具，这方面我还挺舍得花钱。我从来不和 AI 聊感情，我没这个需求，生图，做视频也不多。所以，如果是普通的能力，ChatGPT、千问、元宝、百度文心都可以免费用，为什么要付费？\n\n但是，如果我发现豆包 2.1 专业版的编程能力超

昨天

酷玩实验室 · 足球圈 98% 的人都在干？“推球”灰产，如何让你倾家荡产

昨天

雷递 · 臻宝科技科创板上市：大涨1212% 市值908亿兆易创新浮盈超4亿

2 天前

科技富能量 · 代码显示苹果AI无缘国内市场！iQOO Z9 Turbo+入网搭载天玑9300+！

1 年前

柠檬游戏说 · 销量破百万的Steam塔防玩法+小游戏=新蓝海

1 年前

987私家车广播 · 15秒售罄！爬楼“神器”开卖，“连样机都卖完了”，网友：急需

1 年前

云技术 · 196万元，DeepSeek大模型智能体大单：山东黄金

1 年前

Warhammer战锤 · 战锤旧世界｜旧世界年鉴——桌面游戏中的震旦天朝

11 月前