专栏名称: 经济观察报
《经济观察报》官方微信。最具影响力的市场化财经媒体,下辖纸质版、经济观察网、研究院、电子版、音视频、微博、微信等全媒体矩阵,并主办中国最受尊敬企业、中国杰出营销奖、中国蓝筹地产、观察家年会、可持续发展在中国、中国最具创新企业等系列品牌活动。
TodayRss-海外稳定RSS
目录
今天看啥  ›  专栏  ›  经济观察报

“复刻”幻方量化打造Deepseek 量化私募基金念空在大模型底层技术研发取得突破

经济观察报  · 公众号  · 财经  · 2025-06-03 19:17
    

主要观点总结

随着AI大模型的迭代升级,量化私募基金越来越重视AI大模型底层技术的研发,特别是在算法优化方面的突破。产学研的结合成为大模型底层技术研发的“捷径”。国内深度求索公司推出升级模型,提高大模型的思维深度与推理能力。念空科技与上海交通大学计算机学院合作提出全新的大模型训练框架(SASR),解决通用大模型的“聪明度”挑战。算法优化和训练架构创新成为量化私募开启大模型研发的“新征途”。多家量化私募基金设立AI Lab,专注大模型底层技术的研发。通用大模型的算法优化是提升大模型整体能力的重要突破口。自适应的混合训练框架在算法优化过程中能动态平衡SFT与RL,确保训练方案之间的平滑过渡。同时,通用大模型需要在数据量庞大的互联网行业面对更多的挑战。业内人士认为,训练框架创新与算法优化能否令通用大模型变得“更聪明”,还需实践验证。量化私募基金希望推动大模型在更多垂直领域的应用,提高投资准确性,增强中国大模型在全球AI格局的竞争力。

关键观点总结

关键观点1: 算法优化与训练架构创新是量化私募开启大模型研发的“新征途”。

随着AI大模型的迭代升级,量化私募基金越来越重视AI大模型的底层技术研发,尤其是算法优化方面。算法优化对于提升大模型的性能至关重要。

关键观点2: 全新的大模型训练框架(SASR)解决了通用大模型的“聪明度”挑战。

念空科技与上海交通大学计算机学院合作提出了一种全新的大模型训练框架(SASR),通过动态平衡监督微调(SFT)和强化学习(RL),提高大模型的逻辑推理能力。

关键观点3: 自适应的混合训练框架能动态平衡SFT与RL,提升大模型的性能。

在这个全新的训练框架下,大模型可以自主设定一个动态的评估体系,根据数据训练环节的监督微调(SFT)效果,自主决定下一步是继续“刷题”,还是切换成思考总结(强化学习,RL)。这种自适应的训练方式有助于提升大模型的性能。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照