|
|
大模型SFT后效果≠RL潜力!港科大、阿里提出自适应冷启动新范式 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
千问发布Qwen3.5-Omni全模态模型,超越Gemini3.1Pro?附实测~ 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
ClaudeCode源码泄露了,有人用Python复刻了一个极简版 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
RLHF:我Scale起来自己都害怕 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
视觉理解和生成的相爱相杀 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
只剩马斯克自己!xAI11个联合创始人跑光了 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
一篇大模型Agents工作流优化最新综述 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
LLMPost-Training全景指南:从RLHF到GRPO再到AgenticRL 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
NeurIPS滑跪认错!一切都是误会,已纠正 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
林俊旸:从Reasoning思考到Agentic思考 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
【斯坦福博士论文】持续自我改进的人工智能 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
LeCun的世界模型单GPU就能跑了 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
谷歌最新发表的Science论文,颠覆了人类对ASI的想象 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
最新VLA世界模型综述 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
太疯了!MIT博士在Transformer里造计算机,攻破LLM终极缺陷 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
GenTalk真知论坛学术分享第18期|吴超逸@上海交通大学:医疗智能体系统的构建与演进之路 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
MLNLP学术Talk第七十三期 | 李乙侠@南方科技大学:从语言建模到世界建模:大语言模型的文本世... 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
AgenticRL训练:它不是单一RL算法,而是一整套环境建模、学习信号、异步数据流、策略优化和基础... 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
清华团队首发OpenClaw研究报告! 大模型智能 · 公众号 · 大模型 · 2 月前 · |
|
|
DeepSeek、GPT、Qwen,所有大模型架构图都有,Karpathy:宝藏画廊! 大模型智能 · 公众号 · 大模型 · 2 月前 · |