|
|
推翻150年数学直觉:数学家烧坏几台笔记本,解决几何拓扑难题 数据派THU · 公众号 · 大数据 · 3 月前 · |
|
|
原创丨一文读懂大模型开发三部曲:预训练、监督微调与对齐 数据派THU · 公众号 · 大数据 · 3 月前 · |
|
|
R1一周年,DeepSeek Model 1悄然现身 数据派THU · 公众号 · 大数据 · 3 月前 · |
|
|
原创丨弥补法律判决预测的现实鸿沟:基于证据的法律事实预测(LFP)范式与LFPBench基准数据集(... 数据派THU · 公众号 · 大数据 · 3 月前 · |
|
|
智能体评判者(Agent-as-a-Judge)研究综述 数据派THU · 公众号 · 大数据 · 3 月前 · |
|
|
大模型超参不再凭感觉!复旦团队更新 Scaling Law 适配现代预训练 数据派THU · 公众号 · 大数据 · 3 月前 · |
|
|
让模型学会 “快思慢想”:华为 VersatileFFN 的参数高效之道 数据派THU · 公众号 · 大数据 · 3 月前 · |
|
|
策马奔腾,共赴新程|清华大数据软件团队2026年会成功举行 数据派THU · 公众号 · 大数据 · 3 月前 · |
|
|
打破视角局限:3D视图合成的原理与PyTorch代码实现 数据派THU · 公众号 · 大数据 · 3 月前 · |
|
|
别盲目堆采样了!OptScale 让大模型推理 “知止而胜” 数据派THU · 公众号 · 大数据 · 3 月前 · |
|
|
再见,程序员!硅谷全员AI Coding,卡帕西宣告9级地震来了 数据派THU · 公众号 · 大数据 · 3 月前 · |
|
|
预训练数据太差怎么办?Bengio团队引入显式贝叶斯,无梯度实现In-Context RL 数据派THU · 公众号 · 大数据 · 3 月前 · |
|
|
极简却超强:华东师大 APN 打破 IMTS 预测的 SOTA 垄断 数据派THU · 公众号 · 大数据 · 4 月前 · |
|
|
清华大学电子系Nature发文揭示AI赋能科研的“内卷悖论”——科学智能需要从“辅助工具”到“合作伙... 数据派THU · 公众号 · 大数据 · 4 月前 · |
|
|
一年后,DeepSeek-R1的每token成本降到了原来的1/32 数据派THU · 公众号 · 大数据 · 4 月前 · |
|
|
Transformer已死?DeepMind正在押注另一条AGI路线 数据派THU · 公众号 · 大数据 · 4 月前 · |
|
|
告别臃肿代码!Python这6个隐藏功能让效率翻倍 数据派THU · 公众号 · 大数据 · 4 月前 · |
|
|
AgentCPM-Explore开源,4B 参数突破端侧智能体模型性能壁垒 数据派THU · 公众号 · 大数据 · 4 月前 · |
|
|
CVPR MobileMamba:精度速度双杀MobileNet 数据派THU · 公众号 · 大数据 · 4 月前 · |
|
|
DeepSeek 突发梁文锋署名新论文:V4 新架构提前曝光? 数据派THU · 公众号 · 大数据 · 4 月前 · |