|
不用等了!吴恩达MCP课程来了! DASOU · 公众号 · AI 科技自媒体 · 2 月前 · |
|
是时候彻底弄懂BERT模型了! DASOU · 公众号 · · 2 月前 · |
|
独自一人,怒发顶会! DASOU · 公众号 · · 2 月前 · |
|
梁文锋署名DeepSeek新论文:公开V3大模型降本方法 DASOU · 公众号 · · 2 月前 · |
|
LeCun转发!纽约大学100页机器学习讲义公开:所有人都在追LLM,高校为何死磕基础理论? DASOU · 公众号 · 科技自媒体 · 2 月前 · |
|
2025年,大模型LLM还有哪些可研究的方向? DASOU · 公众号 · · 2 月前 · |
|
终于有人把Attention机制讲明白了~ DASOU · 公众号 · · 2 月前 · |
|
火爆全网!《LLM书》.PDF DASOU · 公众号 · AI 科技自媒体 · 2 月前 · |
|
RLHF 实践:原理、代码、踩坑以及解决方案 DASOU · 公众号 · 科技自媒体 · 2 月前 · |
|
Transformer原作、斯坦福、清华交大三篇论文共识:基座模型边界锁死RL能力上限 DASOU · 公众号 · · 2 月前 · |
|
论文er最爱的即插即用模块,我整理了2025最新适配版,直接拖进代码涨点 DASOU · 公众号 · · 2 月前 · |
|
思考:Qwen3是如何实现混合推理(快慢思考)的? DASOU · 公众号 · · 2 月前 · |
|
超全!2025NLP顶会收录偏好汇总 DASOU · 公众号 · 科技自媒体 · 2 月前 · |
|
快手二面拷打:训练100B模型要多少显存? DASOU · 公众号 · 科技创业 科技自媒体 · 3 月前 · |
|
强化学习算法梳理:从 PPO 到 GRPO 再到 DAPO DASOU · 公众号 · · 3 月前 · |
|
ICML 2025放榜!接收率26.9%! DASOU · 公众号 · 科技自媒体 · 3 月前 · |
|
DeepSeek-Prover-V2 技术报告解读! DASOU · 公众号 · · 3 月前 · |
|
刚刚,DeepSeek 开源新模型 DASOU · 公众号 · 科技创业 科技自媒体 · 3 月前 · |
|
Qwen3终于来了!通通开源!! DASOU · 公众号 · · 3 月前 · |