|
|
LeCun转发!纽约大学100页机器学习讲义公开:所有人都在追LLM,高校为何死磕基础理论? DASOU · 公众号 · 科技自媒体 · 11 月前 · |
|
|
2025年,大模型LLM还有哪些可研究的方向? DASOU · 公众号 · · 11 月前 · |
|
|
终于有人把Attention机制讲明白了~ DASOU · 公众号 · · 11 月前 · |
|
|
火爆全网!《LLM书》.PDF DASOU · 公众号 · AI 科技自媒体 · 11 月前 · |
|
|
RLHF 实践:原理、代码、踩坑以及解决方案 DASOU · 公众号 · 科技自媒体 · 11 月前 · |
|
|
Transformer原作、斯坦福、清华交大三篇论文共识:基座模型边界锁死RL能力上限 DASOU · 公众号 · · 11 月前 · |
|
|
论文er最爱的即插即用模块,我整理了2025最新适配版,直接拖进代码涨点 DASOU · 公众号 · · 12 月前 · |
|
|
思考:Qwen3是如何实现混合推理(快慢思考)的? DASOU · 公众号 · · 12 月前 · |
|
|
· 公众号 · 科技自媒体 · 12 月前 · |
|
|
快手二面拷打:训练100B模型要多少显存? DASOU · 公众号 · 科技创业 科技自媒体 · 12 月前 · |
|
|
强化学习算法梳理:从 PPO 到 GRPO 再到 DAPO DASOU · 公众号 · · 12 月前 · |
|
|
ICML 2025放榜!接收率26.9%! DASOU · 公众号 · 科技自媒体 · 1 年前 · |
|
|
DeepSeek-Prover-V2 技术报告解读! DASOU · 公众号 · · 1 年前 · |
|
|
刚刚,DeepSeek 开源新模型 DASOU · 公众号 · 科技创业 科技自媒体 · 1 年前 · |
|
|
Qwen3终于来了!通通开源!! DASOU · 公众号 · · 1 年前 · |
|
|
为啥看上去很水的师兄,却能发顶会顶刊? DASOU · 公众号 · · 1 年前 · |
|
|
斯坦福CS 25重磅开课!OpenAI、谷歌等一线大模型科学家公开课! DASOU · 公众号 · AI 科技自媒体 · 1 年前 · |