|
|
LLama3的100页Know How 李rumor · 公众号 · · 1 年前 · |
|
|
CS-Bench|面向计算机科学的LLM综合测试基准 李rumor · 公众号 · · 1 年前 · |
|
|
超越DPO之Step-DPO 李rumor · 公众号 · · 1 年前 · |
|
|
聊聊搜索系统的常见架构 李rumor · 公众号 · · 1 年前 · |
|
|
Adam学习率Scaling law的「浪涌现象」 李rumor · 公众号 · · 1 年前 · |
|
|
当GPT-4o遇上情感陪伴:多巴胺的胜利,催产素的挑战 李rumor · 公众号 · · 1 年前 · |
|
|
用最酷的LR,训最猛的模型 李rumor · 公众号 · · 1 年前 · |
|
|
大模型的门槛,又被打下来了 李rumor · 公众号 · · 1 年前 · |
|
|
Cantor|多模态思维链新架构 李rumor · 公众号 · 科技自媒体 · 1 年前 · |
|
|
详看Langchain框架中的RAG多阶段优化策略 李rumor · 公众号 · · 1 年前 · |
|
|
大模型预训练认知分享 李rumor · 公众号 · · 1 年前 · |
|
|
行业大模型落地的一些有趣调研总结 李rumor · 公众号 · · 1 年前 · |
|
|
Transformer被Mamba硬控30秒,问题不大还是一哥 李rumor · 公众号 · · 1 年前 · |