|
2024 || LoRA-GA: 梯度近似的LoRA 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
文本到视频生成(Text-to-Video Generation, T2V)领域进行了全面的综述 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
公众号 · 大模型 · 1 年前 · · |
|
WWW 20224|| GNN能否成为一个好的Adapter? 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
公众号 · 大模型 · 1 年前 · · |
|
超越Transformer和Mamba的新架构! 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
Adam有了mini版:内存占用少一半,吞吐量提升50% 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
KDD2024 | GCOPE:港科广联合港中文提出首个跨域图预训练框架 深度图学习与大模型LLM · 公众号 · · 1 年前 · |
|
ICML 2024 || IR-QLoRA: 大模型量化新方法 深度图学习与大模型LLM · 公众号 · · 1 年前 · |
|
2024图学习理论综述: 关注表达力、泛化性和优化等方面的理论, 涵盖273篇参考文献 深度图学习与大模型LLM · 公众号 · · 1 年前 · |
|
ICML 2024 Oral || DaLore: 大模型加速优化新策略 深度图学习与大模型LLM · 公众号 · · 1 年前 · |
|
MolecularGPT: 用于少样本分子性质预测的大模型 深度图学习与大模型LLM · 公众号 · · 1 年前 · |
|
ICML 2024 || 黎曼预处理器增强LoRA 深度图学习与大模型LLM · 公众号 · · 1 年前 · |
|
ICLR 2022 || Transformer 与 海马体神经表征 深度图学习与大模型LLM · 公众号 · · 1 年前 · |
|
ICML 2024 || “星巴羊”?多解码头加速大模型推理 深度图学习与大模型LLM · 公众号 · · 1 年前 · |
|
LOGS第2024/06/29期 || 复旦大学张晟中:基于结构化压缩的图对比学习训练框架(ICLR... 深度图学习与大模型LLM · 公众号 · · 1 年前 · |
|
ICML 2024 || 多token预测的训练显著提高大模型性能和推理速度 深度图学习与大模型LLM · 公众号 · · 1 年前 · |
|
GraphBridge: 通过局部文本信息和全局结构信息,引入图感知的token减少模块来解决效率和... 深度图学习与大模型LLM · 公众号 · · 1 年前 · |
|
ICML 2024 || LoRA+: 提升模型微调效率的秘诀 深度图学习与大模型LLM · 公众号 · · 1 年前 · |
|
LOGS第2024/06/15期 || 香港科技大学(广州)高子琪:基于离散傅立叶变换的大模型高效微... 深度图学习与大模型LLM · 公众号 · · 1 年前 · |