|
|
两个小模型互相验证,直接比肩大模型?微软的rStar甚至没用CoT和微调 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
联系方式 || 欢迎宣传报道KDD/ICML/ICLR/WWW等会议期刊论文 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
ICML 2024 | 谁说图卷积就不如图Transformer?Mila华为诺亚提出基于连续卷积核... 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
KDD 2024 || 利用大模型提高文本属性图(TAG)图对比学习效果 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
非Transformer架构站起来了!首个纯无注意力大模型,超越开源巨头Llama 3.1 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
WWW2024 || 探讨通过软提示提升大模型在图学习任务中的表现 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
矩阵很难理解,但换个视角或许会不一样! 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
大模型对语言有自己的理解!MIT论文揭示大模型“思维过程” | ICML 24 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
KDD2024 | PolygonGNN: 多边形几何形状的表征学习 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
SIGIR 2024 || GraphGPT: 将大模型与图结构数据对齐,以提高图学习模型的泛化能力 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
ICML 2024 || FLEXTRON: 嵌套弹性结构的MOE 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
EACL || 通过自然语言描述图结构并对大模型进行指令微调,来解决图机器学习任务 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
ICML 2024 || COFT: 减少大模型对长文本的知识幻觉 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
2024 || Q-GaLore: 16G内存训练LLaMA 7B! 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
ICML 2024: LLaGA-解决图数据向LLM可理解格式转换的挑战,同时保持了LLM的通用性 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
ICML 2024 || 图外部注意力机制捕捉图之间的关系 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
一种树状结构状态空间模型GrootVL: 突破序列约束,实现了更强的表示能力 深度图学习与大模型LLM · 公众号 · 大模型 科技自媒体 · 1 年前 · |
|
|
ICML 2024 || qGOFT: 基于Givens旋转的正交微调 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
经过多轮”自学”的AI在面对这些新问题时,表现反而更差! 深度图学习与大模型LLM · 公众号 · 大模型 · 1 年前 · |
|
|
无需人工标注:SELF-GUIDE技术让语言模型自主微调 深度图学习与大模型LLM · 公众号 · 大模型 科技自媒体 · 1 年前 · |