|
|
耶鲁:GSM8K多个LLMs已超过94%,基准已失效,用问题链评估LLMs的CoT数学推理 AI修猫Prompt · 公众号 · · 1 年前 · |
|
|
重磅:Mila和谷歌DeepMind以及微软联合发布,并非所有LLM推理者都具备相同能力 AI修猫Prompt · 公众号 · · 1 年前 · |
|
|
OpenAI-o1 preview模型280页最新评估,40位作者发现,解决复杂竞争性问题的成功率8... AI修猫Prompt · 公众号 · · 1 年前 · |
|
|
LeCun表示LLM无法达到人类级智能,两位逻辑学家关于当前AI的对话 AI修猫Prompt · 公众号 · · 1 年前 · |
|
|
LLM做规划产生幻觉怎么破?墨尔本大学暗黑规划,无需专家的PDDL自动化管道 | 最新 AI修猫Prompt · 公众号 · · 1 年前 · |
|
|
用REAP让o1更强!反思、显式问题解构和高级Prompt AI修猫Prompt · 公众号 · · 1 年前 · |
|
|
怎样让你的AI研究更有影响力?看DSPy作者斯坦福博士奥马尔·哈塔布的建议 AI修猫Prompt · 公众号 · · 1 年前 · |
|
|
Prompt输出限制怎么写?用CCoT限制输出长度的推理,大幅提高LLM准确性 AI修猫Prompt · 公众号 · 科技自媒体 · 1 年前 · |
|
|
还吹?OpenAI-o1又被打脸,看佛罗伦萨大学的K-SAT问题 AI修猫Prompt · 公众号 · · 1 年前 · |
|
|
最新,LLM因果推理看这篇调查足够,凯斯西储大学重磅 AI修猫Prompt · 公众号 · · 1 年前 · |
|
|
斯坦福重磅,突破小规模语料瓶颈,EntiGraph合成数据增强算法让LLM更聪明 AI修猫Prompt · 公众号 · · 1 年前 · |
|
|
真的别再吹o1模型是新的范式,看看清华的思维图(DoT)框架,LLM推理集大成者 AI修猫Prompt · 公众号 · · 1 年前 · |
|
|
实锤,我崩溃了,LLM根本无法100%根除幻觉 AI修猫Prompt · 公众号 · · 1 年前 · |
|
|
别吹了,OpenAI-o1绝没吹的那么神,用斯坦福的这条Prompt,一样实现说话之前先思考 AI修猫Prompt · 公众号 · · 1 年前 · |
|
|
证实了,LLM难以学习不可能语言,斯坦福重磅研究获ACL2024最佳论文奖 AI修猫Prompt · 公众号 · 科技自媒体 · 1 年前 · |
|
|
别以为Cursor生成不了屎山代码,用PLANSEARCH给你更多计划,性能提升到77%| Curs... AI修猫Prompt · 公众号 · · 1 年前 · |
|
|
你以为的LLM上下文学习超能力,究竟来自哪里,ICL的内部机制如何 |最新发布 AI修猫Prompt · 公众号 · 科技自媒体 · 1 年前 · |
|
|
你理解的LLM自我纠错能力可能要让你遗憾了,LLM推理能力的真相 |ICLR2024 AI修猫Prompt · 公众号 · · 1 年前 · |
|
|
你写提示词应该更直白一点,把Top-k直接写进Prompt,无需提示的思维链推理 | DeepMin... AI修猫Prompt · 公众号 · · 1 年前 · |
|
|
亚马逊最新发布的PR3框架,用元知识大幅提升LLM对知识库的回答质量 AI修猫Prompt · 公众号 · · 1 年前 · |