今天看啥  ›  专栏  ›  量化研究方法

又得罪人了:国内大模型们的“学术搜索”就是花拳绣腿

量化研究方法  · 公众号  · 互联网短视频 科技自媒体  · 2025-09-10 16:55
    

主要观点总结

本文对比了多款大模型的学术搜索功能,包括秘塔、豆包、夸克、KIMI、讯飞星火、阶跃AI以及Grok。通过统一测试题目,围绕'计算传播学'在中国的发展脉络进行测评,从精准度、准确性、全面性、综合深度、时效性五个维度进行打分。结果发现,Grok具有压倒性优势,国内大模型在学术搜索功能上存在欠缺。文章还指出中文文献的特殊性及大模型在检索能力上的差异。

关键观点总结

关键观点1: 大模型学术搜索功能测评

本文对不同的大模型进行了学术搜索功能测评,包括秘塔、豆包、夸克、KIMI、讯飞星火、阶跃AI,并与Grok进行了对比。

关键观点2: 测评维度

测评从精准度、准确性、全面性、综合深度、时效性五个维度进行打分,全面评估了各模型的学术搜索能力。

关键观点3: 测评结果

测评结果显示,Grok具有压倒性优势,国内大模型在学术搜索功能上存在欠缺,尤其在理解用户意图、文献的全面性和深度加工方面有待提升。

关键观点4: 中文文献的特殊性

文章指出中文文献的特殊性,以及大模型在检索能力上的差异,特别是绕过知网等平台的检索能力。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照