专栏名称: 国家数据局
国家数据局新闻宣传、信息公开、服务群众的重要平台,及时发布权威信息,解读重大政策,提供政务服务等。
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  国家数据局

数据标注优秀案例集之三十二 | 数据标注筑基高质量数据集

国家数据局  · 公众号  · 大数据  · 2025-06-08 10:30
    

主要观点总结

本文主要介绍了在大数据背景下,中国移动通信集团及其相关单位在山东标注基地的创新实践。面对大模型发展对高质量数据集的需求,以及数据稀缺、标注低效等问题,通过整合多源数据、研发数据标注工具、构建高质量数据供给平台等一系列举措,实现了数据处理标注自动化率的显著提升,并打造了多个高质量数据集,支撑了多个行业大模型的落地应用。

关键观点总结

关键观点1: 案例背景及需求

随着大模型的发展,对高质量数据集的需求日益增长,但面临数据稀缺和标注低效等难题,导致行业大模型难以实现落地应用。

关键观点2: 多源数据融合与创新模式

在山东标注基地,通过整合通信行业8类核心数据及650TB多源数据,采用“工具+AI预标注+人工补位”的模式,实现了数据处理标注自动化率超过80%。

关键观点3: 高质量数据集的构建与应用

已打造50余个高质量数据集,支撑交通、应急、文旅等领域的大模型落地,推动行业人工智能应用的快速发展。

关键观点4: 特色亮点与成效

通过多渠道数据融合构建多元数据集,聚焦行业痛点打造智能赋能标杆。如‘九天川流大模型’在交通和文旅行业的实际应用,取得了显著的成效。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照