数据标注,正迎来关键时刻。作为AI认识世界的起点,数据标注本质上是将现实世界信 息结构化、数字化,充分发挥数据信息的价值。 ⼤模型时代到来,AIGC众多垂直场景落地,以及通⽤智能、具⾝智能等前沿领域探索, 与⾼质量、专业化的场景数据密不可分,数据标注从劳动密集型加速朝着知识密集型转 型,⾏业壁垒进⼀步提⾼。 作为底层基础服务,数据标注贯穿⼤模型全⽣命周期(训练测试、评估验证和应⽤迭 代)。⼀⽅⾯,牵涉关键Know-how,更多⼤模型公司/AI企业选择⾃建标注团队和管线; 另⼀⽅⾯,上下游合作关系将更为紧密和耦合,专业数据服务提供商更多机会将在垂直 领域,帮助企业完成私有化部署。 机遇与挑战并存。合成数据作为新衍⽣赛道,潜在市场空间巨⼤。与此同时,数据标注 标准难以统⼀、数据处理流程尚未规范,⾼学历多领域多专业成为标注⼈才的硬指标。