人工智能项目的开发可分为以数据采集、清洗、标注、增强等流程 为主体的数据准备工作,以模型构建、训练、调优、部署为主体的算法开发工作。其中,由于数据准备工作可用的自动化辅助工具较为匮乏。数据准备 工作对人力劳动的依赖程度较高,整体所需的工作时间占人工智能项目 开发流程的80%。数据标注工作指对模型训练所需的数据样本中的特征要素进行标识与区分。由目前人智能技术的发展仍处干监督学习阶介段,深度学习 为代表的Al算法模型在训练过程中对数据内涵信息及数据之间逻辑的学习及验证基于数据的特征标识实现,数据的标注工作具有必要性, 是数据准备乃至人工智能项目开发的核心工作之一。与数据准备其余工作流程类似,数据的标注工作高度依赖人力劳动。冗长的工作周期及庞大的人力成本成为制约人工智能行业发展的主要因素之一。数据标注服务供给侧的痛点催生市场对自动化工具的需求,推动智能数据标注技术的发展与规模化应用。