四部门:培育一批数据标注龙头企业
国家发展改革委等四部门近日联合印发的《关于促进数据标注产业高质量发展的实施意见》提出,培育一批数据标注龙头企业,推动数据标注企业规模化、标准化、集约化发展。畅通数据采集、标注、人工智能应用产业链,推动数据标注产业上下游协同发展。
据悉,数据标注产业是对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业。培育壮大数据标注产业对提升数据供给质量、推动人工智能创新发展具有重要支撑作用。
到2027年,数据标注产业规模大幅跃升,年均复合增长率超20%
《实施意见》提出,到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%。培育一批具有影响力的科技型数据标注企业,打造一批产学研用联动的创新载体,建设一批成效明显、特色鲜明的数据标注基地,形成相对完善的数据标注产业生态。
数据标注是对原始数据进行加工处理,比如分类、拉框、注释、标记等加工处理,并将其转换成机器可识别信息的过程。数据标注企业,通常需要完成数据集结构/流程设计、数据处理、数据质检等工作,为下游客户提供训练数据集、定制化服务。
目前市场上有1%的数据能被收集保存下来,同时其中有90%数据是非结构化的数据,这些非结构化的数据只有经过清洗与标注才能被唤醒价值,这就产生了源源不断的清洗与标注需求。
数据标注一直是人工智能技术研发中不可或缺的一环,伴随着AI在自动驾驶、金融、医疗、安防等多个垂直场景的深度落地,数据训练需求海量增长,数据标注也摆脱了传统劳动密集型行业的局限性,向高技术含量、高知识密度和高价值等特性发展。
从应用领域来看,数据标注在计算机视觉、智能语音、自然语言处理等领域都有广泛应用。在具体应用场景中,数据标注还应用于智能安防、自动驾驶、医疗影像分析等领域,满足了这些领域对高质量、专业化场景数据的需求。
根据国家工信安全发展研究中心测算,2022年中国数据加工环节的市场规模约为160亿元。具体来看行业市场规模,2021年我国数据标注行业市场规模达到43.3亿元,同比增长约19.2%,预计到2029年市场规模将达到204.3亿元。
据中研产业研究院分析:
数据标注市场的主要增长动力来自于人工智能技术的快速发展和应用。数据标注作为数据预处理的重要环节,市场需求随之扩大。随着大模型时代的到来,数据标注在AI开发模式中的重要性日益凸显,贯穿大模型的全生命周期,上下游合作关系更为紧密耦合。此外,非结构化数据的清洗与标注需求不断增加,也为数据标注市场带来了源源不断的增长动力。
随着人工智能进入多元行业和场景落地阶段,自动驾驶、医疗、法律、金融等有一定专业性要求的垂直化场景将成为主要需求,从而带动行业进一步朝着垂直化、定制化方向发展。
技术进步也对数据标注市场产生了积极影响。自动化标注技术的出现显著提高了标注效率和准确性,虽然目前还不能完全取代人工标注,但已经大幅减少了人工工作量,并有望在未来实现更高程度的智能化。此外,越来越多的头部公司组建自己的数据标注部门,专业数据标注服务商也涌现出来,进一步推动了市场的成熟和发展。
想要了解更多数据标注行业详情分析,可以点击查看中研普华研究报告。报告根据数据标注行业的发展轨迹及多年的实践经验,对中国数据标注行业的内外部环境、行业发展现状、产业链发展状况、市场供需、竞争格局、标杆企业、发展趋势、机会风险、发展策略与投资建议等进行了分析,并重点分析了我国数据标注行业将面临的机遇与挑战,对数据标注行业未来的发展趋势及前景作出审慎分析与预测。