【行业】计算机-自动驾驶数据标注(32页)
数据标注是人工智能的基础。数据标注是向训练数据集添加元数据的过程。这种元数据通常采用标签的形式,可以添加到任何类型的数据中,包括文本、图像和视频。添加高质量和高精准的标签是为机器学习开发训练数据集的一个关键过程。人工智能数据标注是数据预处理中不可缺少的阶段,因为监督式机器学习模型可以学习识别标注数据中重复出现的模式。当一个算法处理了大量的标注数据后,算法可以在新的、未标记数据出现时识别相同的模式。因此,数据科学家需要使用清洗过后的标注数据来训练机器学习模型。
中国AI基础数据需求促进数据标注行业快速增长。根据IDC发布的报告,到2025年,中国人工智能数据采标服务市场规模将达到123.4亿元人民币。市场的发展驱动力一方面来源于人工智能市场的迅猛发展,另一方面来源于行业用户加大数据采集力度。自动驾驶领域发展需要海量数据支撑,也促进了基础数据服务市场的发展。自动驾驶感知技术是自动驾驶的核心技术之一,训练自动驾驶感知模型需要使用大量数据,数据标注行业中与自动驾驶相关的数据标注也因此得到快速发展。
L2级自动驾驶渗透率稳步上升,市场向L3+发展。目前在乘用车市场上实现落地的自动驾驶技术处于L2级水平,市场渗透率正稳步提升。实现的功能包括纵向的全速自适应巡航、横向的车道保持、低速场景的自动泊车等。根据IDC发布了《中国自动驾驶汽车市场数据追踪报告》,2022年第一季度L2级自动驾驶在乘用车市场的新车渗透率达23.2%,整个市场处于L2向L3+级别发展的阶段。 随着激光雷达的铺货和成本的降低或将加速L3+的落地。


