L4/L5 自动驾驶数据采集与标注系统

1. 数据展示

传感器数据

ID 传感器类型 时间戳 纬度 经度 文件路径
1 camera 1678886400000 30.267 120.123 /path/to/camera_data.jpg
2 lidar 1678886401000 30.268 120.124 /path/to/lidar_data.pcd
3 gps_imu 1678886402000 30.269 120.125 /path/to/gps_imu_data.txt

标注数据

ID 传感器数据ID 标注类型 2D准确率 3D准确率 是否审核
1 1 2d 0.95 -
2 2 3d - 0.92
3 3 fusion 0.90 0.88

成本数据

ID 数据范围起始 数据范围结束 总成本 软件成本 数据恢复时间 每TB存储成本
1 1678886400000 1678890000000 10000 5000 20 10
2 1678890000000 1678893600000 12000 6000 22 9

质量数据

ID 数据范围起始 数据范围结束 2D标注准确率 3D标注准确率 数据完整性 格式兼容性 数据压缩率
1 1678886400000 1678890000000 0.92 0.88 0.98 0.65
2 1678890000000 1678893600000 0.93 0.89 0.99 0.60

2. 功能点展示与操作

格式转换

将标注数据转换为 COCO, KITTI, nuScenes 等常用格式。

数据压缩

使用数据压缩算法(如 gzip)减少存储空间占用。

数据备份

定期进行数据备份,防止数据丢失。

监控存储成本

监控存储成本。

3. 测试数据和指标

格式兼容性

转换为统一格式后的数据是否能够被模型训练工具正确读取,目标:100%

数据压缩率

数据压缩后的体积与原始体积的比率,目标:> 50%

数据恢复时间 (RTO)

从备份中恢复数据所需的时间,目标:< 24 小时

每TB存储成本 (元/TB)

目标:≤ X

4.失效风险全过程

格式转换错误导致数据无法被模型训练工具读取

数据存储介质损坏导致数据丢失

压缩算法选择不当导致解压速度慢