JA EN ZH

目标检测

通过同时预测边界框和类别标签来识别和定位图像中多个目标的计算机视觉任务。

目标检测通过预测空间位置 (边界框) 和类别标签来识别图像中的多个目标。分类回答「图像中有什么」,而检测回答「每个目标在哪里以及是什么」- 这是一个更复杂的问题,具有直接的实际应用。

该领域涵盖自动驾驶、监控、机器人和医学影像。许多应用要求实时性能,使精度-速度权衡成为关键。

标准评估指标是在多个 IoU 阈值上计算的 mAP (平均精度均值)。COCO (80 个类别,33 万张图像) 是主要基准。近期趋势包括开放词汇检测和 Grounding DINO 等将检测与语言统一的基础模型。

Related Terms

Related Articles