
YOLOv13 于 2025 年 6 月 21 日和 22 日发布,并显示出 YOLO-verse 中检测模型的明显改进。本文探讨了 YOLOv13 是什么、它带来了哪些功能,以及如果你正在开发图像检测模型,你需要做些什么。

YOLOv13 是什么?
自 2 月份发布 YOLOv12 以来,YOLOv13 是 YOLO-verse 中最新的最先进的图像检测模型。
YOLOv13 由清华大学和 iMoonLab 的研究人员开发,与 YOLOv12 和 YOLOv13 相比,它拥有更高的精度和在 COCO 数据集上更高的 mAP,同时每秒浮点运算次数 (FLOP) 大致相同。虽然它体量小巧,却能在项目中发挥重要作用。
抱歉,那些从事 YOLO-verse 的分割、姿势和分类部分的人,YOLOv13 只是检测模型(希望今后能推出 YOLOv13 检测模型的分割版本)。
YOLOv13 有四种尺寸:N ano、S small、L arge 和 e X tra-large(加粗字母为所需的后缀)。

YOLOv13 有什么特点?
结构和技术
YOLOv13 通过利用和开发三项新技术,能够在大约相同的计算规模下实现较高的准确率:
- 基于 DS 的块(不是新的,但已被利用):它不是使用混乱的大型卷积,而是分成三个可组织的块,允许多线程和更快的结果(准确性没有变化)
- HyperACE(基于超图的自适应相关增强):它不是将像素用作特征图中的简单构建块,而是将像素视为顶点,从而实现更好的边缘检测,并在复杂场景中获得更好的性能。
- FullPAD(全管道聚合和分发范例):它建立在 HyperACE 聚合信息的基础上,可实现更高的性能和梯度传播。

统计和结果
Nano(示例):

所有模型都有相同的主题:
总体而言,所需的 FLOP 更少(良好),所需的参数也更少(良好)。AP 指标更高(良好)。然而,延迟略高,甚至高于 YOLOv8,这有点不太好。

如何使用 YOLOv13 模型?
您需要从此处手动下载模型。然后,您就可以正常使用 YOLO 进行训练、验证、预测和导出,因为 YOLOv13 是基于 Ultralytics Python 包构建的。
以下是他们提供的代码:
from ultralytics import YOLO
# VALIDATION =============================================
model = YOLO('yolov13{n/s/l/x}.pt') # Replace with the desired model scale
# TRAINING =============================================
model = YOLO('yolov13n.yaml')
# Train the model
results = model.train(
data='coco.yaml',
epochs=600,
batch=256,
imgsz=640,
scale=0.5, # S:0.9; L:0.9; X:0.9
mosaic=1.0,
mixup=0.0, # S:0.05; L:0.15; X:0.2
copy_paste=0.1, # S:0.15; L:0.5; X:0.6
device="0,1,2,3",
)
# Evaluate model performance on the validation set
metrics = model.val('coco.yaml')
# Perform object detection on an image
results = model("path/to/your/image.jpg")
results[0].show()
# PREDICTION =============================================
model = YOLO('yolov13{n/s/l/x}.pt') # Replace with the desired model scale
model.predict()
# EXPORT =============================================
model = YOLO('yolov13{n/s/l/x}.pt') # Replace with the desired model scale
model.export(format="engine", half=True) # or format="onnx"
我应该尝试 YOLOv13 吗?
是的,即使延迟增加,你也应该尝试一下。有时模型的更高版本可能无法工作,有时则可能工作正常。进一步的训练是必要的,最好比较不同模型的性能,这样你才能知道自己是否获得了最佳结果!

总结
YOLOv13 是一款相当不错的模型,展示了新技术,但感觉和其他模型一样,新技术逐渐被淘汰,延迟仍然在增加。也许我们正处于一个硬件更先进(RTX 5090 来了,呵呵)的情况下,延迟可能不再是问题。我真的很想看到一个延迟更低的模型(准确率下降没关系,但希望有比 YOLOv8n 更好的模型,既要延迟低,又要准确率还行,因为目前我们在这方面只有 YOLOv8n)。
文章评论