Bootstrap

YOLOv10-1.1部分代码阅读笔记-autobackend.py

autobackend.py

ultralytics\nn\autobackend.py

目录

autobackend.py

1.所需的库和模块

2.def check_class_names(names): 

3.def default_class_names(data=None): 

4.class AutoBackend(nn.Module): 


1.所需的库和模块

# Ultralytics YOLO 🚀, AGPL-3.0 license

import ast
import contextlib
import json
import platform
import zipfile
from collections import OrderedDict, namedtuple
from pathlib import Path

import cv2
import numpy as np
import torch
import torch.nn as nn
from PIL import Image

from ultralytics.utils import ARM64, LINUX, LOGGER, ROOT, yaml_load
from ultralytics.utils.checks import check_requirements, check_suffix, check_version, check_yaml
from ultralytics.utils.downloads import attempt_download_asset, is_url

2.def check_class_names(names): 

# 这段代码是一个Python函数,名为 check_class_names ,它的目的是验证和转换类名列表或字典,以确保它们符合特定的格式要求。
# 定义了一个名为  check_class_names  的函数,它接受一个参数。
# 1.names :这个参数接受一个变量,它可以是一个列表( list )或字典( dict ),包含类别名称或类别索引与名称的映射。这个参数的目的是提供类别信息,以便函数可以检查和转换这些信息,确保它们符合特定的格式要求。
def check_class_names(names):
    # 检查类名。
    # 如果需要,将 imagenet 类代码映射到人类可读的名称。将列表转换为字典。
    """
    Check class names.

    Map imagenet class codes to human-readable names if required. Convert lists to dicts.
    """
    # 检查传入的 names 是否是一个列表。
    if isinstance(names, list):  # names is a list
        # 如果 names 是一个列表,使用 enumerate 将其转换为字典,其中索引作为键,列表元素作为值。
        names = dict(enumerate(names))  # convert to dict
    # 检查转换后的 names 是否是一个字典。
    if isinstance(names, dict):
        # Convert 1) string keys to int, i.e. '0' to 0, and non-string values to strings, i.e. True to 'True'
        # 如果 names 是一个字典,使用字典推导式将所有的键(key)从字符串转换为整数,并将所有的值(value)转换为字符串。
        names = {int(k): str(v) for k, v in names.items()}
        # 计算转换后的字典 names 的长度,即类的数量。
        n = len(names)
        # 检查字典中最大的键是否大于或等于类的数量。
        if max(names.keys()) >= n:
            # 如果最大的键大于或等于类的数量,则抛出一个 KeyError 异常,提示用户类索引超出了预期的范围。
            raise KeyError(
                f"{n}-class dataset requires class indices 0-{n - 1}, but you have invalid class indices "
                f"{min(names.keys())}-{max(names.keys())} defined in your dataset YAML."    # {n} 类数据集需要类索引 0-{n - 1},但是您在数据集 YAML 中定义了无效的类索引 {min(names.keys())}-{max(names.keys())}。
            )
        # 检查字典中的第一个值是否是一个以"n0"开头的字符串,这通常用于ImageNet数据集中的类代码。
        if isinstance(names[0], str) and names[0].startswith("n0"):  # imagenet class codes, i.e. 'n01440764'
            # 如果第一个值是以"n0"开头的字符串,则从配置文件中加载ImageNet的映射表,该表将类代码映射到人类可读的类名。
            # ROOT -> 获取当前文件的父目录的父目录,即项目的根目录,并将其存储在 ROOT 变量中。注释 # YOLO 表明这是YOLO项目的根目录。
            # def yaml_load(file="data.yaml", append_filename=False): -> 用于加载YAML文件并返回其内容作为字典。返回解析后的字典。 -> return data
            names_map = yaml_load(ROOT / "cfg/datasets/ImageNet.yaml")["map"]  # human-readable names
            # 使用映射表更新 names 字典,将类代码替换为对应的人类可读的类名。
            names = {k: names_map[v] for k, v in names.items()}
    # 返回处理后的 names 字典。
    return names
# 这个函数 check_class_names 的主要目的是确保输入的类名列表或字典符合预期的格式,并将其转换为一个字典,其中包含从0开始的整数键和字符串值。如果输入的类名列表或字典不符合预期,函数会抛出异常。特别地,如果类名以"n0"开头,表明它们是ImageNet的类代码,函数会使用一个映射表将这些代码转换为人类可读的类名。最终,函数返回一个处理后的字典,其中包含正确的类索引和类名。

3.def default_class_names(data=None): 

# 这段代码定义了一个名为 default_class_names 的函数,它用于从给定的数据中加载类名,如果加载失败,则返回一组默认的类名。
# 定义了一个名为 default_class_names 的函数,它接受一个参数。
# data :这个参数用于传递给函数的数据。如果提供了 data ,函数将尝试从中加载YAML格式的类名。如果 data 为 None 或者加载过程中出现错误,函数将返回一个包含默认类名的字典。
def default_class_names(data=None):
    # 将默认类名应用于输入 YAML 文件或返回数字类名。
    """Applies default class names to an input YAML file or returns numerical class names."""
    # 检查传入的 data 参数是否非空(即是否有提供数据)。
    if data:

        # contextlib.suppress(*exceptions)
        # contextlib.suppress 是 Python 标准库 contextlib 模块中的一个上下文管理器,它用于临时忽略指定的异常。
        # 当在 with 语句中使用时 (例 : with contextlib.suppress(ValueError): ) ,如果在代码块中发生了指定的异常, contextlib.suppress 会捕获这些异常并阻止它们传播,允许程序继续执行。
        # 参数 :
        # *exceptions :一个或多个异常类型,这些类型的异常将被忽略。
        # 等效的 try-except 用法 :
        # 使用 contextlib.suppress 可以达到与使用 try-except 块并配合 pass 关键字相同的效果,但通常更加简洁和明确。
        # contextlib.suppress 是在 Python 3.4 中引入的,它提供了一种更优雅和 Pythonic 的方式来忽略特定的异常。

        # 使用 contextlib.suppress 上下文管理器来捕获并忽略在下面的代码块中抛出的任何异常。
        with contextlib.suppress(Exception):
            # 如果 data 非空,调用 check_yaml 函数处理 data ,然后将处理后的数据传递给 yaml_load 函数加载YAML内容,并尝试返回字典中的 "names" 键对应的值,即类名列表。
            # def check_yaml(file, suffix=(".yaml", ".yml"), hard=True): -> 用于检查给定的文件是否具有指定的YAML后缀,并调用另一个函数 check_file 来进行实际的检查。 -> return check_file(file, suffix, hard=hard)
            # def yaml_load(file="data.yaml", append_filename=False): -> 用于加载YAML文件并返回其内容作为字典。返回解析后的字典。 -> return data
            return yaml_load(check_yaml(data))["names"]
    # 如果 data 为空或者在尝试加载类名时发生异常,函数将返回一个默认的类名字典。这个字典包含999个类名,每个类名都是以 "class" 为前缀,后面跟着一个从0到998的数字。
    return {i: f"class{i}" for i in range(999)}  # return default if above errors
# default_class_names 函数旨在提供一种机制来获取类名。如果提供了有效的 data 参数,它会尝试从中加载类名。如果 data 为空或者加载过程中遇到任何异常,函数将返回一个包含999个默认类名的字典,确保即使在数据加载失败的情况下也有一个后备方案。这个函数的设计使得它在处理可能的数据加载问题时更加健壮,并且能够提供一个默认的解决方案。

4.class AutoBackend(nn.Module): 

# 这段代码定义了一个名为 AutoBackend 的类,它是用于运行 Ultralytics YOLO 模型推理的动态后端选择器。这个类提供了一个抽象层,用于支持多种推理引擎,并根据输入模型的格式支持动态后端切换,使得在不同平台上部署模型变得更加容易。
class AutoBackend(nn.Module):
    # 使用 Ultralytics YOLO 模型处理运行推理的动态后端选择。
    # AutoBackend 类旨在为各种推理引擎提供抽象层。它支持多种格式,每种格式都有特定的命名约定,如下所述:
    # 支持的格式和命名约定:
    # | 格式 | 文件后缀 |
    # |-----------------------|-------------------|
    # | PyTorch | *.pt |
    # 该类提供基于输入模型格式的动态后端切换功能,从而更轻松地跨各种平台部署模型。
    """
    Handles dynamic backend selection for running inference using Ultralytics YOLO models.

    The AutoBackend class is designed to provide an abstraction layer for various inference engines. It supports a wide
    range of formats, each with specific naming conventions as outlined below:

        Supported Formats and Naming Conventions:
            | Format                | File Suffix      |
            |-----------------------|------------------|
            | PyTorch               | *.pt             |
            | TorchScript           | *.torchscript    |
            | ONNX Runtime          | *.onnx           |
            | ONNX OpenCV DNN       | *.onnx (dnn=True)|
            | OpenVINO              | *openvino_model/ |
            | CoreML                | *.mlpackage      |
            | TensorRT              | *.engine         |
            | TensorFlow SavedModel | *_saved_model    |
            | TensorFlow GraphDef   | *.pb             |
            | TensorFlow Lite       | *.tflite         |
            | TensorFlow Edge TPU   | *_edgetpu.tflite |
            | PaddlePaddle          | *_paddle_model   |
            | NCNN                  | *_ncnn_model     |

    This class offers dynamic backend switching capabilities based on the input model format, making it easier to deploy
    models across various platforms.
    """

    # 这段代码定义了一个名为 AutoBackend 的 PyTorch 模块,它用于根据不同的模型权重文件动态选择和初始化适合的推理后端。
    # 这个装饰器用于确保在函数内部执行的操作不会跟踪梯度,这对于推理过程是必要的,因为它减少了内存消耗并提高了性能。
    # 这是 AutoBackend 类的构造函数,它初始化类的实例。参数八个参数。
    # 1.self :这是 Python 类的一个特殊参数,它指向类的实例本身。在方法内部, self 用于访问类的属性和方法。
    # 2.weights :字符串参数,默认值为 "yolov8n.pt" 。它指定了模型权重文件的路径。这个文件包含了模型的参数,用于模型的推理过程。
    # 3.device :torch.device 对象参数,默认值为 torch.device("cpu") 。它指定了模型运行的目标设备,可以是 CPU 或 GPU。如果指定为 GPU,需要确保系统中有可用的 NVIDIA GPU,并且已经安装了 CUDA。
    # 4.dnn :布尔参数,默认值为 False 。它指示是否使用 OpenCV 的 DNN 模块进行 ONNX 模型的推理。当设置为 True 时,如果模型是 ONNX 格式,将使用 OpenCV 进行推理。
    # 5.data :可选参数,可以是字符串或 Path 对象,用于指定包含类别名称等额外数据的 data.yaml 文件的路径。
    # 6.fp16 :布尔参数,默认值为 False 。它指示是否启用半精度(FP16)推理,这可以减少模型推理时的内存使用并可能加快推理速度,但可能影响模型精度。
    # 7.batch :整数参数,默认值为 1 。它指定了推理时的批处理大小,即每次推理处理的图像数量。
    # 8.fuse :布尔参数,默认值为 True 。它指示是否融合 Conv2D 和 BatchNorm 层,这是一种优化技术,可以提高模型的推理速度。
    # 9.verbose :布尔参数,默认值为 True 。它指示是否启用详细日志记录,这会在模型加载和推理过程中输出更多的信息。
    @torch.no_grad()
    def __init__(
        self,
        weights="yolov8n.pt",
        device=torch.device("cpu"),
        dnn=False,
        data=None,
        fp16=False,
        batch=1,
        fuse=True,
        verbose=True,
    ):
        # 初始化 AutoBackend 进行推理。
        """
        Initialize the AutoBackend for inference.

        Args:
            weights (str): Path to the model weights file. Defaults to 'yolov8n.pt'.
            device (torch.device): Device to run the model on. Defaults to CPU.
            dnn (bool): Use OpenCV DNN module for ONNX inference. Defaults to False.
            data (str | Path | optional): Path to the additional data.yaml file containing class names. Optional.
            fp16 (bool): Enable half-precision inference. Supported only on specific backends. Defaults to False.
            batch (int): Batch-size to assume for inference.
            fuse (bool): Fuse Conv2D + BatchNorm layers for optimization. Defaults to True.
            verbose (bool): Enable verbose logging. Defaults to True.
        """
        # 这行代码调用父类的构造函数,是Python中继承机制的一部分,确保父类被正确初始化。
        super().__init__()
        # 处理 weights 参数,如果 weights 是一个列表,则取第一个元素;否则直接使用 weights 。这确保了无论传入的是单个权重文件还是权重文件列表,都能正确处理。
        w = str(weights[0] if isinstance(weights, list) else weights)
        # 检查传入的 weights 是否是一个PyTorch模块( torch.nn.Module 的实例),这有助于确定后续如何处理模型。
        nn_module = isinstance(weights, torch.nn.Module)
        # 调用 _model_type 方法来确定模型的类型(如PyTorch、TorchScript、ONNX等),并将结果存储在相应的变量中。
        (
            pt,
            jit,
            onnx,
            xml,
            engine,
            coreml,
            saved_model,
            pb,
            tflite,
            edgetpu,
            tfjs,
            paddle,
            ncnn,
            triton,
        ) = self._model_type(w)

        # &=
        # &= 是一个复合赋值运算符,它用于按位与(AND)操作。这个运算符会将左侧变量与右侧表达式的结果进行按位与操作,并将结果赋值回左侧变量。按位与操作意味着两个比特位进行逻辑与操作,只有当两个位都是 1 时,结果才为 1,否则为 0。
        # &= 运算符是原地操作,这意味着它直接修改左侧变量的值,而不是创建一个新的变量。

        # 更新 fp16 标志,只有当模型类型支持半精度(FP16)时才启用。
        fp16 &= pt or jit or onnx or xml or engine or nn_module or triton  # FP16
        # 设置 nhwc 标志,指示模型是否使用NHWC格式(与PyTorch的默认BCWH格式相对)。
        nhwc = coreml or saved_model or pb or tflite or edgetpu  # BHWC formats (vs torch BCWH)
        # 设置默认的步幅(stride)为32,这是一个模型超参数,影响模型的性能和精度。
        stride = 32  # default stride
        # 初始化 model 和 metadata 变量,它们将分别用于存储 加载的模型 和 模型的元数据 。
        model, metadata = None, None

        # 这段代码是 AutoBackend 类构造函数中的一部分,用于设置模型将要运行的设备(CPU或GPU)。
        # Set device
        # 检查两个条件 :
        # torch.cuda.is_available() 检查系统中是否有可用的 CUDA 设备(即 NVIDIA GPU)。 device.type != "cpu" 检查指定的设备是否不是 CPU。
        # 如果两个条件都满足,则设置 cuda 为 True ,表示可以使用 CUDA。
        cuda = torch.cuda.is_available() and device.type != "cpu"  # use CUDA
        # 检查 cuda 是否为 True ,并且模型不是以下类型之一 :
        # nn_module :PyTorch 模型。
        # pt :PyTorch 权重文件。
        # jit :TorchScript 模型。
        # engine :TensorRT 引擎。
        # onnx :ONNX 模型。
        # 如果 cuda 为 True 但模型不是上述支持 GPU 的类型之一,则执行以下操作。
        if cuda and not any([nn_module, pt, jit, engine, onnx]):  # GPU dataloader formats
            # 将设备设置为 CPU。
            device = torch.device("cpu")
            # 将 cuda 设置为 False ,表示不使用 CUDA。
            cuda = False
        # 这段代码的逻辑是,如果指定了使用 GPU 并且系统支持 CUDA,那么会检查模型类型是否支持 GPU。如果模型不支持 GPU,即使系统支持 CUDA,也会强制将设备设置为 CPU,并禁用 CUDA。这样可以确保模型在不支持 GPU 的情况下不会尝试在 GPU 上运行,避免潜在的错误。

        # 这段代码是用来处理模型权重文件的下载逻辑,确保如果模型文件不是本地的,那么会自动下载到本地。
        # Download if not local
        # 检查模型是否不是 PyTorch 模型( pt )、NVIDIA Triton 模型( triton )或者 PyTorch 神经网络模块( nn_module )。如果这些条件都不满足,意味着模型权重文件不是一个本地文件,是一个需要从远程服务器下载的文件。
        if not (pt or triton or nn_module):
            # 如果模型权重文件不是本地文件,会调用 attempt_download_asset 函数,并传入权重文件的路径或URL( w )。 attempt_download_asset 函数的作用是尝试从给定的URL下载权重文件,并将其保存到本地。如果下载成功,函数会返回本地文件路径,这个路径会被用来替换原来的路径或URL。
            # def attempt_download_asset(file, repo="ultralytics/assets", release="v8.1.0", **kwargs):
            # -> 尝试下载一个指定的资产文件(如模型权重文件)。如果文件存在,返回文件的路径字符串。如果文件在权重目录下存在,返回文件的路径字符串。返回文件的路径字符串。
            # -> return str(file) / return str(SETTINGS["weights_dir"] / file) / return str(file)
            w = attempt_download_asset(w)
        # 这段代码的目的是确保模型权重文件可用于推理。如果权重文件不是本地的 PyTorch 模型、NVIDIA Triton 模型或 PyTorch 神经网络模块,代码会尝试从远程位置下载权重文件,并将其保存到本地,以便后续的模型加载和推理过程可以使用这个本地文件。这样的处理使得用户可以无缝地使用远程存储的模型权重,就像它们已经在本地磁盘上一样。

        # 这段代码处理的是将 PyTorch 模型加载到内存中,并进行一些初始化设置。
        # In-memory PyTorch model    说明接下来的代码块是用来处理 PyTorch 模型的内存加载。
        # 一个条件判断语句。 nn_module 是一个布尔变量,表示传入的 weights 是否是一个 PyTorch 模型模块 ( torch.nn.Module )。
        if nn_module:
            # 如果 nn_module 为 True ,将 PyTorch 模型 ( weights ) 移动到指定的设备( device ),这个设备可以是 CPU 或 GPU。
            model = weights.to(device)
            # 检查是否需要融合层( fuse ),如果需要,它将模型中的 Conv2D 和 BatchNorm 层融合以优化性能,并根据 verbose 参数决定是否输出详细信息。
            model = model.fuse(verbose=verbose) if fuse else model
            # 检查模型是否有 kpt_shape 属性,这个属性通常用于姿态估计模型,表示关键点的形状。
            if hasattr(model, "kpt_shape"):
                # 如果有 kpt_shape 属性,这行代码将其值赋给 kpt_shape 变量,用于后续的姿态估计相关操作。
                kpt_shape = model.kpt_shape  # pose-only
            # 计算模型的步长( stride ),取模型中所有层步长的最大值和 32 的较大者。
            stride = max(int(model.stride.max()), 32)  # model stride
            # 获取模型的类别名称。如果模型有 module 属性(通常用于封装的模型),则从 module 中获取 names ,否则直接从模型中获取。
            names = model.module.names if hasattr(model, "module") else model.names  # get class names
            # 根据 fp16 参数决定模型是使用半精度( half() )还是单精度( float() )。
            model.half() if fp16 else model.float()
            # 将模型显式赋值给 self.model ,这样可以通过 self.model 调用 PyTorch 的方法,如 to() , cpu() , cuda() , half() 等。
            self.model = model  # explicitly assign for to(), cpu(), cuda(), half()
            # 将 pt 变量设置为 True ,表示模型是 PyTorch 模型。
            pt = True
        # 这段代码的主要作用是将传入的 PyTorch 模型加载到内存中,并根据提供的参数进行设备分配、层融合、步长计算、类别名称获取、精度设置等初始化操作。这些步骤确保了模型在后续的推理过程中能够正确运行,并优化了性能。

        # 这段代码是 AutoBackend 类 __init__ 方法中处理 PyTorch 模型的部分。
        # PyTorch    说明接下来的代码块是用来处理 PyTorch 模型的。
        # 一个条件判断语句。 pt 是一个布尔变量,表示模型文件是否是 PyTorch 权重文件( .pt 文件)。
        elif pt:
            # 从 ultralytics.nn.tasks 模块导入 attempt_load_weights 函数,该函数用于加载 PyTorch 模型权重。
            from ultralytics.nn.tasks import attempt_load_weights

            # def attempt_load_weights(weights, device=None, inplace=True, fuse=False):
            # -> 用于尝试加载一个或多个模型权重,并创建一个模型集合(ensemble)。如果 ensemble 中只有一个模型,返回 ensemble 中的单个模型。如果所有检查通过,这行代码返回模型集合。
            # ->  return ensemble[-1] / return ensemble

            # 这个函数调用尝试加载传入的权重文件。如果 weights 参数是列表,则直接使用;否则,使用之前定义的 w 变量。模型被加载到指定的 device 上,并且根据 inplace 和 fuse 参数决定是否进行原地修改和层融合。
            model = attempt_load_weights(
                weights if isinstance(weights, list) else w, device=device, inplace=True, fuse=fuse
            )
            # 检查加载的模型是否有 kpt_shape 属性,这个属性通常用于表示姿态估计模型中关键点的形状。
            if hasattr(model, "kpt_shape"):
                # 如果模型有 kpt_shape 属性,将其值赋给 kpt_shape 变量,以供后续使用。
                kpt_shape = model.kpt_shape  # pose-only
            # 计算模型的步长( stride ),取模型中所有层步长的最大值和 32 的较大者,以确定模型的步长。
            stride = max(int(model.stride.max()), 32)  # model stride
            # 获取模型的类别名称。如果模型有 module 属性(通常用于封装的模型),则从 module 中获取 names ,否则直接从模型中获取。
            names = model.module.names if hasattr(model, "module") else model.names  # get class names
            # 根据 fp16 参数决定模型是使用半精度( half() )还是单精度( float() )。
            model.half() if fp16 else model.float()
            # 将加载的模型赋值给 self.model ,这样可以通过 self.model 调用 PyTorch 的方法,如 to() , cpu() , cuda() , half() 等。
            self.model = model  # explicitly assign for to(), cpu(), cuda(), half()
        # 这段代码的主要作用是加载 PyTorch 模型权重,并进行一些初始化设置,包括层融合、步长计算、类别名称获取、精度设置等。这些步骤确保了模型在后续的推理过程中能够正确运行,并优化了性能。通过将模型赋值给 self.model ,可以在类的其他方法中方便地使用这个模型。

# 可忽略 ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------↓
        # TorchScript
        elif jit:
            LOGGER.info(f"Loading {w} for TorchScript inference...")
            extra_files = {"config.txt": ""}  # model metadata
            model = torch.jit.load(w, _extra_files=extra_files, map_location=device)
            model.half() if fp16 else model.float()
            if extra_files["config.txt"]:  # load metadata dict
                metadata = json.loads(extra_files["config.txt"], object_hook=lambda x: dict(x.items()))

        # ONNX OpenCV DNN
        elif dnn:
            LOGGER.info(f"Loading {w} for ONNX OpenCV DNN inference...")
            check_requirements("opencv-python>=4.5.4")
            net = cv2.dnn.readNetFromONNX(w)

        # ONNX Runtime
        elif onnx:
            LOGGER.info(f"Loading {w} for ONNX Runtime inference...")
            check_requirements(("onnx", "onnxruntime-gpu" if cuda else "onnxruntime"))
            import onnxruntime

            providers = ["CUDAExecutionProvider", "CPUExecutionProvider"] if cuda else ["CPUExecutionProvider"]
            session = onnxruntime.InferenceSession(w, providers=providers)
            output_names = [x.name for x in session.get_outputs()]
            metadata = session.get_modelmeta().custom_metadata_map

        # OpenVINO
        elif xml:
            LOGGER.info(f"Loading {w} for OpenVINO inference...")
            check_requirements("openvino>=2024.0.0")
            import openvino as ov

            core = ov.Core()
            w = Path(w)
            if not w.is_file():  # if not *.xml
                w = next(w.glob("*.xml"))  # get *.xml file from *_openvino_model dir
            ov_model = core.read_model(model=str(w), weights=w.with_suffix(".bin"))
            if ov_model.get_parameters()[0].get_layout().empty:
                ov_model.get_parameters()[0].set_layout(ov.Layout("NCHW"))

            # OpenVINO inference modes are 'LATENCY', 'THROUGHPUT' (not recommended), or 'CUMULATIVE_THROUGHPUT'
            inference_mode = "CUMULATIVE_THROUGHPUT" if batch > 1 else "LATENCY"
            LOGGER.info(f"Using OpenVINO {inference_mode} mode for batch={batch} inference...")
            ov_compiled_model = core.compile_model(
                ov_model,
                device_name="AUTO",  # AUTO selects best available device, do not modify
                config={"PERFORMANCE_HINT": inference_mode},
            )
            input_name = ov_compiled_model.input().get_any_name()
            metadata = w.parent / "metadata.yaml"

        # TensorRT
        elif engine:
            LOGGER.info(f"Loading {w} for TensorRT inference...")
            try:
                import tensorrt as trt  # noqa https://developer.nvidia.com/nvidia-tensorrt-download
            except ImportError:
                if LINUX:
                    check_requirements("nvidia-tensorrt", cmds="-U --index-url https://pypi.ngc.nvidia.com")
                import tensorrt as trt  # noqa
            check_version(trt.__version__, "7.0.0", hard=True)  # require tensorrt>=7.0.0
            if device.type == "cpu":
                device = torch.device("cuda:0")
            Binding = namedtuple("Binding", ("name", "dtype", "shape", "data", "ptr"))
            logger = trt.Logger(trt.Logger.INFO)
            # Read file
            with open(w, "rb") as f, trt.Runtime(logger) as runtime:
                meta_len = int.from_bytes(f.read(4), byteorder="little")  # read metadata length
                metadata = json.loads(f.read(meta_len).decode("utf-8"))  # read metadata
                model = runtime.deserialize_cuda_engine(f.read())  # read engine
            context = model.create_execution_context()
            bindings = OrderedDict()
            output_names = []
            fp16 = False  # default updated below
            dynamic = False
            for i in range(model.num_bindings):
                name = model.get_binding_name(i)
                dtype = trt.nptype(model.get_binding_dtype(i))
                if model.binding_is_input(i):
                    if -1 in tuple(model.get_binding_shape(i)):  # dynamic
                        dynamic = True
                        context.set_binding_shape(i, tuple(model.get_profile_shape(0, i)[2]))
                    if dtype == np.float16:
                        fp16 = True
                else:  # output
                    output_names.append(name)
                shape = tuple(context.get_binding_shape(i))
                im = torch.from_numpy(np.empty(shape, dtype=dtype)).to(device)
                bindings[name] = Binding(name, dtype, shape, im, int(im.data_ptr()))
            binding_addrs = OrderedDict((n, d.ptr) for n, d in bindings.items())
            batch_size = bindings["images"].shape[0]  # if dynamic, this is instead max batch size

        # CoreML
        elif coreml:
            LOGGER.info(f"Loading {w} for CoreML inference...")
            import coremltools as ct

            model = ct.models.MLModel(w)
            metadata = dict(model.user_defined_metadata)

        # TF SavedModel
        elif saved_model:
            LOGGER.info(f"Loading {w} for TensorFlow SavedModel inference...")
            import tensorflow as tf

            keras = False  # assume TF1 saved_model
            model = tf.keras.models.load_model(w) if keras else tf.saved_model.load(w)
            metadata = Path(w) / "metadata.yaml"

        # TF GraphDef
        elif pb:  # https://www.tensorflow.org/guide/migrate#a_graphpb_or_graphpbtxt
            LOGGER.info(f"Loading {w} for TensorFlow GraphDef inference...")
            import tensorflow as tf

            from ultralytics.engine.exporter import gd_outputs

            def wrap_frozen_graph(gd, inputs, outputs):
                """Wrap frozen graphs for deployment."""
                x = tf.compat.v1.wrap_function(lambda: tf.compat.v1.import_graph_def(gd, name=""), [])  # wrapped
                ge = x.graph.as_graph_element
                return x.prune(tf.nest.map_structure(ge, inputs), tf.nest.map_structure(ge, outputs))

            gd = tf.Graph().as_graph_def()  # TF GraphDef
            with open(w, "rb") as f:
                gd.ParseFromString(f.read())
            frozen_func = wrap_frozen_graph(gd, inputs="x:0", outputs=gd_outputs(gd))

        # TFLite or TFLite Edge TPU
        elif tflite or edgetpu:  # https://www.tensorflow.org/lite/guide/python#install_tensorflow_lite_for_python
            try:  # https://coral.ai/docs/edgetpu/tflite-python/#update-existing-tf-lite-code-for-the-edge-tpu
                from tflite_runtime.interpreter import Interpreter, load_delegate
            except ImportError:
                import tensorflow as tf

                Interpreter, load_delegate = tf.lite.Interpreter, tf.lite.experimental.load_delegate
            if edgetpu:  # TF Edge TPU https://coral.ai/software/#edgetpu-runtime
                LOGGER.info(f"Loading {w} for TensorFlow Lite Edge TPU inference...")
                delegate = {"Linux": "libedgetpu.so.1", "Darwin": "libedgetpu.1.dylib", "Windows": "edgetpu.dll"}[
                    platform.system()
                ]
                interpreter = Interpreter(model_path=w, experimental_delegates=[load_delegate(delegate)])
            else:  # TFLite
                LOGGER.info(f"Loading {w} for TensorFlow Lite inference...")
                interpreter = Interpreter(model_path=w)  # load TFLite model
            interpreter.allocate_tensors()  # allocate
            input_details = interpreter.get_input_details()  # inputs
            output_details = interpreter.get_output_details()  # outputs
            # Load metadata
            with contextlib.suppress(zipfile.BadZipFile):
                with zipfile.ZipFile(w, "r") as model:
                    meta_file = model.namelist()[0]
                    metadata = ast.literal_eval(model.read(meta_file).decode("utf-8"))

        # TF.js
        elif tfjs:
            raise NotImplementedError("YOLOv8 TF.js inference is not currently supported.")

        # PaddlePaddle
        elif paddle:
            LOGGER.info(f"Loading {w} for PaddlePaddle inference...")
            check_requirements("paddlepaddle-gpu" if cuda else "paddlepaddle")
            import paddle.inference as pdi  # noqa

            w = Path(w)
            if not w.is_file():  # if not *.pdmodel
                w = next(w.rglob("*.pdmodel"))  # get *.pdmodel file from *_paddle_model dir
            config = pdi.Config(str(w), str(w.with_suffix(".pdiparams")))
            if cuda:
                config.enable_use_gpu(memory_pool_init_size_mb=2048, device_id=0)
            predictor = pdi.create_predictor(config)
            input_handle = predictor.get_input_handle(predictor.get_input_names()[0])
            output_names = predictor.get_output_names()
            metadata = w.parents[1] / "metadata.yaml"

        # NCNN
        elif ncnn:
            LOGGER.info(f"Loading {w} for NCNN inference...")
            check_requirements("git+https://github.com/Tencent/ncnn.git" if ARM64 else "ncnn")  # requires NCNN
            import ncnn as pyncnn

            net = pyncnn.Net()
            net.opt.use_vulkan_compute = cuda
            w = Path(w)
            if not w.is_file():  # if not *.param
                w = next(w.glob("*.param"))  # get *.param file from *_ncnn_model dir
            net.load_param(str(w))
            net.load_model(str(w.with_suffix(".bin")))
            metadata = w.parent / "metadata.yaml"

        # NVIDIA Triton Inference Server
        elif triton:
            check_requirements("tritonclient[all]")
            from ultralytics.utils.triton import TritonRemoteModel

            model = TritonRemoteModel(w)
# 可忽略 ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------↑

        # 这段代码是 AutoBackend 类 __init__ 方法的一部分,用于处理不支持的模型格式。
        # Any other format (unsupported)    说明接下来的代码块是用来处理任何其他不支持的模型格式。
        # 一个条件判断的 else 分支,当所有之前的条件都不满足时,即模型格式不是已知支持的格式,执行此分支的代码。
        else:
            # 从 ultralytics.engine.exporter 模块导入 export_formats 函数,该函数用于获取支持的模型格式列表。
            from ultralytics.engine.exporter import export_formats

            # 引发一个 TypeError 异常,因为传入的模型格式不受支持。
            raise TypeError(
                f"model='{w}' is not a supported model format. "    # model='{w}' 不是受支持的模型格式。
                # export_formats() 函数被调用来获取支持的格式,并嵌入到异常消息中。
                # def export_formats():
                # -> 用于生成一个包含不同模型导出格式及其相关信息的数据框(DataFrame)。将列表 x 转换为 pandas.DataFrame 对象,并指定列名为 ["Format", "Argument", "Suffix", "CPU", "GPU"]。
                # -> return pandas.DataFrame(x, columns=["Format", "Argument", "Suffix", "CPU", "GPU"])
                f"See https://docs.ultralytics.com/modes/predict for help.\n\n{export_formats()}"    # 请参阅https://docs.ultralytics.com/modes/predict 寻求帮助。
            )
        # 这段代码的作用是当传入的模型格式不受 AutoBackend 类支持时,提供给用户一个清晰的错误消息,并指引用户到相关文档页面查找支持的模型格式。这样做可以提高用户体验,使用户能够快速识别问题并找到解决方案。

        # 这段代码是 AutoBackend 类 __init__ 方法中处理外部元数据 YAML 文件的部分。
        # Load external metadata YAML    说明接下来的代码块是用来加载外部元数据 YAML 文件的。
        # 检查 metadata 是否是一个字符串或者 Path 对象,并且对应的文件是否存在。
        if isinstance(metadata, (str, Path)) and Path(metadata).exists():
            # 如果 metadata 文件存在,会加载 YAML 文件内容,并将其赋值回 metadata 变量。
            # def yaml_load(file="data.yaml", append_filename=False): -> 用于加载YAML文件并返回其内容作为字典。返回解析后的字典。 -> return data
            metadata = yaml_load(metadata)
        # 一个条件判断,检查 metadata 是否存在且非空。
        if metadata:
            # 遍历 metadata 字典中的每个键值对。
            for k, v in metadata.items():
                # 如果键 k 是 "stride" 或 "batch",检查并确保这些值被转换为整数。
                if k in ("stride", "batch"):
                    # 将 "stride" 和 "batch" 对应的值转换为整数类型。
                    metadata[k] = int(v)
                # 如果键 k 是 "imgsz"、"names" 或 "kpt_shape",并且对应的值 v 是字符串类型,检查这些条件。
                elif k in ("imgsz", "names", "kpt_shape") and isinstance(v, str):

                    # eval(expression, globals=None, locals=None)
                    # eval() 函数是 Python 的内置函数,用于计算表达式字符串,并返回表达式的值。
                    # 参数 :
                    # expression :一个字符串形式的 Python 表达式。这个表达式可以包含 Python 中有效的任意表达式,例如数字、变量、运算符、函数调用等。
                    # globals :一个字典,包含表达式将会使用的全局变量。如果为 None (默认值),则使用当前环境的全局变量。如果提供了 globals 参数,它将覆盖当前环境的全局变量。
                    # locals :一个字典,包含表达式将会使用的局部变量。如果为 None (默认值),则使用当前环境的局部变量。如果提供了 locals 参数,它将覆盖当前环境的局部变量。
                    # 返回值 :
                    # 返回 expression 表达式计算后的结果。
                    # 安全性 :
                    # 使用 eval() 时需要特别小心,因为它可以执行任意代码。如果 expression 来自不可信的源,那么它可能会执行恶意代码,导致安全问题。
                    # 在实际编程中,通常推荐避免使用 eval() ,除非完全信任输入源,或者确实需要动态执行代码。在很多情况下,可以使用更安全的方法来替代 eval() ,例如使用 ast.literal_eval() 来计算字面量表达式。

                    # 使用 eval 函数将字符串类型的值转换为相应的数据类型。
                    metadata[k] = eval(v)
            # 从 metadata 中获取步长( stride )值,并赋值给 stride 变量。
            stride = metadata["stride"]
            # 从 metadata 中获取任务类型( task )值,并赋值给 task 变量。
            task = metadata["task"]
            # 从 metadata 中获取批处理大小( batch )值,并赋值给 batch 变量。
            batch = metadata["batch"]
            # 从 metadata 中获取图像尺寸( imgsz )值,并赋值给 imgsz 变量。
            imgsz = metadata["imgsz"]
            # 从 metadata 中获取类别名称( names )列表,并赋值给 names 变量。
            names = metadata["names"]
            # 从 metadata 中获取关键点形状( kpt_shape ),如果存在,则赋值给 kpt_shape 变量。
            kpt_shape = metadata.get("kpt_shape")
        # 如果模型不是 PyTorch 权重、Triton 模型或 PyTorch 模块,作为另一个条件判断的开始。
        elif not (pt or triton or nn_module):
            # 如果没有找到元数据,记录一条警告信息,提示用户没有找到指定模型的元数据。
            LOGGER.warning(f"WARNING ⚠️ Metadata not found for 'model={weights}'")    # “警告⚠️未找到‘model={weights}’的元数据。
        # 这段代码的主要作用是加载和处理外部元数据 YAML 文件,将文件中的信息转换为适当的数据类型,并从中提取关键参数,如步长、任务类型、批处理大小、图像尺寸和类别名称。如果元数据文件不存在或模型不是支持的格式,代码将记录一条警告信息。这些元数据对于模型的正确运行和推理是必要的。

        # 这段代码是 AutoBackend 类 __init__ 方法中的一部分,用于确保模型有可用的类别名称列表。
        # Check names    说明接下来的代码块是用来检查类别名称( names )的。
        # 检查局部变量中是否已经定义了 names 变量。 locals() 函数返回当前局部符号表,即当前作用域中的所有变量。
        if "names" not in locals():  # names missing
            # 如果 names 没有在局部变量中定义,这意味着模型的类别名称尚未指定或加载。因此,调用 default_class_names 函数来获取默认的类别名称列表。这个列表基于提供的数据( data )或其他配置。
            # def default_class_names(data=None): -> 用于从给定的数据中加载类名,如果加载失败,则返回一组默认的类名。 -> return yaml_load(check_yaml(data))["names"] / return {i: f"class{i}" for i in range(999)}
            names = default_class_names(data)
        # 无论 names 是从元数据加载的还是从上一步获得的,默认情况下,都会调用 check_class_names 函数来验证和标准化类别名称列表。这个函数会检查名称的有效性,确保它们是正确的数据类型,或者在需要时进行转换。
        # def check_class_names(names): -> 证和转换类名列表或字典,以确保它们符合特定的格式要求。返回处理后的 names 字典。 -> return names
        names = check_class_names(names)
        # 这段代码的目的是确保在模型推理过程中有可用的类别名称列表。如果由于某些原因(例如元数据缺失或格式不支持)没有找到类别名称,它会使用默认的类别名称。然后,它会检查这些名称以确保它们是有效和正确的。这是模型推理中的一个重要步骤,因为类别名称用于将模型输出的类别索引映射到实际的类别标签上。

        # 这段代码是 AutoBackend 类 __init__ 方法中的最后部分,涉及到禁用模型参数的梯度计算,并将局部变量提升为实例变量。
        # Disable gradients    说明接下来的代码块是用来禁用梯度计算的。
        # 一个条件判断语句。 pt 是一个布尔变量,表示模型是否是 PyTorch 模型( .pt 文件)。
        if pt:
            # 如果 pt 为 True ,遍历模型的所有参数。
            for p in model.parameters():
                # 对于每个参数,将其 requires_grad 属性设置为 False 。这意味着在推理过程中,PyTorch 不会计算这些参数的梯度,从而减少内存消耗并提高计算速度。
                p.requires_grad = False

        # 将当前局部变量( locals() )中的所有变量更新到 self.__dict__ 中。 self.__dict__ 是一个字典,存储了实例的所有属性。这样做实际上是将局部变量提升为实例变量,使得这些变量可以在类的其他方法中被访问。
        self.__dict__.update(locals())  # assign all variables to self
        # 这段代码的主要作用是优化推理过程,通过禁用模型参数的梯度计算来减少内存消耗和提高计算速度。同时,它还将局部变量提升为实例变量,使得这些变量在整个类的生命周期内都可访问,这在面向对象编程中是一种常见的做法,可以增强代码的模块化和可重用性。
    # AutoBackend 类的主要目标是提供一个统一的接口来处理不同格式的模型,并在不同的推理后端之间进行切换,从而简化模型部署和推理过程。

    # 这段代码定义了 AutoBackend 类的 forward 方法,该方法负责根据不同的后端执行模型的前向传播(推理)。
    # 这行代码定义了 forward 方法,它接受以下参数 :
    # 1.self : 类实例的引用。
    # 2.im : 输入图像张量。
    # 3.augment : 是否进行数据增强,默认为 False 。
    # 4.visualize : 是否可视化输出,默认为 False 。
    # 5.embed : 可选参数,用于返回特征向量/嵌入。
    def forward(self, im, augment=False, visualize=False, embed=None):
        # 在 YOLOv8 MultiBackend 模型上运行推理。
        """
        Runs inference on the YOLOv8 MultiBackend model.

        Args:
            im (torch.Tensor): The image tensor to perform inference on.
            augment (bool): whether to perform data augmentation during inference, defaults to False
            visualize (bool): whether to visualize the output predictions, defaults to False
            embed (list, optional): A list of feature vectors/embeddings to return.

        Returns:
            (tuple): Tuple containing the raw output tensor, and processed output for visualization (if visualize=True)
        """
        # 解包输入图像张量 im 的形状,获取 批量大小 ( b )、 通道数 ( ch )、 高度 ( h )和 宽度 ( w )。
        b, ch, h, w = im.shape  # batch, channel, height, width
        # 检查是否需要使用 FP16 精度,并且输入图像张量的数据类型不是 FP16。
        if self.fp16 and im.dtype != torch.float16:
            # 如果需要,将输入图像张量转换为 FP16 精度。
            im = im.half()  # to FP16
        # 检查模型是否需要 NHWC(批处理数、高度、宽度、通道数)格式的输入。
        if self.nhwc:
            # 如果需要,将输入图像张量从 PyTorch 的 BCHW 格式转换为 BHWC 格式。
            im = im.permute(0, 2, 3, 1)  # torch BCHW to numpy BHWC shape(1,320,192,3)

        # PyTorch    说明接下来的代码块是用来处理 PyTorch 模型的。
        # 检查模型是否是 PyTorch 模型或 PyTorch 模块。
        if self.pt or self.nn_module:
            # 如果模型是 PyTorch 模型或模块,执行模型的前向传播,传入输入图像张量和其他参数。
            y = self.model(im, augment=augment, visualize=visualize, embed=embed)

# 可忽略 ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------↓
        # TorchScript
        elif self.jit:
            y = self.model(im)

        # ONNX OpenCV DNN
        elif self.dnn:
            im = im.cpu().numpy()  # torch to numpy
            self.net.setInput(im)
            y = self.net.forward()

        # ONNX Runtime
        elif self.onnx:
            im = im.cpu().numpy()  # torch to numpy
            y = self.session.run(self.output_names, {self.session.get_inputs()[0].name: im})

        # OpenVINO
        elif self.xml:
            im = im.cpu().numpy()  # FP32

            if self.inference_mode in {"THROUGHPUT", "CUMULATIVE_THROUGHPUT"}:  # optimized for larger batch-sizes
                n = im.shape[0]  # number of images in batch
                results = [None] * n  # preallocate list with None to match the number of images

                def callback(request, userdata):
                    """Places result in preallocated list using userdata index."""
                    results[userdata] = request.results

                # Create AsyncInferQueue, set the callback and start asynchronous inference for each input image
                async_queue = self.ov.runtime.AsyncInferQueue(self.ov_compiled_model)
                async_queue.set_callback(callback)
                for i in range(n):
                    # Start async inference with userdata=i to specify the position in results list
                    async_queue.start_async(inputs={self.input_name: im[i : i + 1]}, userdata=i)  # keep image as BCHW
                async_queue.wait_all()  # wait for all inference requests to complete
                y = np.concatenate([list(r.values())[0] for r in results])

            else:  # inference_mode = "LATENCY", optimized for fastest first result at batch-size 1
                y = list(self.ov_compiled_model(im).values())

        # TensorRT
        elif self.engine:
            if self.dynamic and im.shape != self.bindings["images"].shape:
                i = self.model.get_binding_index("images")
                self.context.set_binding_shape(i, im.shape)  # reshape if dynamic
                self.bindings["images"] = self.bindings["images"]._replace(shape=im.shape)
                for name in self.output_names:
                    i = self.model.get_binding_index(name)
                    self.bindings[name].data.resize_(tuple(self.context.get_binding_shape(i)))
            s = self.bindings["images"].shape
            assert im.shape == s, f"input size {im.shape} {'>' if self.dynamic else 'not equal to'} max model size {s}"
            self.binding_addrs["images"] = int(im.data_ptr())
            self.context.execute_v2(list(self.binding_addrs.values()))
            y = [self.bindings[x].data for x in sorted(self.output_names)]

        # CoreML
        elif self.coreml:
            im = im[0].cpu().numpy()
            im_pil = Image.fromarray((im * 255).astype("uint8"))
            # im = im.resize((192, 320), Image.BILINEAR)
            y = self.model.predict({"image": im_pil})  # coordinates are xywh normalized
            if "confidence" in y:
                raise TypeError(
                    "Ultralytics only supports inference of non-pipelined CoreML models exported with "
                    f"'nms=False', but 'model={w}' has an NMS pipeline created by an 'nms=True' export."
                )
                # TODO: CoreML NMS inference handling
                # from ultralytics.utils.ops import xywh2xyxy
                # box = xywh2xyxy(y['coordinates'] * [[w, h, w, h]])  # xyxy pixels
                # conf, cls = y['confidence'].max(1), y['confidence'].argmax(1).astype(np.float32)
                # y = np.concatenate((box, conf.reshape(-1, 1), cls.reshape(-1, 1)), 1)
            elif len(y) == 1:  # classification model
                y = list(y.values())
            elif len(y) == 2:  # segmentation model
                y = list(reversed(y.values()))  # reversed for segmentation models (pred, proto)

        # PaddlePaddle
        elif self.paddle:
            im = im.cpu().numpy().astype(np.float32)
            self.input_handle.copy_from_cpu(im)
            self.predictor.run()
            y = [self.predictor.get_output_handle(x).copy_to_cpu() for x in self.output_names]

        # NCNN
        elif self.ncnn:
            mat_in = self.pyncnn.Mat(im[0].cpu().numpy())
            with self.net.create_extractor() as ex:
                ex.input(self.net.input_names()[0], mat_in)
                y = [np.array(ex.extract(x)[1])[None] for x in self.net.output_names()]

        # NVIDIA Triton Inference Server
        elif self.triton:
            im = im.cpu().numpy()  # torch to numpy
            y = self.model(im)

        # TensorFlow (SavedModel, GraphDef, Lite, Edge TPU)
        else:
            im = im.cpu().numpy()
            if self.saved_model:  # SavedModel
                y = self.model(im, training=False) if self.keras else self.model(im)
                if not isinstance(y, list):
                    y = [y]
            elif self.pb:  # GraphDef
                y = self.frozen_func(x=self.tf.constant(im))
                if len(y) == 2 and len(self.names) == 999:  # segments and names not defined
                    ip, ib = (0, 1) if len(y[0].shape) == 4 else (1, 0)  # index of protos, boxes
                    nc = y[ib].shape[1] - y[ip].shape[3] - 4  # y = (1, 160, 160, 32), (1, 116, 8400)
                    self.names = {i: f"class{i}" for i in range(nc)}
            else:  # Lite or Edge TPU
                details = self.input_details[0]
                integer = details["dtype"] in (np.int8, np.int16)  # is TFLite quantized int8 or int16 model
                if integer:
                    scale, zero_point = details["quantization"]
                    im = (im / scale + zero_point).astype(details["dtype"])  # de-scale
                self.interpreter.set_tensor(details["index"], im)
                self.interpreter.invoke()
                y = []
                for output in self.output_details:
                    x = self.interpreter.get_tensor(output["index"])
                    if integer:
                        scale, zero_point = output["quantization"]
                        x = (x.astype(np.float32) - zero_point) * scale  # re-scale
                    if x.ndim > 2:  # if task is not classification
                        # Denormalize xywh by image size. See https://github.com/ultralytics/ultralytics/pull/1695
                        # xywh are normalized in TFLite/EdgeTPU to mitigate quantization error of integer models
                        x[:, [0, 2]] *= w
                        x[:, [1, 3]] *= h
                    y.append(x)
            # TF segment fixes: export is reversed vs ONNX export and protos are transposed
            if len(y) == 2:  # segment with (det, proto) output order reversed
                if len(y[1].shape) != 4:
                    y = list(reversed(y))  # should be y = (1, 116, 8400), (1, 160, 160, 32)
                y[1] = np.transpose(y[1], (0, 3, 1, 2))  # should be y = (1, 116, 8400), (1, 32, 160, 160)
            y = [x if isinstance(x, np.ndarray) else x.numpy() for x in y]
# 可忽略 ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------↑

        # for x in y:
        #     print(type(x), len(x)) if isinstance(x, (list, tuple)) else print(type(x), x.shape)  # debug shapes
        # 检查模型输出 y 是否是列表或元组。
        if isinstance(y, (list, tuple)):
            # 如果输出 y 是列表或元组,并且只包含一个元素,将单个元素转换为 PyTorch 张量并返回。如果包含多个元素,这行代码将每个元素转换为 PyTorch 张量,并返回一个包含这些张量的列表。
            return self.from_numpy(y[0]) if len(y) == 1 else [self.from_numpy(x) for x in y]
        # 如果输出 y 不是列表或元组,开始 else 分支。
        else:
            # 将单个输出 y 转换为 PyTorch 张量并返回。
            return self.from_numpy(y)
    # forward 方法是模型推理的核心,它负责接收输入图像张量,根据模型的需求进行预处理(如精度转换和格式转换),执行模型的前向传播,并处理输出,将其转换为 PyTorch 张量。这个方法的设计使得模型可以灵活地处理不同类型的输入和输出,同时确保输出的一致性。

    # 这段代码定义了 AutoBackend 类的 from_numpy 方法,它用于将 Numpy 数组转换为 PyTorch 张量,并确保该张量被移动到正确的设备上。
    # 这行代码定义了 from_numpy 方法,它接受一个参数。
    # 1.x :这个参数是要被转换的 Numpy 数组或已经是 PyTorch 张量的对象。
    def from_numpy(self, x):
        # 将 numpy 数组转换为张量。
        """
        Convert a numpy array to a tensor.

        Args:
            x (np.ndarray): The array to be converted.

        Returns:
            (torch.Tensor): The converted tensor
        """
        # 方法的主体,它执行以下逻辑 :
        # isinstance(x, np.ndarray) : 这个表达式检查 x 是否为 Numpy 数组。
        # torch.tensor(x) : 如果 x 是 Numpy 数组,这个表达式将 x 转换为 PyTorch 张量。
        # .to(self.device) : 这个表达式将转换得到的 PyTorch 张量移动到 self.device 指定的设备上,这个设备可以是 CPU 或 GPU。
        # else x : 如果 x 已经不是 Numpy 数组(即已经是 PyTorch 张量或其他类型),则直接返回 x 。
        return torch.tensor(x).to(self.device) if isinstance(x, np.ndarray) else x
    # from_numpy 方法是一个实用的工具方法,它确保了无论是 Numpy 数组还是 PyTorch 张量,都能被正确地转换和移动到指定的设备上,以便进行后续的计算。这对于在 PyTorch 框架中进行深度学习推理和训练尤为重要,因为计算通常需要在特定的设备上执行。

    # 这段代码定义了 AutoBackend 类的 warmup 方法,用于对模型进行预热,以提高推理性能。
    # 这行代码定义了 warmup 方法,它接受一个参数。
    # 1.imgsz :该参数指定了用于预热的虚拟输入图像的大小,默认为 (1, 3, 640, 640) ,即一批大小为1,3个颜色通道,640x640像素的图像。
    def warmup(self, imgsz=(1, 3, 640, 640)):
        # 通过使用虚拟输入运行一次前向传递来预热模型。
        """
        Warm up the model by running one forward pass with a dummy input.

        Args:
            imgsz (tuple): The shape of the dummy input tensor in the format (batch_size, channels, height, width)
        """
        # 创建一个元组 warmup_types ,包含所有与模型类型相关的布尔变量,用于确定哪些类型的模型需要预热。
        warmup_types = self.pt, self.jit, self.onnx, self.engine, self.saved_model, self.pb, self.triton, self.nn_module
        # 检查是否有任何模型类型需要预热,并且设备不是 CPU 或者是 Triton 服务器。如果条件满足,则执行预热操作。
        if any(warmup_types) and (self.device.type != "cpu" or self.triton):
            # 创建一个空的 PyTorch 张量 im ,作为预热的输入数据。张量的大小由 imgsz 指定,数据类型根据 self.fp16 决定是半精度还是单精度,并且确保张量被创建在正确的设备上。
            im = torch.empty(*imgsz, dtype=torch.half if self.fp16 else torch.float, device=self.device)  # input
            # 确定预热的次数。如果模型是 TorchScript ( self.jit 为 True ),则预热两次,否则预热一次。
            for _ in range(2 if self.jit else 1):
                # 执行 forward 方法,将虚拟输入数据 im 传递给模型,以进行预热。这个过程可以帮助加速模型的推理过程,特别是在 GPU 上。
                self.forward(im)  # warmup
    # warmup 方法通过在模型上运行一个或多个虚拟输入来预热模型,这有助于提高模型在实际推理时的性能。这个方法特别适用于那些需要预热的模型类型,并且在非 CPU 设备上执行。预热步骤是深度学习模型优化中的一个常见做法,可以减少推理时的延迟,提高吞吐量。

    # 这段代码定义了 AutoBackend 类的静态方法 _model_type ,它用于确定给定模型路径 p 的模型类型。
    # 这个装饰器表示 _model_type 是一个静态方法,它不需要访问类的实例或类变量。
    @staticmethod
    # 定义了静态方法 _model_type ,它接受一个参数。
    # 1.p :该参数是模型文件的路径,默认为 "path/to/model.pt" 。
    def _model_type(p="path/to/model.pt"):
        # 此函数接受模型文件的路径并返回模型类型。可能的类型为 pt、jit、onnx、xml、engine、coreml、saved_model、pb、tflite、edgetpu、tfjs、ncnn 或 paddle。
        """
        This function takes a path to a model file and returns the model type. Possibles types are pt, jit, onnx, xml,
        engine, coreml, saved_model, pb, tflite, edgetpu, tfjs, ncnn or paddle.

        Args:
            p: path to the model file. Defaults to path/to/model.pt

        Examples:
            >>> model = AutoBackend(weights="path/to/model.onnx")
            >>> model_type = model._model_type()  # returns "onnx"
        """
        # 从 ultralytics.engine.exporter 模块导入 export_formats 函数,该函数用于获取支持的模型格式。
        from ultralytics.engine.exporter import export_formats

        # 调用 export_formats 函数获取支持的模型格式后缀列表,并将其存储在变量 sf 中。
        # def export_formats():
        # -> 用于生成一个包含不同模型导出格式及其相关信息的数据框(DataFrame)。将列表 x 转换为 pandas.DataFrame 对象,并指定列名为 ["Format", "Argument", "Suffix", "CPU", "GPU"]。
        # -> return pandas.DataFrame(x, columns=["Format", "Argument", "Suffix", "CPU", "GPU"])
        sf = list(export_formats().Suffix)  # export suffixes
        # 检查 p 是否不是 URL 也不是字符串。如果不是,那么执行以下操作。
        if not is_url(p) and not isinstance(p, str):
            # 如果 p 不是 URL 也不是字符串,调用 check_suffix 函数来检查 p 的后缀是否在支持的格式列表 sf 中。
            # def check_suffix(file="yolov8n.pt", suffix=".pt", msg=""): -> 用于检查一个或多个文件名是否具有指定的后缀。
            check_suffix(p, sf)  # checks
        # 获取路径 p 的文件名,并将其存储在变量 name 中。
        name = Path(p).name
        # 创建一个布尔列表 types ,列表中的每个元素表示文件名 name 是否包含支持的格式后缀 s 。
        types = [s in name for s in sf]
        # 特别处理 Apple CoreML 的旧格式 .mlmodel ,如果文件以 .mlmodel 结尾,则将 types 列表的第 6 个元素(索引从 0 开始)设置为 True 。
        types[5] |= name.endswith(".mlmodel")  # retain support for older Apple CoreML *.mlmodel formats
        # 确保 TensorFlow Lite 和 TensorFlow Edge TPU 格式不会同时为 True 。如果 TensorFlow Lite 为 True ,则确保 TensorFlow Edge TPU 为 False 。
        types[8] &= not types[9]  # tflite &= not edgetpu
        # 检查 types 列表中是否有任何 True 值。
        if any(types):
            # 如果 types 列表中有 True 值,将变量 triton 设置为 False ,表示模型不是 Triton 格式。
            triton = False
        # 如果 types 列表中没有 True 值,开始 else 分支。
        else:
            from urllib.parse import urlsplit

            # urlsplit(urlstring, scheme='', allow_fragments=True)
            # urlsplit() 函数是 Python 标准库 urllib.parse 模块中的一个函数,它用于将一个 URL 分解成几个组件。
            # 参数说明 :
            # urlstring :要分解的 URL 字符串。
            # scheme :可选参数,如果提供了这个参数, urlsplit() 会尝试将 URL 按照提供的 scheme 来解析。默认为空字符串,表示不指定方案。
            # allow_fragments :可选参数,布尔值,指定是否允许 URL 中包含片段(fragment)。默认为 True 。
            # 返回值 :
            # urlsplit() 函数返回一个 ParseResult 对象,该对象包含以下属性 :
            # scheme :URL 的协议部分,例如 "http" 或 "https"。
            # netloc :网络位置部分,包括域名和端口号(如果有的话),例如 "www.example.com:80"。
            # path :URL 的路径部分,例如 "/path/to/resource"。
            # params :查询字符串之前的参数部分(对于大多数 URL 不太常见)。
            # query :查询字符串部分,例如 "key=value"。
            # fragment :URL 的片段部分(也称为锚点),例如 "#section1"。
            # 如果原始 URL 字符串中不包含某个部分,对应的属性将会是空字符串。
            # 这个函数是处理 URL 的常用工具,可以帮助开发者提取 URL 的各个组成部分,或者验证 URL 的格式。

            # 使用 urlsplit 函数解析路径 p ,以确定它是否是一个 URL。
            url = urlsplit(p)
            # 检查解析后的 URL 是否有网络位置( netloc )、路径( path ),并且 scheme 是 "http" 或 "grpc"。如果所有条件都满足,则将 triton 设置为 True 。
            triton = bool(url.netloc) and bool(url.path) and url.scheme in {"http", "grpc"}

        # 返回一个列表,包含 types 列表和 triton 变量的值,表示模型的类型。
        return types + [triton]
    # _model_type 方法用于确定给定路径 p 的模型类型。它首先检查路径是否包含支持的文件格式后缀,然后特别处理一些旧的格式和 Triton 格式。最终返回一个列表,表示模型的类型。这个方法有助于 AutoBackend 类确定如何处理不同的模型格式。
# AutoBackend 类提供了一个统一的接口来处理不同格式的模型,并根据模型类型动态选择后端进行推理。这使得在不同平台上部署和运行 Ultralytics YOLO 模型变得更加灵活和方便。通过支持多种模型格式和后端, AutoBackend 类大大扩展了模型的适用性和便携性。

;