Edit online

命令队列模式

16 Dec 2024
Read time: 4 minute(s)

命令队列模式,即 CMD queue 模式。GE 的完整功能需要依赖 MPP 中间件, 在 MPP 中间件中会把用户设置的参数信息转换成硬件可以识别的命令队列信息。

在 CMD queue 模式下,GE 驱动内部以下列命令队列方式执行, GE 驱动只负责接收并执行命令队列:
  • Task:GE 可以执行的最小任务单元,比如一次 blit 操作或一次矩形填充。

  • Batch:是一系列命令的集合,可以包含一个或者多个 task。

    硬件以 batch 为单位执行,软件也必须以 batch 为单位向驱动写入命令。

  • Command Queue:软件可以向 Command Queue 写入多个 batch,硬件以 batch 为单位,按顺序执行。

    注:
    GE Command Queue 是以 ring buffer 的方式实现,关于 ring buffer 的说明,参考具体产品的用户手册 > 多媒体 > Graphics Engine (GE) 章节。

ge_sw_cmdq

1. CMD queue 模式架构图

CMD Queue 模式用户态可使用 ioctl 接口,包括以下操作:

  • IOC_GE_VERSION
  • IOC_GE_MODE
  • IOC_GE_CMD_BUF_SIZE
  • IOC_GE_SYNC
  • IOC_GE_ADD_DMA_BUF
  • IOC_GE_RM_DMA_BUF

初始化流程

GE 驱动的初始化过程见 aic_ge_probe() 函数,除了申请 regs、clk、reset 等资源外, 还申请了存储 Queue 需要的 ring buffer,以及存储 batch 信息的结构体。

Batch 结构体不存储实际的命令,其中保存了一段指向 ring buffer 的空间,包括相对于 ring buffer 起始地址的 offset,以及当前 batch 中的命令 length。batch 结构体定义如下:
struct aic_ge_batch {
    struct list_head list;
    int offset;
    int length;
    int client_id;
};
目前驱动中定义了八个存储 batch 信息的结构体,ring buffer 的 size 定义为 32K。32K 的空间可以缓存超过 256 个 task(假如都是 RGB 格式的 task)。
#define MAX_BATCH_NUM 8
#define CMD_BUF_SIZE  AIC_GE_CMDQ_BUF_LENGTH

下图 ring buffer 中不同的颜色代表不同的 batch 对应的命令:


ge_function_ring_buffer


ge_function_ring_buffer_lite

2. ring buffer 与 batch 关系图

ge_function_ring_buffer

3. ring buffer 与 batch 关系图

Batch 管理

每一个 batch 总共可能存在三种状态:
  • 空闲状态 (free),batch 中没有可用信息在 free batch list 中。

  • Ready 状态,batch 中有等待执行的 cmd 信息在 ready list batch 中。

  • 运行状态,当前硬件正在运行的 batch 既 不在 free list 中也不在 ready list 中。

Batch 状态变化流程如下:

  1. 用户态分配给应用的缓冲 buffer 中,用户应用组织好命令队列,以 batch 为单位,通过标准的 write 接口把命令 copy 到内核中的 buffer。

  2. 内核驱动中维护一个包含每个 batch 起始 offset 和 length 信息的链表,硬件以 batch 为单位执行命令队列。

  3. batch 状态变化流程图所示,出现以下两种情况,需要启动硬件执行 batch 命令:
    • 当应用调用了 write 命令写入当前 batch 信息,并且硬件处于空闲状态

    • 在中断服务判断当前的 ready list batch 不为空,则从列表中 dequeue 一个 batch,送给硬件执行


    ge_batch_status_change

    4. batch 状态变化流程图

多进程支持

中,应用是在线程去调用 GE 的。为了确保不同线程添加的 batch 按照先进先出原则运行,系统需要对多线程进行有效管理。


ge_batch_multi_process_support

5. 多进程支持

在 Luban-Lite 中,应用是在线程去调用 GE 的。当某个进程需要等待当前进程任务是否完成时,需要调用 IOC_GE_SYNC 命令,等待当前进程所有的任务完成即可,如上图所示。 当进程 2 调用 IOC_GE_SYNC 命令时,只需要等待 Batch5、batch3、batch2、batch0 完成即可,不用管后边加入的其他进程的 Batch6、Batch7

当某个线程需要使用 GE 时,IOC_GE_SYNC 的实现流程如下:

  1. 通过 hal_open 接口创建当前 client 的上下文信息,并添加到 client 链表中。每个 client 都有一个唯一的识别 ID。
    struct aic_ge_client {
        struct list_head list;
        struct list_head buf_list;
        struct mutex buf_lock; /* dma buf list lock */
        int id;
        int batch_num;
    };
    struct aic_ge_client {
        struct list_head list;
        struct list_head buf_list;
        int id;
        int batch_num;
    };
  2. 当前用户应用调用hal_write 接口写入一个 batch 命令的时, 当前 batch 中的 client_id 会写入对应的 client 识别 id, 并且对应的 client 上下文中的 batch_num 引用计数会加 1。
  3. 硬件每执行完成一个 batch 产生一次中断,在中断服务程序中查询当前 batch 中的 client_id,并通过 client_id 从 client 链表中找到当前 client, 对应的 client 中的 batch_num 引用计数减 1。同时,通知所有打开了 GE 的应用:
    wake_up_all(&data->wait);
    aicos_event_send(data->wait_event, HW_RUNNING_EVENT);
  4. 用户应用通过接口 IOC_GE_SYNC 等待任务完成,只需要等待当前 client 中的 batch_num 为 0 即可。
    static int ge_client_sync(struct aic_ge_data *data,
                struct aic_ge_client *client)
        while (client->batch_num) {
            ret = wait_event_interruptible_timeout(data->wait,
                                !client->batch_num,
                                GE_TIMEOUT(4));
            if (ret < 0)
                break;
        }
        return ret;
    }
    static int ge_client_sync(struct aic_ge_data *data,
                    struct aic_ge_client *client)
    {
        int ret = 0;
        uint32_t recved;
    
        hal_log_debug("%s\n", __func__);
    
        while (client->batch_num) {
            ret = aicos_event_recv(data->wait_event,
                                    BATCH_NUM_EVENT,
                                    &recved,
                                    GE_TIMEOUT);
            if (ret < 0) {
                break;
            }
        }
    
        hal_log_debug("%s\n", __func__);
    
        return ret;
    }