QTCN开发网

标题:Qt/C++音视频开发74-合并标签图形/生成yolo运算结果图形/文字和图形合并成一个/水印滤镜
作者:liudianwu
日期:2024-05-18 09:45
内容:

## 一、前言
在使用yolo做人工智能运算后，运算结果除了一个方框，还可能需要增加文字显示在对应方框上，以便标记是何种物体，比如显示是人还是动物，或者还有可能追踪人员，显示该人员的姓名。这种应用场景非常普遍，而且非常有必要，可以非常直观的直接看到对应移动的物体是什么。当然也有个缺点，就是当图层方框特别多的时候，看起来层叠的，意味着会发生遮挡的情况，导致在同一个区域只能同时看到一个物体，如果有密集恐惧症那就更加麻烦。

用ffmpeg的滤镜功能，可以绘制文字水印和图形水印，但是都是分开的，并没有提供文字和图形水印合并的滤镜，也许将来不久会内置，拭目以待。但是短期内肯定是没有的，这就需要提供一个函数将文字和图形水印合并，同时可空文字是显示在方框的位置，比如左上角、右上角、左下角、右下角，以及显示在方框的里边还是外边，或者说默认外边，当方框超过了图像的区域的时候就显示在里边。说干就干，直接写了几十行，专门完成了这个函数。传入一堆rect区域和文本集合，传出对应的osd对象和graph对象。

## 二、效果图

## 三、体验地址
1. 国内站点：[https://gitee.com/feiyangqingyun](https://gitee.com/feiyangqingyun)
2. 国际站点：[https://github.com/feiyangqingyun](https://github.com/feiyangqingyun)
3. 个人作品：[https://blog.csdn.net/feiyangqingyun/article/details/97565652](https://blog.csdn.net/feiyangqingyun/article/details/97565652)
4. 体验地址：[https://pan.baidu.com/s/1d7TH_GEYl5nOecuNlWJJ7g](https://pan.baidu.com/s/1d7TH_GEYl5nOecuNlWJJ7g) 提取码：01jf 文件名：bin_video_demo。
5. 视频主页：[https://space.bilibili.com/687803542](https://space.bilibili.com/687803542)

## 四、功能特点
### 4.1. 基础功能
1. 支持各种音频视频文件格式，比如mp3、wav、mp4、asf、rm、rmvb、mkv等。
2. 支持本地摄像头设备和本地桌面采集，支持多设备和多屏幕。
3. 支持各种视频流格式，比如rtp、rtsp、rtmp、http、udp等。
4. 本地音视频文件和网络音视频文件，自动识别文件长度、播放进度、音量大小、静音状态等。
5. 文件可以指定播放位置、调节音量大小、设置静音状态等。
6. 支持倍速播放文件，可选0.5倍、1.0倍、2.5倍、5.0倍等速度，相当于慢放和快放。
7. 支持 ..

回复发表
 主题版块