标题:Qt/C++音视频开发74-合并标签图形/生成yolo运算结果图形/文字和图形合并成一个/水印滤镜
作者:liudianwu
日期:2024-05-18 09:45
内容:
## 一、前言
在使用yolo做人工智能运算后,运算结果除了一个方框,还可能需要增加文字显示在对应方框上,以便标记是何种物体,比如显示是人还是动物,或者还有可能追踪人员,显示该人员的姓名。这种应用场景非常普遍,而且非常有必要,可以非常直观的直接看到对应移动的物体是什么。当然也有个缺点,就是当图层方框特别多的时候,看起来层叠的,意味着会发生遮挡的情况,导致在同一个区域只能同时看到一个物体,如果有密集恐惧症那就更加麻烦。
用ffmpeg的滤镜功能,可以绘制文字水印和图形水印,但是都是分开的,并没有提供文字和图形水印合并的滤镜,也许将来不久会内置,拭目以待。但是短期内肯定是没有的,这就需要提供一个函数将文字和图形水印合并,同时可空文字是显示在方框的位置,比如左上角、右上角、左下角、右下角,以及显示在方框的里边还是外边,或者说默认外边,当方框超过了图像的区域的时候就显示在里边。说干就干,直接写了几十行,专门完成了这个函数。传入一堆rect区域和文本集合,传出对应的osd对象和graph对象。
## 二、效果图
## 三、体验地址
1. 国内站点:[https://gitee.com/feiyangqingyun](https://gitee.com/feiyangqingyun)
2. 国际站点:[https://github.com/feiyangqingyun](https://github.com/feiyangqingyun)
3. 个人作品:[https://blog.csdn.net/feiyangqingyun/article/details/97565652](https://blog.csdn.net/feiyangqingyun/article/details/97565652)
4. 体验地址:[https://pan.baidu.com/s/1d7TH_GEYl5nOecuNlWJJ7g](https://pan.baidu.com/s/1d7TH_GEYl5nOecuNlWJJ7g) 提取码:01jf 文件名:bin_video_demo。
5. 视频主页:[https://space.bilibili.com/687803542](https://space.bilibili.com/687803542)
## 四、功能特点
### 4.1. 基础功能
1. 支持各种音频视频文件格式,比如mp3、wav、mp4、asf、rm、rmvb、mkv等。
2. 支持本地摄像头设备和本地桌面采集,支持多设备和多屏幕。
3. 支持各种视频流格式,比如rtp、rtsp、rtmp、http、udp等。
4. 本地音视频文件和网络音视频文件,自动识别文件长度、播放进度、音量大小、静音状态等。
5. 文件可以指定播放位置、调节音量大小、设置静音状态等。
6. 支持倍速播放文件,可选0.5倍、1.0倍、2.5倍、5.0倍等速度,相当于慢放和快放。
7. 支持 ..