大家好,又见面了,我是你们的朋友全栈君。
文章目录
一、YUV 简介
YUV
:是一种颜色编码方法,常使用在各个视频处理组件中
Y'UV(模拟), YCbCr(数字), YPbPr
等专有名词都可以称为 YUV,彼此有重叠Y
表示明亮度(单取此通道即可得灰度图),U
和V
则是描述图像的色彩饱和度,用于指定像素的颜色- 编解码:采集到的视频数据一般是 RGB24,为了节省带宽,一般需要经过 编码转换(RGB2YUV) 为 NV12 进行传输;应用时一般需要经过 解码转换(YUV2RGB) 为 RGB 用于显示或后续算法
- YUV 采样方式及原理:根据人眼的特点,将人眼相对不敏感的色彩信息进行压缩采样(亮度保持不变),得到相对小的文件进行播放和传输
YUV4:2:0
数据,每四个 Y 共用一组 UV 分量,在内存中的长度是h * w + h * w / 4 + h * w / 4 = h * w *1.5
,是RGB(h * w * 3)
格式视频数据内存的一半,每个像素的 Y 数据保留, 两个像素数据只保留一个 U 或者 V 数据YUV4:2:2
数据,每两个 Y 共用一组 UV 分量,在内存中的长度是h * w + h * w / 2 + h * w / 2 = h * w *2
,是RGB(h * w * 3)
格式视频数据内存 2/3,每两个相邻的像素,一个丢弃 V 数据,一个丢弃 U 数据YUV4:4:4
数据,每一个 Y 共用一组 UV 分量,在内存中的长度是h * w + h * w + h * w = h * w *3
,与RGB(h * w * 3)
格式视频数据内存一样- YUV 存储格式:
packed
(打包格式):每个像素点的 Y,U,V 是连续交叉存储的(YUVYUVYUVYUV)planar
(平面格式):先连续存储所有像素点的 Y,紧接着存储所有像素点的 U,随后是所有像素点的V(YYYYUUVV)semi-planar
(半平面格式):先连续存储所有像素点的 Y,紧接着连续交叉存储所有像素点的U,V(YYYYUV)- YUV444 & RGB 相互转换:
- 图形显示时常用 RGB 模型,而 YUV 常用在数据传输场景,所以这两种颜色模型之间经常需要进行转换
- 可以根据其采样格式来从码流中还原每个像素点的
YUV
值,进而通过YUV
与RGB
的转换公式提取出每个像素点的RGB
值,然后显示出来(可参考博客:YUV 采样与恢复 )
# BT601(SDTV)/BT709(HDTV)/BT2020(UHDTV) 定义了 RGB 和 YUV 互转的色域标准规范
# BT2020 的 YUV 转换公式和 BT601 BT709 都是不同的,但是两者的取值范围是相同的,一般 HD 视频(1080p)使用 BT601 转换, UHDTV(4k或8K)使用 BT2020 协议转换, 若视频信号中无色域标志或者色彩转换矩阵, 默认使用 BT601 即可, ffmpeg 转 rgb 也是这样操作的。
# 参考:https://www.zhihu.com/question/20656646/answer/261286123
# RGB to YCbCr(YUV444),YCbCr 是 YUV 颜色空间的偏移版本,适用于数字视频
# RGB 范围 [0,255],Y 范围 [16,235] ,UV 范围 [16,239]。如果计算结果超过了取值范围要进行截取。
Y = 0.257 * R + 0.504 * G + 0.098 * B + 16;
U = -0.148 * R - 0.291 * G + 0.439 * B + 128;
V = 0.439 * R - 0.368 * G - 0.071 * B + 128;
# YCbCr(YUV444)to RGB
# RGB 范围 [0,255],Y 范围 [16,235] ,UV 范围 [16,239]。如果计算结果超过了取值范围要进行截取
R = 1.164 * (Y - 16) + 1.596 * (V - 128);
G = 1.164 * (Y - 16) - 0.813 * (V - 128) - 0.391 * (U - 128);
B = 1.164 * (Y - 16) + 2.018 * (U - 128);
# PS:上述符号均在原值基础上进行了伽马校正, 伽马校正有助于弥补在抗锯齿的过程中
# 线性分配伽马值所带来的细节损失,使图像细节更加丰富。在没有采用伽马校正的情况下
# 暗部细节不容易显现出来,而采用了这一图像增强技术以后,图像的层次更加明晰了
# OpenCV 读取图像转换成 YUV444
for(l32Index1 = 0; l32Index1 < cv_img.rows; l32Index1++)
{
for(l32Index2 = 0; l32Index2 < cv_img.cols; l32Index2++)
{
# Y = 0.257*R + 0.504*G + 0.098*B + 16
f32YTmp = 0.257 * (int)(cv_img.at<cv::Vec3b>(l32Index1, l32Index2)[2]) + 0.504 * (int)(cv_img.at<cv::Vec3b>(l32Index1, l32Index2)[1]) + 0.098 * (int)(cv_img.at<cv::Vec3b>(l32Index1, l32Index2)[0]) + 16;
u8YTmp = MIN(256, (uchar)(f32YTmp + 0.5f));
cv_img_yuv.at<cv::Vec3b>(l32Index1, l32Index2)[0] = u8YTmp;
# U = -0.148*R - 0.291*G + 0.439*B + 128
f32UTmp = -0.148 * (int)(cv_img.at<cv::Vec3b>(l32Index1, l32Index2)[2]) - 0.291 * (int)(cv_img.at<cv::Vec3b>(l32Index1, l32Index2)[1]) + 0.439 * (int)(cv_img.at<cv::Vec3b>(l32Index1, l32Index2)[0]) + 128;
u8UTmp = (uchar)(f32UTmp + 0.5f);
cv_img_yuv.at<cv::Vec3b>(l32Index1, l32Index2)[1] = u8UTmp;
# V = 0.439*R - 0.368*G - 0.071*B + 128
f32VTmp = 0.439 * (int)(cv_img.at<cv::Vec3b>(l32Index1, l32Index2)[2]) - 0.368 * (int)(cv_img.at<cv::Vec3b>(l32Index1, l32Index2)[1]) - 0.071 * (int)(cv_img.at<cv::Vec3b>(l32Index1, l32Index2)[0]) + 128;
u8VTmp = (uchar)(f32VTmp + 0.5f);
cv_img_yuv.at<cv::Vec3b>(l32Index1, l32Index2)[2] = u8VTmp;
}
}
一、YUV 采样格式介绍
1、YUV420(NV12、NV21、I420、YV12)
# NV12、NV21 的存储格式为 Y 平面,UV 打包一个平面,共两个平面,即:先连续存储 Y,然后连续交叉存储 UV
# 不同点在于 UV 的排列顺序,SP 为 Semi-Planar 的缩写
# NV12:先是 w * h 长度的 Y,后面跟 w * h * 0.5 长度的 UV(交叉存储),总长度为 w * h * 1.5
# NV21:先是 w * h 长度的 Y,后面跟 w * h * 0.5 长度的 VU(交叉存储),总长度为 w * h * 1.5
NV12: YYYYYYYY UVUV => YUV420SP # iOS 平台常用 NV12
NV21: YYYYYYYY VUVU => YUV420SP # Android 平台常用 NV21
# I420、YV12 三个分量均为平面格式,共三个平面,即:先连续存储 Y,然后连续存储 U,最后连续存储 V
# 不同点在于 U V 的排列顺序,P 为 Planar 的缩写
# I420:先是 w * h 长度的 Y,后面跟 w * h * 0.25 长度的 U, 最后是 w * h * 0.25 长度的 V,总长度为 w * h * 1.5
# YV12:先是 w * h 长度的 Y,后面跟 w * h * 0.25 长度的 V, 最后是 w * h * 0.25 长度的 U,总长度为 w * h * 1.5
I420: YYYYYYYY UU VV => YUV420P # Android 平台常用 I420
YV12: YYYYYYYY VV UU => YUV420P
- 假设一个分辨率为
6X4
的YUV
图像(占用内存大小 6 ∗ 4 ∗ 1.5 = 36 6*4*1.5=36 6∗4∗1.5=36),它们的格式如下图:
2、YUV422(NV16、NV61、I422、YV16、YUVY、VYUY、UYVY)
# NV16、NV61 的存储格式为 Y 平面,UV 打包一个平面,共两个平面,即:先连续存储 Y,然后连续交叉存储 UV
# 不同点在于 UV 的排列顺序,SP 为 Semi-Planar 的缩写
# NV16:先是 w * h 长度的 Y,后面跟 w * h 长度的 UV(交叉存储),总长度为 w * h * 2
# NV61:先是 w * h 长度的 Y,后面跟 w * h 长度的 VU(交叉存储),总长度为 w * h * 2
NV16: YYYYYYYY UVUVUVUV => YUV422SP
NV61: YYYYYYYY VUVUVUVU => YUV422SP
# I422、YV16 三个分量均为平面格式,共三个平面,即:先连续存储 Y,然后连续存储 U,最后连续存储 V
# 不同点在于 U V 的排列顺序,P 为 Planar 的缩写
# I420:先是 w * h 长度的 Y,后面跟 w * h * 0.5 长度的 U, 最后是 w * h * 0.5 长度的 V,总长度为 w * h * 2
# YV12:先是 w * h 长度的 Y,后面跟 w * h * 0.5 长度的 V, 最后是 w * h * 0.5 长度的 U,总长度为 w * h * 2
I422: YYYYYYYY UUUU VVVV => YUV422P
YV16: YYYYYYYY VVVV UUUU => YUV422P
# YUVY、VYUY、UYVY 为打包格式:每个像素点的 Y,U,V 是连续交叉存储
# YUVY:在 Packed 内部,YUV 的排列顺序是 YUVY,两个 Y 共用一组 UV
# VYUY:在 Packed 内部,YUV 的排列顺序是 VYUY,两个 Y 共用一组 UV
# UYVY:在 Packed 内部,YUV 的排列顺序是 UYVY,两个 Y 共用一组 UV
YUVY: YUVY YUVY YUVY YUVY => YUV422
VYUY: VYUY VYUY VYUY VYUY => YUV422
UYVY: UYVY UYVY UYVY UYVY => YUV422
3、YUV444(I444、YV24)
# I444、YV24三个分量均为平面格式,共三个平面,即:先连续存储 Y,然后连续存储 U,最后连续存储 V
# 不同点在于 U V 的排列顺序,P 为 Planar 的缩写
# I444:先是 w * h 长度的 Y,后面跟 w * h 长度的 U, 最后是 w * h 长度的 V,总长度为 w * h * 3
# YV24:先是 w * h 长度的 Y,后面跟 w * h 长度的 V, 最后是 w * h 长度的 U,总长度为 w * h * 3
I444: YYYYYYYY UUUUUUUU VVVVVVVV => YUV420P
YV24: YYYYYYYY VVVVVVVV UUUUUUUU => YUV420P
三、常用视频分辨率及码率、帧率介绍
- 常用视频分辨率(w*h):
720P(1280*720):
表示视频有 720 行像素(height),大约 100w 像素,P(Progressive 的缩写)本身表示的是逐行扫描
1080P(1920*1080):
表示视频有 1080 行像素(height),大约 200w 像素2K(2048*1080):
表示视频有2048(2*2^10=2K)
列的像素数(width),大约 200w 像素,最常见的是影院级别的 2K,其它还有2048×1536(QXGA)2560×1600(WQXGA),2560×1440(Quad HD)
等4K(3840*2160/4096*2160):
表示视频有4096(4*2^10=4K)
列的像素数(width),大约 800~900 w 像素
- 码流(Data Rate):
- 也叫码率,指的是视频文件在
单位时间内使用的数据流量
,对视频编码画面质量的控制起到重要作用 - 在同样分辨率下,视频文件码流越大,压缩比就越小,画面质量就越好
- 也叫码率,指的是视频文件在
- 帧率(fps):
- 指的是每秒钟传输图片的帧数,帧率越高,性能越好
- H.264 和 H.265 的区别:
- 均指视频编码的标准,H265 在保证清晰度的同时降低了码流,可以节约存储空间,同时降低了网络带宽
- 均指视频编码的标准,H265 在保证清晰度的同时降低了码流,可以节约存储空间,同时降低了网络带宽
四、读取 YUV(NV12) 视频文件并保存
- 1、使用 FFMPEG 工具实现:
- nv12 数据转 jpg:
.\ffmpeg.exe -y -s 1920x1080 -pix_fmt nv12 -i .\output\1_NV12.yuv .\output\1_NV12\image%d.jpg
- jpg 数据转 nv12:
.\ffmpeg.exe -s 1920x1080 -i .\input\image%d.jpg -pix_fmt nv12 test.yuv
- h265 数据转 nv12:
.\ffmpeg.exe -i .\input\1.h265 -s 1920x1080 -pix_fmt nv12 .\output\1_NV12.yuv
- Note:ffmpeg 还有其它很强大的一些功能,如 imglist 转 mp4、yuv 转 h265 等等
- nv12 数据转 jpg:
- 2、python 代码实现如下:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import cv2
import numpy as np
def yuv2bgr(file_name, height, width, start_frame):
""" :param file_name: 待处理 YUV 视频的名字 :param height: YUV 视频中图像的高 :param width: YUV 视频中图像的宽 :param start_frame: 起始帧 :return: None """
fp = open(file_name, 'rb')
fp.seek(0, 2) # 设置文件指针到文件流的尾部 + 偏移 0
fp_end = fp.tell() # 获取文件尾指针位置
frame_size = height * width * 3 // 2 # 一帧图像所占用的内存字节数
num_frame = fp_end // frame_size # 计算 YUV 文件包含图像数
print("This yuv file has {} frame imgs!".format(num_frame))
fp.seek(frame_size * start_frame, 0) # 设置文件指针到文件流的起始位置 + 偏移 frame_size * startframe
print("Extract imgs start frame is {}!".format(start_frame + 1))
for i in range(num_frame - start_frame):
yyyy_uv = np.zeros(shape=frame_size, dtype='uint8', order='C')
for j in range(frame_size):
yyyy_uv[j] = ord(fp.read(1)) # 读取 YUV 数据,并转换为 unicode
img = yyyy_uv.reshape((height * 3 // 2, width)).astype('uint8') # NV12 的存储格式为:YYYY UV 分布在两个平面(其在内存中为 1 维)
bgr_img = cv2.cvtColor(img, cv2.COLOR_YUV2BGR_NV12) # 由于 opencv 不能直接读取 YUV 格式的文件, 所以要转换一下格式,支持的转换格式可参考资料 5
cv2.imwrite('yuv2bgr/{}.jpg'.format(i + 1), bgr_img) # 改变后缀即可实现不同格式图片的保存(jpg/bmp/png...)
print("Extract frame {}".format(i + 1))
fp.close()
print("job done!")
return None
if __name__ == '__main__':
yuv2bgr(filename='xxx.yuv', height=1080, width=1920, startfrm=0)
# BGR2NV21
def bgr2nv21(image_path, image_height, image_width):
bgr = cv2.imread(image_path)
B = []
G = []
R = []
YUV = []
for i in range(image_height):
for j in range(image_width):
B.append(bgr[i * image_width * 3 + j * 3])
G.append(bgr[i * image_width * 3 + j * 3 + 1])
R.append(bgr[i * image_width * 3 + j * 3 + 2])
y = ((74 * R + 150 * G + 29 * B) / 256)
u = ((-43 * R - 84 * G + 112 * B) / 255) + 128
v = ((128 * R - 107 * G - 21 * B) / 255) + 128
YUV[i * image_width + j] = min(max(y, 0), 255)
YUV[(i // 2 + image_height) * image_width + (j // 2) * 2] = min(max(v, 0), 255)
YUV[(i // 2 + image_height) * image_width + (j // 2) * 2 + 1] = min(max(u, 0), 255)
yuv_name = image_path.replace("png", "yuv")
np.tofile(yuv_name)
- 3、OpenCV 中支持的颜色转换如下所示(py opencv 只需把
cv::
换成cv.
即可):
enum cv::ColorConversionCodes {
cv::COLOR_BGR2BGRA = 0,
cv::COLOR_RGB2RGBA = COLOR_BGR2BGRA,
cv::COLOR_BGRA2BGR = 1,
cv::COLOR_RGBA2RGB = COLOR_BGRA2BGR,
cv::COLOR_BGR2RGBA = 2,
cv::COLOR_RGB2BGRA = COLOR_BGR2RGBA,
cv::COLOR_RGBA2BGR = 3,
cv::COLOR_BGRA2RGB = COLOR_RGBA2BGR,
cv::COLOR_BGR2RGB = 4,
cv::COLOR_RGB2BGR = COLOR_BGR2RGB,
cv::COLOR_BGRA2RGBA = 5,
cv::COLOR_RGBA2BGRA = COLOR_BGRA2RGBA,
cv::COLOR_BGR2GRAY = 6,
cv::COLOR_RGB2GRAY = 7,
cv::COLOR_GRAY2BGR = 8,
cv::COLOR_GRAY2RGB = COLOR_GRAY2BGR,
cv::COLOR_GRAY2BGRA = 9,
cv::COLOR_GRAY2RGBA = COLOR_GRAY2BGRA,
cv::COLOR_BGRA2GRAY = 10,
cv::COLOR_RGBA2GRAY = 11,
cv::COLOR_BGR2BGR565 = 12,
cv::COLOR_RGB2BGR565 = 13,
cv::COLOR_BGR5652BGR = 14,
cv::COLOR_BGR5652RGB = 15,
cv::COLOR_BGRA2BGR565 = 16,
cv::COLOR_RGBA2BGR565 = 17,
cv::COLOR_BGR5652BGRA = 18,
cv::COLOR_BGR5652RGBA = 19,
cv::COLOR_GRAY2BGR565 = 20,
cv::COLOR_BGR5652GRAY = 21,
cv::COLOR_BGR2BGR555 = 22,
cv::COLOR_RGB2BGR555 = 23,
cv::COLOR_BGR5552BGR = 24,
cv::COLOR_BGR5552RGB = 25,
cv::COLOR_BGRA2BGR555 = 26,
cv::COLOR_RGBA2BGR555 = 27,
cv::COLOR_BGR5552BGRA = 28,
cv::COLOR_BGR5552RGBA = 29,
cv::COLOR_GRAY2BGR555 = 30,
cv::COLOR_BGR5552GRAY = 31,
cv::COLOR_BGR2XYZ = 32,
cv::COLOR_RGB2XYZ = 33,
cv::COLOR_XYZ2BGR = 34,
cv::COLOR_XYZ2RGB = 35,
cv::COLOR_BGR2YCrCb = 36,
cv::COLOR_RGB2YCrCb = 37,
cv::COLOR_YCrCb2BGR = 38,
cv::COLOR_YCrCb2RGB = 39,
cv::COLOR_BGR2HSV = 40,
cv::COLOR_RGB2HSV = 41,
cv::COLOR_BGR2Lab = 44,
cv::COLOR_RGB2Lab = 45,
cv::COLOR_BGR2Luv = 50,
cv::COLOR_RGB2Luv = 51,
cv::COLOR_BGR2HLS = 52,
cv::COLOR_RGB2HLS = 53,
cv::COLOR_HSV2BGR = 54,
cv::COLOR_HSV2RGB = 55,
cv::COLOR_Lab2BGR = 56,
cv::COLOR_Lab2RGB = 57,
cv::COLOR_Luv2BGR = 58,
cv::COLOR_Luv2RGB = 59,
cv::COLOR_HLS2BGR = 60,
cv::COLOR_HLS2RGB = 61,
cv::COLOR_BGR2HSV_FULL = 66,
cv::COLOR_RGB2HSV_FULL = 67,
cv::COLOR_BGR2HLS_FULL = 68,
cv::COLOR_RGB2HLS_FULL = 69,
cv::COLOR_HSV2BGR_FULL = 70,
cv::COLOR_HSV2RGB_FULL = 71,
cv::COLOR_HLS2BGR_FULL = 72,
cv::COLOR_HLS2RGB_FULL = 73,
cv::COLOR_LBGR2Lab = 74,
cv::COLOR_LRGB2Lab = 75,
cv::COLOR_LBGR2Luv = 76,
cv::COLOR_LRGB2Luv = 77,
cv::COLOR_Lab2LBGR = 78,
cv::COLOR_Lab2LRGB = 79,
cv::COLOR_Luv2LBGR = 80,
cv::COLOR_Luv2LRGB = 81,
cv::COLOR_BGR2YUV = 82,
cv::COLOR_RGB2YUV = 83,
cv::COLOR_YUV2BGR = 84,
cv::COLOR_YUV2RGB = 85,
// YUV 4:2:0 formats family
cv::COLOR_YUV2RGB_NV12 = 90,
cv::COLOR_YUV2BGR_NV12 = 91,
cv::COLOR_YUV2RGB_NV21 = 92,
cv::COLOR_YUV2BGR_NV21 = 93,
cv::COLOR_YUV420sp2RGB = COLOR_YUV2RGB_NV21,
cv::COLOR_YUV420sp2BGR = COLOR_YUV2BGR_NV21,
cv::COLOR_YUV2RGBA_NV12 = 94,
cv::COLOR_YUV2BGRA_NV12 = 95,
cv::COLOR_YUV2RGBA_NV21 = 96,
cv::COLOR_YUV2BGRA_NV21 = 97,
cv::COLOR_YUV420sp2RGBA = COLOR_YUV2RGBA_NV21,
cv::COLOR_YUV420sp2BGRA = COLOR_YUV2BGRA_NV21,
cv::COLOR_YUV2RGB_YV12 = 98,
cv::COLOR_YUV2BGR_YV12 = 99,
cv::COLOR_YUV2RGB_IYUV = 100,
cv::COLOR_YUV2BGR_IYUV = 101,
cv::COLOR_YUV2RGB_I420 = COLOR_YUV2RGB_IYUV,
cv::COLOR_YUV2BGR_I420 = COLOR_YUV2BGR_IYUV,
cv::COLOR_YUV420p2RGB = COLOR_YUV2RGB_YV12,
cv::COLOR_YUV420p2BGR = COLOR_YUV2BGR_YV12,
cv::COLOR_YUV2RGBA_YV12 = 102,
cv::COLOR_YUV2BGRA_YV12 = 103,
cv::COLOR_YUV2RGBA_IYUV = 104,
cv::COLOR_YUV2BGRA_IYUV = 105,
cv::COLOR_YUV2RGBA_I420 = COLOR_YUV2RGBA_IYUV,
cv::COLOR_YUV2BGRA_I420 = COLOR_YUV2BGRA_IYUV,
cv::COLOR_YUV420p2RGBA = COLOR_YUV2RGBA_YV12,
cv::COLOR_YUV420p2BGRA = COLOR_YUV2BGRA_YV12,
cv::COLOR_YUV2GRAY_420 = 106,
cv::COLOR_YUV2GRAY_NV21 = COLOR_YUV2GRAY_420,
cv::COLOR_YUV2GRAY_NV12 = COLOR_YUV2GRAY_420,
cv::COLOR_YUV2GRAY_YV12 = COLOR_YUV2GRAY_420,
cv::COLOR_YUV2GRAY_IYUV = COLOR_YUV2GRAY_420,
cv::COLOR_YUV2GRAY_I420 = COLOR_YUV2GRAY_420,
cv::COLOR_YUV420sp2GRAY = COLOR_YUV2GRAY_420,
cv::COLOR_YUV420p2GRAY = COLOR_YUV2GRAY_420,
// YUV 4:2:2 formats family
cv::COLOR_YUV2RGB_UYVY = 107,
cv::COLOR_YUV2BGR_UYVY = 108,
cv::COLOR_YUV2RGB_Y422 = COLOR_YUV2RGB_UYVY,
cv::COLOR_YUV2BGR_Y422 = COLOR_YUV2BGR_UYVY,
cv::COLOR_YUV2RGB_UYNV = COLOR_YUV2RGB_UYVY,
cv::COLOR_YUV2BGR_UYNV = COLOR_YUV2BGR_UYVY,
cv::COLOR_YUV2RGBA_UYVY = 111,
cv::COLOR_YUV2BGRA_UYVY = 112,
cv::COLOR_YUV2RGBA_Y422 = COLOR_YUV2RGBA_UYVY,
cv::COLOR_YUV2BGRA_Y422 = COLOR_YUV2BGRA_UYVY,
cv::COLOR_YUV2RGBA_UYNV = COLOR_YUV2RGBA_UYVY,
cv::COLOR_YUV2BGRA_UYNV = COLOR_YUV2BGRA_UYVY,
cv::COLOR_YUV2RGB_YUY2 = 115,
cv::COLOR_YUV2BGR_YUY2 = 116,
cv::COLOR_YUV2RGB_YVYU = 117,
cv::COLOR_YUV2BGR_YVYU = 118,
cv::COLOR_YUV2RGB_YUYV = COLOR_YUV2RGB_YUY2,
cv::COLOR_YUV2BGR_YUYV = COLOR_YUV2BGR_YUY2,
cv::COLOR_YUV2RGB_YUNV = COLOR_YUV2RGB_YUY2,
cv::COLOR_YUV2BGR_YUNV = COLOR_YUV2BGR_YUY2,
cv::COLOR_YUV2RGBA_YUY2 = 119,
cv::COLOR_YUV2BGRA_YUY2 = 120,
cv::COLOR_YUV2RGBA_YVYU = 121,
cv::COLOR_YUV2BGRA_YVYU = 122,
cv::COLOR_YUV2RGBA_YUYV = COLOR_YUV2RGBA_YUY2,
cv::COLOR_YUV2BGRA_YUYV = COLOR_YUV2BGRA_YUY2,
cv::COLOR_YUV2RGBA_YUNV = COLOR_YUV2RGBA_YUY2,
cv::COLOR_YUV2BGRA_YUNV = COLOR_YUV2BGRA_YUY2,
cv::COLOR_YUV2GRAY_UYVY = 123,
cv::COLOR_YUV2GRAY_YUY2 = 124,
cv::COLOR_YUV2GRAY_Y422 = COLOR_YUV2GRAY_UYVY,
cv::COLOR_YUV2GRAY_UYNV = COLOR_YUV2GRAY_UYVY,
cv::COLOR_YUV2GRAY_YVYU = COLOR_YUV2GRAY_YUY2,
cv::COLOR_YUV2GRAY_YUYV = COLOR_YUV2GRAY_YUY2,
cv::COLOR_YUV2GRAY_YUNV = COLOR_YUV2GRAY_YUY2,
// alpha premultiplication
cv::COLOR_RGBA2mRGBA = 125,
cv::COLOR_mRGBA2RGBA = 126,
cv::COLOR_RGB2YUV_I420 = 127,
cv::COLOR_BGR2YUV_I420 = 128,
cv::COLOR_RGB2YUV_IYUV = COLOR_RGB2YUV_I420,
cv::COLOR_BGR2YUV_IYUV = COLOR_BGR2YUV_I420,
cv::COLOR_RGBA2YUV_I420 = 129,
cv::COLOR_BGRA2YUV_I420 = 130,
cv::COLOR_RGBA2YUV_IYUV = COLOR_RGBA2YUV_I420,
cv::COLOR_BGRA2YUV_IYUV = COLOR_BGRA2YUV_I420,
cv::COLOR_RGB2YUV_YV12 = 131,
cv::COLOR_BGR2YUV_YV12 = 132,
cv::COLOR_RGBA2YUV_YV12 = 133,
cv::COLOR_BGRA2YUV_YV12 = 134,
cv::COLOR_BayerBG2BGR = 46,
cv::COLOR_BayerGB2BGR = 47,
cv::COLOR_BayerRG2BGR = 48,
cv::COLOR_BayerGR2BGR = 49,
cv::COLOR_BayerBG2RGB = COLOR_BayerRG2BGR,
cv::COLOR_BayerGB2RGB = COLOR_BayerGR2BGR,
cv::COLOR_BayerRG2RGB = COLOR_BayerBG2BGR,
cv::COLOR_BayerGR2RGB = COLOR_BayerGB2BGR,
cv::COLOR_BayerBG2GRAY = 86,
cv::COLOR_BayerGB2GRAY = 87,
cv::COLOR_BayerRG2GRAY = 88,
cv::COLOR_BayerGR2GRAY = 89,
cv::COLOR_BayerBG2BGR_VNG = 62,
cv::COLOR_BayerGB2BGR_VNG = 63,
cv::COLOR_BayerRG2BGR_VNG = 64,
cv::COLOR_BayerGR2BGR_VNG = 65,
cv::COLOR_BayerBG2RGB_VNG = COLOR_BayerRG2BGR_VNG,
cv::COLOR_BayerGB2RGB_VNG = COLOR_BayerGR2BGR_VNG,
cv::COLOR_BayerRG2RGB_VNG = COLOR_BayerBG2BGR_VNG,
cv::COLOR_BayerGR2RGB_VNG = COLOR_BayerGB2BGR_VNG,
cv::COLOR_BayerBG2BGR_EA = 135,
cv::COLOR_BayerGB2BGR_EA = 136,
cv::COLOR_BayerRG2BGR_EA = 137,
cv::COLOR_BayerGR2BGR_EA = 138,
cv::COLOR_BayerBG2RGB_EA = COLOR_BayerRG2BGR_EA,
cv::COLOR_BayerGB2RGB_EA = COLOR_BayerGR2BGR_EA,
cv::COLOR_BayerRG2RGB_EA = COLOR_BayerBG2BGR_EA,
cv::COLOR_BayerGR2RGB_EA = COLOR_BayerGB2BGR_EA,
cv::COLOR_BayerBG2BGRA = 139,
cv::COLOR_BayerGB2BGRA = 140,
cv::COLOR_BayerRG2BGRA = 141,
cv::COLOR_BayerGR2BGRA = 142,
cv::COLOR_BayerBG2RGBA = COLOR_BayerRG2BGRA,
cv::COLOR_BayerGB2RGBA = COLOR_BayerGR2BGRA,
cv::COLOR_BayerRG2RGBA = COLOR_BayerBG2BGRA,
cv::COLOR_BayerGR2RGBA = COLOR_BayerGB2BGRA,
cv::COLOR_COLORCVT_MAX = 143
}
五、libyuv 库的编译和使用
1、libyuv 下载
- git 下载:可通过
README.chromium
查看版本号 - 或者通过网页下载压缩包:https://chromium.googlesource.com/libyuv/libyuv/+/refs/heads/master
2、libyuv 编译
# 编译指定平台的库,只需要把相应的编译器换一下就好了
# 1、使用 make 来编译(默认为 gcc/g++ 编译器,生成静态库 libyuv.a)
cd libyuv-master/
vim linux.mk
# 更改为自己的编译器和编译选项
CC=/home/manzp/projects/19.sigmastar/gcc-sigmastar-9.1.0-2020.07-x86_64_arm-linux-gnueabihf/bin/arm-linux-gnueabihf-sigmastar-9.1.0-gcc
CFLAGS:=-mcpu=cortex-a53 -fno-aggressive-loop-optimizations -O3 -fomit-frame-pointer -ffast-math -Wall -fPIC -fpermissive -mfpu=neon-vfpv4
CFLAGS+=-Iinclude/
CXX=/home/manzp/projects/19.sigmastar/gcc-sigmastar-9.1.0-2020.07-x86_64_arm-linux-gnueabihf/bin/arm-linux-gnueabihf-sigmastar-9.1.0-g++
CXXFLAGS:=-mcpu=cortex-a53 -fno-aggressive-loop-optimizations -O3 -fomit-frame-pointer -ffast-math -Wall -fPIC -fpermissive -mfpu=neon-vfpv4
CXXFLAGS+=-Iinclude/
# 编译和重新编译
make -f linux.mk -j16 # 默认生成静态库
make -f linux.mk clean # 使用不同的编译器重新编译前记得 clean 一下
# 2、使用 cmake 来编译,默认 debug build,out 下面有 libyuv.a libyuv.so 及 yuvconvert 产生
mkdir out
cd out
cmake ..
cmake --build .
# release build/install,如果想用自己的编译器,加上 -DCROSS_COMPILE=arm-himix200-linux
mkdir out
cd out
cmake -DCMAKE_INSTALL_PREFIX="/usr/lib" -DCMAKE_BUILD_TYPE="Release" ..
cmake --build . --config Release
sudo cmake --build . --target install --config Release
3、libyuv 使用
libyuv is an open source project that includes YUV scaling and conversion functionality.
- Scale YUV to prepare content for compression, with point, bilinear or box filter.
- Convert to YUV from webcam formats for compression.
- Convert to RGB formats for rendering/effects.
- Rotate by 90/180/270 degrees to adjust for mobile devices in portrait mode.
- Optimized for SSSE3/AVX2 on x86/x64
- Optimized for Neon on Arm.
- Optimized for MSA on Mips.
- 将 libyuv.h 包含到工程,直接调用转换函数即可
void NV12Crop(uint8_t *src_y, uint8_t *src_uv, int src_stride_y,
int* roi_x, int* roi_y, int* roi_w, int* roi_h,
uint8_t *dst_yuv) {
// 裁剪的坐标 X 和 Y 必须是偶数,否则可能得到 NV21
// 裁剪的宽和高必须是偶数(2n*2n*1.5 = 6n2),正好是 6 的倍数(每四个Y对应一个UV)
if (*roi_x % 2) {
*roi_x -= 1;
}
if (*roi_y % 2) {
*roi_y -= 1;
}
if (*roi_w % 2) {
*roi_w -= 1;
}
if (*roi_h % 2) {
*roi_h -= 1;
}
// 取得 SRC YUV 首地址
unsigned char *src_roi_y = src_y + src_stride_y * (*roi_y) + (*roi_x);
// NV12在竖直方向上进行了 1/2 下采样,水平方向上并未做下采样,所以只需 roi_y 减半
unsigned char *src_roi_uv = src_uv + src_stride_y * (*roi_y) / 2 + (*roi_x);
unsigned char *dst_y = dst_yuv;
unsigned char *dst_uv = dst_yuv + (*roi_w) * (*roi_h);
for (int h = 0; h < *roi_h; h++) {
// ROI 按行 copy Y
memcpy(dst_y + (*roi_w) * h, src_roi_y + src_stride_y * h, *roi_w);
if (h < *roi_h / 2) {
// ROI 按行 copy UV
memcpy(dst_uv + (*roi_w) * h, src_roi_uv + src_stride_y * h, *roi_w);
}
}
}
void NV12RoiScaleToRGB24(u8 *src_y, u8 *src_uv, s32 src_stride_y, s32 src_stride_uv,
s32 *roi_x, s32 *roi_y, s32 *roi_w, s32 *roi_h,
u8 *dst_tmp_buffer, u8 *dst_rgb24, s32 dst_w, s32 dst_h) {
// 裁剪的坐标 X 和 Y 必须是偶数,否则可能得到 NV21
// 裁剪的宽和高必须是偶数(2n*2n*1.5 = 6n2),正好是 6 的倍数(每四个Y对应一个UV)
if (*roi_x % 2) {
*roi_x -= 1;
}
if (*roi_y % 2) {
*roi_y -= 1;
}
if (*roi_w % 2) {
*roi_w -= 1;
}
if (*roi_h % 2) {
*roi_h -= 1;
}
// 取得 SRC YUV 首地址
u8 *src_roi_y = (u8 *) (src_y + src_stride_y * (*roi_y) + (*roi_x));
// NV12 在竖直方向上进行了 1/2 下采样,水平方向上并未做下采样,所以只需 roi_y 减半
u16 *src_roi_uv = (u16 *) (src_uv + src_stride_uv * (*roi_y) / 2 + (*roi_x));
u8 *dst_y = dst_tmp_buffer;
u8 *dst_uv = dst_tmp_buffer + dst_w * dst_h;
libyuv::ScalePlane(src_roi_y, src_stride_y, *roi_w, *roi_h, dst_y, dst_w, dst_w, dst_h, libyuv::kFilterBilinear);
libyuv::ScalePlane_16(src_roi_uv, src_stride_uv / 2, (*roi_w) / 2, (*roi_h) / 2, (uint16_t *) dst_uv, dst_w / 2,
dst_w / 2, dst_h / 2, libyuv::kFilterNone);
libyuv::NV12ToRGB24(dst_y, dst_w, dst_uv, dst_w, dst_rgb24, dst_w * 3, dst_w, dst_h);
}
void NV12RoiToRGB24Perspective(u8 *src_y, u8 *src_uv, s32 src_stride_y, s32 src_stride_uv,
s32 LeftTopx, s32 LeftTopy, s32 RightTopx, s32 RightTopy,
s32 LeftBottomx, s32 LeftBottomy, s32 RightBottomx, s32 RightBottomy,
u8 *dst_rgb24, s32 dst_w, s32 dst_h) {
// 裁剪的坐标 X 和 Y 必须是偶数,否则可能得到 NV21
// 裁剪的宽和高必须是偶数(2n*2n*1.5 = 6n2),正好是 6 的倍数(每四个Y对应一个UV)
s32 offset = 10; // 上下左右各自外扩 10 个像素,为放射变换做准备
s32 roi_x = s32(LeftTopx - offset);
s32 roi_y = s32(LeftTopy - offset);
s32 roi_w = s32(RightBottomx - LeftTopx + 1 + 2 * offset);
s32 roi_h = s32(RightBottomy - LeftTopy + 1 + 2 * offset);
if (roi_x % 2) {
roi_x -= 1;
}
if (roi_y % 2) {
roi_y -= 1;
}
if (roi_w % 2) {
roi_w -= 1;
}
if (roi_h % 2) {
roi_h -= 1;
}
// 取得 SRC YUV 首地址
u8 *src_roi_y = src_y + src_stride_y * roi_y + roi_x;
// NV12 在竖直方向上进行了 1/2 下采样,水平方向上并未做下采样,所以只需 roi_y 减半
u8 *src_roi_uv = src_uv + src_stride_uv * roi_y / 2 + roi_x;
u8 *dst_tmp_buffer = (u8 *) calloc(1, roi_w * roi_h * 3); // h*wc,BGR888
libyuv::NV12ToRGB24(src_roi_y, src_stride_y, src_roi_uv, src_stride_uv, dst_tmp_buffer, roi_w * 3, roi_w, roi_h);
PerspectiveTransform(dst_tmp_buffer, dst_rgb24, roi_w, roi_h, dst_w, dst_h,
LeftTopx - roi_x, LeftTopy - roi_y,
RightTopx - roi_x, RightTopy - roi_y,
LeftBottomx - roi_x, LeftBottomy - roi_y,
RightBottomx - roi_x, RightBottomy - roi_y); // 需输入相对位置
if (dst_tmp_buffer != NULL) {
free(dst_tmp_buffer);
dst_tmp_buffer = NULL;
}
}
六、参考资料
1、详解YUV数据格式
2、YUV 格式详解,只看这一篇就够了
3、图像原始格式(YUV444 YUV422 YUV420)一探究竟
4、libyuv库简单使用
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/160228.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...