在做基于FFmpeg解码的视频播放时,需要涉及到帧数据存储的YUV与RGB格式,所以了解了一下,参考下述博文。
https://blog.csdn.net/lanxiaziyi/article/details/74139729#avframe-%E4%B8%8E-yuv420%E9%82%A3%E4%BA%9B%E4%BA%8B
下面三个图表示不同格式的Y,U,V采样方式,以黑点表示采样该像素点的Y分量,以空心圆圈表示采用该像素点的UV分量。
1. YUV 4:4:4采样,每一个Y对应一组UV分量。
2. YUV 4:2:2采样,每两个Y共用一组UV分量。
3. YUV 4:2:0采样,每四个Y共用一组UV分量。
请参考如下文章:
http://www.cnblogs.com/azraelly/archive/2013/01/01/2841269.html
应用:模拟领域
Y’= 0.299*R’ + 0.587*G’ + 0.114*B’ U’= -0.147*R’ - 0.289*G’ + 0.436*B’ = 0.492*(B’- Y’) V’= 0.615*R’ - 0.515*G’ - 0.100*B’ = 0.877*(R’- Y’) R’ = Y’ + 1.140*V’ G’ = Y’ - 0.394*U’ - 0.581*V’ B’ = Y’ + 2.032*U’1234567
YCbCr模型来源于YUV模型。YCbCr是 YUV 颜色空间的偏移版本.
应用:数字视频,ITU-R BT.601建议
Y’ = 0.257*R’ + 0.504*G’ + 0.098*B’ + 16 Cb’ = -0.148*R’ - 0.291*G’ + 0.439*B’ + 128 Cr’ = 0.439*R’ - 0.368*G’ - 0.071*B’ + 128 R’ = 1.164*(Y’-16) + 1.596*(Cr’-128) G’ = 1.164*(Y’-16) - 0.813*(Cr’-128) - 0.392*(Cb’-128) B’ = 1.164*(Y’-16) + 2.017*(Cb’-128)1234567
上面各个符号都带了一撇,表示该符号在原值基础上进行了伽马校正,伽马校正有助于弥补在抗锯齿的过程中,线性分配伽马值所带来的细节损失,使图像细节更加丰富。在没有采用伽马校正的情况下,暗部细节不容易显现出来,而采用了这一图像增强技术以后,图像的层次更加明晰了。 H264里面的YUV应属于YCbCr。
FFmpeg视频解码后,一般存储为AV_PIX_FMT_YUV420P 的format,而解码后的数据存储在结构体 AVFrame 中。YUV420P在内存中的排布如下:
YYYYYYYY UUUU VVVV1
下面是我们编程时关心的重点,YUV420P在AVFrame中的存储形式,
planar YUV 4:2:0, 12bpp, (1 Cr & Cb sample per 2x2 Y samples)1
即存储在结构体 AVFrame 的data[ ]数组中 ,
data[0]——-Y分量
data[1]——-U分量
data[2]——-V分量
linesize[]数组中保存的是对应通道的数据宽度 ,
linesize[0]——-Y分量的宽度
linesize[1]——-U分量的宽度
linesize[2]——-V分量的宽度
这里要特别注意,linesize[0]的值并不一定等于图片的宽度,有时候为了对齐各解码器的CPU,实际尺寸会大于图片的宽度,这点在我们编程时(比如OpengGL硬件转换/渲染)要特别注意,否则解码出来的图像会异常。
相关知识
快来给你的宠物视频加个表情特效吧
狗狗如何看世界?人类研究员要解码狗脑中的视觉认知
北大黄铁军团队 | 专题综述:视觉信息的神经解码
宠物牵引绳检测的arm边缘设备安装遇到的问题
宠物经济解码,正在崛起的千亿级生意
研究人员利用人工智能解码狗狗叫声的秘密语言
想了解您的爱宠在说什么?现在可使用人工智能解码狗叫声
用QT实现一个简单的桌面宠物
AI解锁狗狗“秘密语言”:人类语音模型助力解码狗吠之谜
新研究借助人工智能“解码”狗叫声
网址: FFmpeg视频解码中的YUV420P格式 https://m.mcbbbk.com/newsview241299.html
上一篇: 有些动物为什么会发光? |
下一篇: 有光的动物有那些 |