在处理图像时,了解 RGB 和 BGR 色彩空间之间的区别非常重要。RGB 和 BGR 都具有三个颜色通道:红色、绿色和蓝色。但是,这些通道在图像文件中的存储顺序可能不同。
RGB 通常用于图像编辑和显示应用程序,顺序为红色、绿色和蓝色。
BGR 通常用于图像处理应用程序,顺序为蓝色、绿色和红色。
图像数据可以保存在不同的颜色空间(RGB、BGR、Gray等),不同的文件格式可以将图像保存在不同的颜色空间。这取决于图像处理库和软件在保存(或打开)图像时使用的颜色空间。
但是,将图像保存为文件格式时,通常的做法是将其保存在 RGB 颜色空间中。值得注意的是,当你以 BGR 顺序保存图像时,它仍然可以被大多数库和软件读取,但它们会将其视为 RGB 图像并以 RGB 格式显示。(你会看到交换了红色和蓝色通道的图像)
使用exiftool之类的工具查看图片的元数据,可能会得到这样的结果:
color mode: RGB
或者Color Space Data: RGB
这意味着一张图片有 3 个通道,但并不意味着 3 个颜色通道的顺序是red-green-blue,它也可能是blue-green-red。
读取和解释图像文件的程序决定了如何解释图像的颜色通道:不同的库(例如 OpenCV 和 PIL)对图像文件使用不同的默认解码方法,这可能导致图像被解释为BGR或RGB。
使用 Python 处理图像文件时,OpenCV 库(cv2)在读取图像时默认使用 BGR 颜色空间,而 PIL 库使用 RGB 颜色空间:
importcv2fromPILimportImage#readinganimageusingcv2.imread()img_bgr=cv2.imread("image.jpg")#readinganimageusingplt.imread()img_rgb=Image.open("image.jpg")
总而言之,当我们说 rgb 图像(有时称为真彩色图像)时,这意味着通过假设该图像的颜色通道顺序为红-绿-蓝来保存图像,而 bgr-image 则通过假设颜色顺序为蓝-绿-红。当我们打开该图像并通过某些软件或库进行绘图时,该软件或库将决定以 RGB 色彩空间还是 BGR 色彩空间显示图像。
使用 PIL 库打开 rgb 图像 :
importnumpyasnpfromPILimportImage,ImageOpsimportmatplotlib.pyplotasplt#Hereweshowrgb-imageinRGB-color-spacergb_img=Image.open("parrot-org.jpg")plt.imshow(rgb_img)
使用 PIL 库打开 bgr 图像 :
BGR 不是实际的颜色空间,它只是图像的表示,其中颜色通道的顺序不同于传统的 RGB 表示。图像中像素的颜色值保持不变,但颜色通道的顺序交换了,第一个通道是蓝色,第二个通道是绿色,第三个通道是红色。
例如,[240,26,0]是左上角的像素值,当你通过 plt.imshow() 绘制图像时,你将在图像的左上角看到一个红点。因此,这意味着 plt.imshow() 使用了RGB-color-space,它确定了255表示红色,0表示绿色,0表示蓝色。然后像这样交换颜色通道:(1,2,3)–>(3,2,1)。
之后,左上角的像素值 ( [240, 26, 0]) 变为[0, 26, 240],然后你再次绘制它。现在你将在图像的左上角看到一个蓝点。因此,这意味着plt.imshow()使用了RGB 颜色空间,它确定0表示红色,0表示绿色,255表示蓝色。
这就是为什么你看到的是蓝点而不是红点。
基于此,我们可以说BGR颜色空间是RGB颜色空间中交换颜色通道的图像的表示。
#Hereweshowbgr-imageinRGB-color-spacergb_data=np.array(rgb_img)bgr_data=rgb_data[:,:,::-1]#(red,green,blue)-->(blue,green,red)bgr_img=Image.fromarray(bgr_data)plt.imshow(bgr_img);
将 3 通道图像转换为 1 通道图像
有多种方法可以将图像从 RGB 颜色空间转换为灰度,但最常用的方法之一是使用红色、绿色和蓝色值的加权平均值。该方法根据人眼对每种颜色的相对敏感度,为三个颜色通道分配不同的权重。
最常用的权重是:gray_weighted_average= 0.299 * R + 0.587 * G + 0.114 * B
另一种转换为灰度的方法是使用光度法,它根据人眼的光度函数分配不同的权重。这是将彩色图像转换为灰度图像的更准确方法:gray_luminosity = 0.2126 * R + 0.7152 * G + 0.0722 * B
OpenCV的
cv2.cvtColor(img_bgr, cv2.COLOR_BGR2RGB)
采用加权平均法,Pil.ImageOps.grayscale(rgb_img)
采用光度法。
gray_img=ImageOps.grayscale(rgb_img)plt.imshow(gray_img,cmap='gray');
分别查看具有不同色调的 3 个颜色通道
tint_names=["red","green","blue"]plt.figure(figsize=(12,5))foriinrange(3):plt.subplot(1,3,i+1)arr=np.zeros((3,),dtype='int')arr[i]=1img1=rgb_data*arrplt.title(f"channel={i+1}in#{tint_names[i]}tint")plt.imshow(img1)plt.figure(figsize=(12,5))foriinrange(3):plt.subplot(1,3,i+1)img1=rgb_data[:,:,i]plt.title(f"channel={i+1}in#greytint")plt.imshow(img1,cmap='gray')
使用 OpenCV
RGB 图像——假设颜色通道的顺序是红-绿-蓝保存。
当你使用 opencv 读取 RGB 图像时 —>
cv2.imread()
读取 rgb 图像并通过交换颜色通道将其作为 bgr 图像返回在通过 opencv 读取 rgb 图像之后,如果你还使用 opencv 绘图 ->
cv2.imshow()
将在 BGR 颜色空间中绘制图像
因此,当你使用 opencv 打开 rgb 图像并使用 opencv 绘制它时,你将在 BGR 颜色空间中看到 bgr 图像,这看起来与 RGB 颜色空间中的 rgb 图像 相同。
importcv2#Hereweseebgr-imageinrgb-color-spacebgr_img_by_cv2=cv2.imread(img_path)plt.imshow(bgr_img_by_cv2);
你将通过以下代码片段在 BGR 颜色空间中看到 bgr 图像,并且弹出窗口显示图像(按ESC关闭它)
cv2.imshow("bgr-imageinBGR-color-space",bgr_img_by_cv2)cv2.waitKey(0)cv2.destroyAllWindows()
通过颜色通道学习颜色深度并计算 1 个像素有多少字节
首先,阅读以下解释:https://www.quora.com/How-does-the-computer-memory-store-media-files/answer/Jabali-Searcot
如果图像具有 1 个颜色通道(灰度)和 1 位颜色深度,则 1 个像素将为 1/8 字节或 0.125 字节:
#1channeland1-bit-color-depth-->2colorcombinations_,binary_image=cv2.threshold(gray_img_by_cv2,128,255,cv2.THRESH_BINARY)plt.imshow(binary_image,cmap='gray')
如果图像具有 1 个颜色通道(灰度)和 2 位颜色深度,则 1 个像素将为 2/8 字节或 0.25 字节:
#1channel2-bit-color-depth-->4colorcombinationsscaled_image=(gray_img_by_cv2/64).astype(np.uint8)plt.imshow(scaled_image,cmap='gray');
如果图像具有 1 个颜色通道(灰度)和 3 位颜色深度,则 1 个像素将为 3/8 字节或 0.375 字节:
#1channeland3-bit-color-depth-->8colorcombinationsscaled_image=(gray_img_by_cv2/32).astype(np.uint8)plt.imshow(scaled_image,cmap='gray');
如果图像具有 1 个颜色通道(灰度)和 4 位颜色深度,则 1 个像素将为 4/8 字节或 0.5 字节:
#1channel4-bit-color-depth-->16colorcombinationsscaled_image=(gray_img_by_cv2/16).astype(np.uint8)plt.imshow(scaled_image,cmap='gray');
如果图像具有 1 个颜色通道(灰度)和 8 位颜色深度,则 1 个像素将是 8/8 字节或 1 个字节:
#8bitcolordepthand1channel-->256colorcombinationsscaled_image=(gray_img_by_cv2).astype(np.uint8)plt.imshow(scaled_image,cmap='gray');
如果图像有 3 个颜色通道和每个通道的 1 位颜色深度,则 1 个像素将为 3/8 字节或 0.375 字节:
#3channeland1bitcolordepth-->8colorcombinations_,binary_image_from_rgb_img_by_cv2=cv2.threshold(rgb_img_by_cv2,128,255,cv2.THRESH_BINARY)plt.imshow(binary_image_from_rgb_img_by_cv2);
如果图像有 3 个颜色通道,并且每个通道的每个通道都是 8 位颜色深度,那么 1 个像素将是 24/8 字节或 3 个字节:每个通道 1 个像素。
通常,图像有 3 个颜色通道,每个通道都是 8 位颜色深度,称为 24 位颜色(或真彩色)图像:
#3channeland8-bit-color-depth-->16777216colorcombinations#256*256*256=16777216scaled_image=(rgb_img_by_cv2).astype(np.uint8)plt.imshow(scaled_image,cmap='gray');
重要的!然而,当我们使用扩展名(jpg/jpeg、png、tiff、bmp等)保存图像时,这些扩展名使用压缩算法将图像保存到内存中。这意味着24位彩色图像的1个像素将不会是3个字节,由于这些压缩算法,像素的大小将比3个字节小得多。
本文代码:https://github.com/zrruziev/deep_learning_practice/blob/main/TENSORFLOW/rgb-bgr-color_depth.ipynb
☆ END ☆
如果看到这里,说明你喜欢这篇文章,请转发、点赞。微信搜索「uncle_pn」,欢迎添加小编微信「 woshicver」,每日朋友圈更新一篇高质量博文。
↓扫描二维码添加小编↓