• 发文
  • 评论
  • 微博
  • 空间
  • 微信

RGB 与 BGR 颜色深度、像素和字节之间的关系

磐创AI 2023-11-20 11:18 发文

在处理图像时,了解 RGB 和 BGR 色彩空间之间的区别非常重要。RGB 和 BGR 都具有三个颜色通道:红色、绿色和蓝色。但是,这些通道在图像文件中的存储顺序可能不同。

RGB 通常用于图像编辑和显示应用程序,顺序为红色、绿色和蓝色。BGR 通常用于图像处理应用程序,顺序为蓝色、绿色和红色。图像数据可以保存在不同的颜色空间(RGB、BGR、Gray等),不同的文件格式可以将图像保存在不同的颜色空间。这取决于图像处理库和软件在保存(或打开)图像时使用的颜色空间。但是,将图像保存为文件格式时,通常的做法是将其保存在 RGB 颜色空间中。值得注意的是,当你以 BGR 顺序保存图像时,它仍然可以被大多数库和软件读取,但它们会将其视为 RGB 图像并以 RGB 格式显示。(你会看到交换了红色和蓝色通道的图像)

使用exiftool之类的工具查看图片的元数据,可能会得到这样的结果:color mode: RGB或者Color Space Data: RGB

这意味着一张图片有 3 个通道,但并不意味着 3 个颜色通道的顺序是red-green-blue,它也可能是blue-green-red。

读取和解释图像文件的程序决定了如何解释图像的颜色通道:不同的库(例如 OpenCV 和 PIL)对图像文件使用不同的默认解码方法,这可能导致图像被解释为BGRRGB。使用 Python 处理图像文件时,OpenCV 库(cv2)在读取图像时默认使用 BGR 颜色空间,而 PIL 库使用 RGB 颜色空间:import cv2

from PIL import Image

#reading an image using cv2.imread()

img_bgr = cv2.imread("image.jpg")

#reading an image using plt.imread()

img_rgb = Image.open("image.jpg")

总而言之,当我们说 rgb 图像(有时称为真彩色图像)时,这意味着通过假设该图像的颜色通道顺序为红-绿-蓝来保存图像,而 bgr-image 则通过假设颜色顺序为蓝-绿-红。当我们打开该图像并通过某些软件或库进行绘图时,该软件或库将决定以 RGB 色彩空间还是 BGR 色彩空间显示图像。

使用 PIL 库打开 rgb 图像 :import numpy as np

from PIL import Image, ImageOps

import matplotlib.pyplot as plt

# Here we show rgb-image in RGB-color-space

rgb_img = Image.open("parrot-org.jpg") 

plt.imshow(rgb_img)

使用 PIL 库打开 bgr 图像 :

BGR 不是实际的颜色空间,它只是图像的表示,其中颜色通道的顺序不同于传统的 RGB 表示。图像中像素的颜色值保持不变,但颜色通道的顺序交换了,第一个通道是蓝色,第二个通道是绿色,第三个通道是红色。

例如,[240,26,0]是左上角的像素值,当你通过 plt.imshow() 绘制图像时,你将在图像的左上角看到一个红点。因此,这意味着 plt.imshow() 使用了RGB-color-space,它确定了255表示红色,0表示绿色,0表示蓝色。然后像这样交换颜色通道:(1,2,3)-->(3,2,1)。

之后,左上角的像素值 ( [240, 26, 0]) 变为[0, 26, 240],然后你再次绘制它。现在你将在图像的左上角看到一个蓝点。因此,这意味着plt.imshow()使用了RGB 颜色空间,它确定0表示红色,0表示绿色,255表示蓝色。

这就是为什么你看到的是蓝点而不是红点。

基于此,我们可以说BGR颜色空间是RGB颜色空间中交换颜色通道的图像的表示。

# Here we show bgr-image in RGB-color-space

rgb_data = np.array(rgb_img)

bgr_data = rgb_data[:, :, ::-1]  # (red,green,blue) --> (blue,green,red)

bgr_img = Image.fromarray(bgr_data)

plt.imshow(bgr_img);

将 3 通道图像转换为 1 通道图像

有多种方法可以将图像从 RGB 颜色空间转换为灰度,但最常用的方法之一是使用红色、绿色和蓝色值的加权平均值。该方法根据人眼对每种颜色的相对敏感度,为三个颜色通道分配不同的权重。

最常用的权重是:gray_weighted_average= 0.299 * R + 0.587 * G + 0.114 * B另一种转换为灰度的方法是使用光度法,它根据人眼的光度函数分配不同的权重。这是将彩色图像转换为灰度图像的更准确方法:gray_luminosity = 0.2126 * R + 0.7152 * G + 0.0722 * B

OpenCV的cv2.cvtColor(img_bgr, cv2.COLOR_BGR2RGB)采用加权平均法,Pil.ImageOps.grayscale(rgb_img)采用光度法。

gray_img = ImageOps.grayscale(rgb_img)

plt.imshow(gray_img, cmap='gray');

分别查看具有不同色调的 3 个颜色通道tint_names = ["red", "green", "blue"]

plt.figure(figsize=(12,5))

for i in range(3):

    plt.subplot(1, 3, i+1)

    arr = np.zeros((3,), dtype='int')

    arr[i] = 1

    img1 = rgb_data*arr

    plt.title(f"channel={i+1} in  #{tint_names[i]} tint")

    plt.imshow(img1)    

plt.figure(figsize=(12,5))

for i in range(3):

    plt.subplot(1, 3, i+1)

    img1 = rgb_data[:, :, i]

    plt.title(f"channel={i+1} in  #grey tint")

    plt.imshow(img1, cmap='gray')

使用 OpenCV

RGB 图像——假设颜色通道的顺序是红-绿-蓝保存。

当你使用 opencv 读取 RGB 图像时 —>cv2.imread()读取 rgb 图像并通过交换颜色通道将其作为 bgr 图像返回

在通过 opencv 读取 rgb 图像之后,如果你还使用 opencv 绘图 ->cv2.imshow()将在 BGR 颜色空间中绘制图像

因此,当你使用 opencv 打开 rgb 图像并使用 opencv 绘制它时,你将在 BGR 颜色空间中看到 bgr 图像,这看起来与 RGB 颜色空间中的 rgb 图像 相同。import cv2

# Here we see bgr-image in rgb-color-space

bgr_img_by_cv2 = cv2.imread(img_path)  

plt.imshow(bgr_img_by_cv2); 

你将通过以下代码片段在 BGR 颜色空间中看到 bgr 图像,并且弹出窗口显示图像(按ESC关闭它)

cv2.imshow("bgr-image in BGR-color-space", bgr_img_by_cv2)

cv2.waitKey(0)

cv2.destroyAllWindows()

通过颜色通道学习颜色深度并计算 1 个像素有多少字节

首先,阅读以下解释:https://www.quora.com/How-does-the-computer-memory-store-media-files/answer/Jabali-Searcot

如果图像具有 1 个颜色通道(灰度)和 1 位颜色深度,则 1 个像素将为 1/8 字节或 0.125 字节:

# 1 channel and 1-bit-color-depth --> 2 color combinations

_, binary_image = cv2.threshold(gray_img_by_cv2, 128, 255, cv2.THRESH_BINARY)

plt.imshow(binary_image, cmap='gray')

如果图像具有 1 个颜色通道(灰度)和 2 位颜色深度,则 1 个像素将为 2/8 字节或 0.25 字节:

# 1 channel 2-bit-color-depth --> 4 color combinations

scaled_image = (gray_img_by_cv2/64).astype(np.uint8)

plt.imshow(scaled_image, cmap='gray');

如果图像具有 1 个颜色通道(灰度)和 3 位颜色深度,则 1 个像素将为 3/8 字节或 0.375 字节:

# 1 channel and 3-bit-color-depth --> 8 color combinations

scaled_image = (gray_img_by_cv2/32).astype(np.uint8)

plt.imshow(scaled_image, cmap='gray');

如果图像具有 1 个颜色通道(灰度)和 4 位颜色深度,则 1 个像素将为 4/8 字节或 0.5 字节:

# 1 channel 4-bit-color-depth --> 16 color combinations

scaled_image = (gray_img_by_cv2/16).astype(np.uint8)

plt.imshow(scaled_image, cmap='gray');

如果图像具有 1 个颜色通道(灰度)和 8 位颜色深度,则 1 个像素将是 8/8 字节或 1 个字节:

# 8bit color depth and 1 channel --> 256 color combinations

scaled_image = (gray_img_by_cv2).astype(np.uint8)

plt.imshow(scaled_image, cmap='gray');

如果图像有 3 个颜色通道和每个通道的 1 位颜色深度,则 1 个像素将为 3/8 字节或 0.375 字节:

# 3 channel and 1bit color depth --> 8 color combinations

_, binary_image_from_rgb_img_by_cv2 = cv2.threshold(rgb_img_by_cv2, 128, 255, cv2.THRESH_BINARY)

plt.imshow(binary_image_from_rgb_img_by_cv2);

如果图像有 3 个颜色通道,并且每个通道的每个通道都是 8 位颜色深度,那么 1 个像素将是 24/8 字节或 3 个字节:每个通道 1 个像素。

通常,图像有 3 个颜色通道,每个通道都是 8 位颜色深度,称为 24 位颜色(或真彩色)图像:

# 3 channel and 8-bit-color-depth --> 16777216 color combinations

# 256*256*256 = 16777216

scaled_image = (rgb_img_by_cv2).astype(np.uint8)

plt.imshow(scaled_image, cmap='gray');

重要的!

然而,当我们使用扩展名(jpg/jpeg、png、tiff、bmp等)保存图像时,这些扩展名使用压缩算法将图像保存到内存中。这意味着24位彩色图像的1个像素将不会是3个字节,由于这些压缩算法,像素的大小将比3个字节小得多。

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    磐创AI

    人工智能前沿技术分享。...

    举报文章问题

    ×
    • 营销广告
    • 重复、旧闻
    • 格式问题
    • 低俗
    • 标题夸张
    • 与事实不符
    • 疑似抄袭
    • 我有话要说
    确定 取消

    举报评论问题

    ×
    • 淫秽色情
    • 营销广告
    • 恶意攻击谩骂
    • 我要吐槽
    确定 取消

    用户登录×

    请输入用户名/手机/邮箱

    请输入密码