是否有任何理由將圖像的通道順序從 RGB 更改為 BGR？

ImSo3K 发表于 Dev

ImSo3K

我一直在關注這個 keras視頻分類教程，其中在數據準備部分，他們在load_video函數中加載視頻的幀非常一般，但引起我注意的是這一行：

frame = frame[:, :, [2, 1, 0]]

這是我第一次遇到這種情況，大多數情況下您只會將幀“按原樣”附加到您的幀列表中，但在這裡它們將通道的順序（如果我沒記錯的話）從 RGB 更改為BGR，我在網絡或他們的文檔中找不到任何與之相關的內容，有人能給我一些關於這個決定的見解嗎？

雷嶺

根據經驗，順序可以更改的原因取決於您用於加載圖像的框架。OpenCV 特別以 BGR 格式對通道進行排序，因為一些內部優化以這種方式利用格式。可以使用 scikit-image、matplotlib 和 Pillow 查看常規 RGB 格式的圖像。

實際上，如果您查看該load_video函數，它會使用 OpenCV 打開視頻，因此輸入的幀是 BGR 格式。因此，必須交換通道才能將其轉換為 RGB 格式：

def load_video(path, max_frames=0):
    cap = cv2.VideoCapture(path)
    frames = []
    try:
        while True:
            ret, frame = cap.read()
            if not ret:
                break
            frame = crop_center(frame)
            frame = frame[:, :, [2, 1, 0]]
            frames.append(frame)

            if len(frames) == max_frames:
                break
    finally:
        cap.release()
    return np.array(frames)

您當然不需要反轉通道，因為神經網絡會根據它提供的輸入數據進行學習，但人們傾向於這樣做，以便輕鬆調試圖像，而不必擔心不斷反轉通道展示。具體來說，如果神經網絡是按 BGR 排序訓練的，如果您以 RGB 格式加載圖像，則需要完成通道的反轉，因為這就是訓練中圖像通道的表示方式。總而言之，這取決於框架，但在訓練後使用神經網絡時需要牢記這一點。如果數據以 BGR 格式訓練，如果您的圖像以 RGB 格式讀取，則需要在推理之前反轉通道。

事實上，這是使用網絡時的常見錯誤！非常勤奮，並在使用之前了解圖像數據是如何為網絡進行預處理的。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-11-26

我来说两句

0 条评论

登录后参与评论

上一篇：正則表達式匹配兩位數之間沒有字母的字符串

TOP 榜单

文章

是否有任何理由將圖像的通道順序從 RGB 更改為 BGR？

是否有任何理由將圖像的通道順序從 RGB 更改為 BGR？

构建类似于Jarvis的本地语言应用程序

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

错误：找不到存根。请确保已调用spring-cloud-contract：convert

如何了解DFT结果

ng升级性能注意事项

Embers js中的更改侦听器上的组合框

Swift 2.1-对单个单元格使用UITableView

Java中的循环开关案例

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

ggplot：对齐多个分面图-所有大小不同的分面

如何避免每次重新编译所有文件？

Swift中的指针替代品？

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

使用分隔符将成对相邻的数组元素相互连接

如何开始为Ubuntu开发

Blazor：如何将事件传递给通用组件中的onClick函数