Bootstrap

分水岭算法简介

分水岭算法是一种经典的图像分割技术,广泛应用于图像处理领域。它的名称源自地理学中的“分水岭”概念,即在地形中,水从高处流向低处,最终汇聚成河流的过程。在图像分割中,分水岭算法将灰度图像视为地形,将像素值看作海拔高度。该算法模拟水从各个局部最小值(即山谷)向外扩展,最终在山峰相遇处形成分割边界。

分水岭算法的步骤
  1. 图像预处理

    • 首先,对输入图像进行灰度化处理,然后通过高斯模糊等方法进行平滑,减少噪声的影响。
  2. 图像二值化

    • 通过阈值分割,将图像二值化。通常,采用 Otsu 方法自动确定最佳阈值,以确保前景和背景的有效分离。
  3. 形态学操作

    • 使用形态学开运算去除噪点,并通过膨胀操作填补前景中的空洞,以获得较为平滑的背景区域。
  4. 确定前景和背景

    • 应用距离变换技术,确定前景区域。通过对开运算结果进行距离变换,可以计算前景物体到边缘的距离。然后,通过设定阈值分割,得到前景区域。
    • 背景区域通过膨胀操作从前景区域推导出来。
  5. 找到未知区域

    • 通过将背景区域和前景区域相减,得到未知区域。这些区域通常位于前景和背景之间,是分割的关键部分。
  6. 标记连通区域

    • 对确定的前景区域进行连通区域标记,以标识不同的物体。为了避免背景标记为零,通常将所有标记值加 1,然后将未知区域标记为 0。
  7. 应用分水岭算法

    • 最后,应用分水岭算法,通过不断扩展标记区域,最终在不同物体之间形成分割边界。

代码实现

以下是使用分水岭算法进行图像分割的完整代码示例:

import cv2
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties

# 设置字体为黑体,避免中文显示乱码
font = FontProperties(fname="C:/Windows/Fonts/simhei.ttf", size=12)

# 读取图像
image = cv2.imread('yibgbi.png')  # 将路径替换为你的图像路径
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)  # 转换为灰度图像
blurred = cv2.GaussianBlur(gray, (5, 5), 0)  # 应用高斯模糊,平滑图像

# 二值化图像(使用Otsu方法进行阈值分割)
_, binary = cv2.threshold(blurred, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

# 形态学操作去噪点和填补空洞
kernel = np.ones((3, 3), np.uint8)  # 定义3x3的卷积核
opening = cv2.morphologyEx(binary, cv2.MORPH_OPEN, kernel, iterations=3)  # 开运算去除噪点

# 确定背景区域(膨胀操作)
sure_bg = cv2.dilate(opening, kernel, iterations=3)  # 膨胀操作填补空洞,得到确定的背景

# 确定前景区域(距离变换和阈值分割)
dist_transform = cv2.distanceTransform(opening, cv2.DIST_L2, 5)  # 距离变换
_, sure_fg = cv2.threshold(dist_transform, 0.1 * dist_transform.max(), 255, 0)  # 阈值分割得到确定的前景区域
sure_fg = np.uint8(sure_fg)  # 转换为8位整型

# 找到未知区域
unknown = cv2.subtract(sure_bg, sure_fg)  # 背景减去前景得到未知区域

# 标记连通区域
_, markers = cv2.connectedComponents(sure_fg)  # 连通组件标记

# 所有标记加一,确保背景不是0
markers = markers + 1

# 将未知区域标记为0
markers[unknown == 255] = 0

# 应用分水岭算法
markers = cv2.watershed(image, markers)
image[markers == -1] = [255, 0, 0]  # 用红色标记分割边界

# 绘制结果
plt.figure(figsize=(14, 12))

plt.subplot(2, 4, 1)
plt.title("原始图像", fontproperties=font)
plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))

plt.subplot(2, 4, 2)
plt.title("二值化图像", fontproperties=font)
plt.imshow(binary, cmap='gray')

plt.subplot(2, 4, 3)
plt.title("开运算去噪点", fontproperties=font)
plt.imshow(opening, cmap='gray')

plt.subplot(2, 4, 4)
plt.title("确定的背景", fontproperties=font)
plt.imshow(sure_bg, cmap='gray')

plt.subplot(2, 4, 5)
plt.title("确定的前景", fontproperties=font)
plt.imshow(sure_fg, cmap='gray')

plt.subplot(2, 4, 6)
plt.title("未知区域", fontproperties=font)
plt.imshow(unknown, cmap='gray')

plt.subplot(2, 4, 7)
plt.title("距离变换", fontproperties=font)
plt.imshow(dist_transform, cmap='gray')

plt.subplot(2, 4, 8)
plt.title("分水岭分割结果", fontproperties=font)
plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))

plt.show()

;