主要介绍OpenCV中的分水岭算法、图像金字塔对图像进行分割的方法。
分水岭算法的基本原理为:将任意的灰度图像视为地形图表面,其中灰度值高的部分表示山峰和丘陵,而灰度值低的地方表示山谷。用不同颜色的水(标签)填充每个独立的山谷(局部最小值);随着水平面的上升,来自不同山谷(具有不同颜色)的水将开始合并。为了避免出现这种情况,需要在水汇合的位置建造水坝;持续填充水和建造水坝,直到所有的山峰和丘陵都在水下。整个过程中建造的水坝将作为图像分割的依据。
使用分水岭算法执行图像分割操作时通常包含下列步骤:
(1) 将原图转换为灰度图像
(2) 应用形态变换中的开运算和膨胀操作,去除图像噪声,获得图像边缘信息,确定图像背景
(3) 进行距离转换,再进行阈值处理,确定图像前景
(4) 确定图像的未知区域(用图像的背景减去前景剩余的部分)
(5) 标记背景图像
(6) 执行分水岭算法分割图像
OpenCV中的cv2.distanceTransform()函数用于计算非0值像素点到0值(背景)像素点的距离,其基本格式如下:
dst = cv2.distanceTransform(src, distanceType, maskSize[, dstType])
dst
为返回的距离转换结果图像
src
为原图像, 必须是8为单通道二值图像
distanceType
为距离类型
maskSize
为掩膜的大小, 可设置为0, 3或5
dstType
为返回的图像类型, 默认值为CV_32F(32位浮点数)
import cv2 import numpy as np import matplotlib.pyplot as plt # cv2.distanceTransform()函数,计算非0值像素点到0值(背景)像素点的距离 img = cv2.imread('home.jpg') cv2.imshow('original', img) img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 灰度操作 cv2.imshow('gray', img_gray) ret, thresh = cv2.threshold(img_gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU) # 阈值操作 cv2.imshow('thresh', thresh) kernel = np.ones((3, 3), np.uint8) img_open = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, iterations=2) # 形态学操作 cv2.imshow('open', img_open) img_dilate = cv2.dilate(img_open, kernel, iterations=2) # 膨胀操作,确定背景 cv2.imshow('img_dilate', img_dilate) img_dist = cv2.distanceTransform(img_dilate , cv2.DIST_L2, 5) # 距离转换 cv2.imshow('img_dist', img_dist) cv2.waitKey(0) cv2.destroyAllWindows()
OpenCV中的cv2.connectedComponents()函数用于将图像中的背景标记为0,将其他图像标记为从1开始的整数,其基本格式如下:
ret, labels = cv2.connectedComponents(image[, connectivity[, ltype]])
labels
为返回的标记结果图像, 和image大小一样
image
为要标记的8位单通道图像
connectivity
为4或8(默认值), 表示连接性
ltype
为返回的标记结果图像的类型
# cv2.connectedComponents()函数,将图像中的背景标记为0,将其他图像标记为从1开始的整数 ret, imgfg = cv2.threshold(img_dist, 0.7*img_dist.max(), 255, cv2.THRESH_TRUNC) imgfg = np.uint8(imgfg) ret, markers = cv2.connectedComponents(imgfg) plt.imshow(imgfg,cmap='gray') plt.title('imgfg') plt.axis('off') plt.show() plt.imshow(markers,cmap='gray') plt.title('markers') plt.axis('off') plt.show()
OpenCV中的cv2.watershed()函数用于执行分水岭算法分割图像,其基本格式如下:
ret = cv2.watershed(image, markers)
ret
为返回的8位或32位单通道图像
image
为输入的8位或32位单通道图像
markers
为输入的32位单通道图像
# cv2.watershed()函数,执行分水岭算法分割图像 img = cv2.imread('qizi.jpg') img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 灰度操作 ret, thresh = cv2.threshold(img_gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU) # 阈值操作 kernel = np.ones((3, 3), np.uint8) img_open = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, iterations=2) # 形态学操作 img_dilate = cv2.dilate(img_open, kernel, iterations=3) # 膨胀操作(确定背景) img_dist = cv2.distanceTransform(img_open, cv2.DIST_L2, 0) ret, img_fg = cv2.threshold(img_dist, 0.7*img_dist.max(), 255, 2) # 距离操作(确定前景) img_fg = np.uint8(img_fg) ret, markers = cv2.connectedComponents(img_fg) unknown = cv2.subtract(img_dilate, img_fg) # 确定位置未知区域 markers = markers + 1 # 加1使背景不为0 markers[unknown == 255] = 0 # 将未知区域设置为0 img_water = cv2.watershed(img, markers) # 执行分水岭算法 plt.imshow(img_water, cmap='gray') plt.title('watershed') plt.axis('off') plt.show() img[img_water == -1] = [0, 255, 0] # 将原图中的被标记点设置为绿色 cv2.namedWindow('watershed', cv2.WINDOW_NORMAL) cv2.imshow('watershed', img) cv2.waitKey(0) cv2.destroyAllWindows()
图像金字塔从分辨率的角度分析处理图像。图像金字塔的底部为原始图,对原始图像进行梯次向下采样,得到金字塔的其他各层图像。层次越高,分辨率越低,图像越小。通常,每向上一层,图像的宽度和高度就为下一层的一半。常见的图像金字塔可分为高斯金字塔和拉普拉斯金字塔。
高斯金字塔有向上和向下两种采样方式。向下采样时,原始图像为第0层,第1次向下采样的结果为第1层,第2次向下采样的结果为第2层,以此类推。每次采样图像的宽度和高度都减小为原来的一半,所有的图层构成高斯金字塔。向上采样的过程和向下采样的过程相反,每次采样图像的宽度和高度都扩大为原来的二倍。
OpenCV中的cv2.pyrDown()函数用于执行高斯金字塔构造的向下采样步骤,其基本格式如下:
ret = cv2.pyrDown(image[, dstsize[, borderType]])
ret
为返回的结果图像, 类型和输入图像相同
image
为输入图像
dstsize
为结果图像大小
borderType
为边界类型
# 高斯金字塔向下采样 img = cv2.imread('qizi.jpg') img1 = cv2.pyrDown(img) img2 = cv2.pyrDown(img1) cv2.imshow('img', img) cv2.imshow('img1', img1) cv2.imshow('img2', img2) print('0层的形状:', img.shape) print('1层的形状:', img1.shape) print('2层的形状:', img2.shape) cv2.waitKey(0) cv2.destroyAllWindows()
OpenCV中的cv2.pyrUp()函数用于执行高斯金字塔构造的向下采样步骤,其基本格式如下:
ret = cv2.pyrUp(image[, dstsize[, borderType]])
ret
为返回的结果图像, 类型和输入图像相同
image
为输入图像
dstsize
为结果图像大小
borderType
为边界类型
拉普拉斯金字塔的第n层是该层高斯金字塔图像减去n+1层向上采样的结果获得的图像。
# 拉普拉斯金字塔 img = cv2.imread('qizi.jpg') img1 = cv2.pyrDown(img) img2 = cv2.pyrDown(img1) img3 = cv2.pyrDown(img2) imgL0 = cv2.subtract(img, cv2.pyrUp(img1)) imgL1 = cv2.subtract(img1, cv2.pyrUp(img2)) imgL2 = cv2.subtract(img2, cv2.pyrUp(img3)) cv2.imshow('imgL0', imgL0) cv2.imshow('imgL1', imgL1) cv2.imshow('imgL2', imgL2) cv2.waitKey(0) cv2.destroyAllWindows()
# 应用图像金字塔实现图像融合 img1 = cv2.imread('jiang1.jpg') img2 = cv2.imread('jiang2.jpg') #生成图像1的高斯金字塔,向下采样6次 img = img1.copy() img1Gaus = [img] for i in range(6): img = cv2.pyrDown(img) img1Gaus.append(img) #生成图像2的高斯金字塔,向下采样6次 img = img2.copy() img2Gaus = [img] for i in range(6): img = cv2.pyrDown(img) img2Gaus.append(img) #生成图像1的拉普拉斯金字塔,6层 img1Laps = [img1Gaus[5]] for i in range(5,0,-1): img = cv2.pyrUp(img1Gaus[i]) lap = cv2.subtract(img1Gaus[i-1],img) #两个图像大小不同时,做减法会出错 img1Laps.append(lap) #生成图像2的拉普拉斯金字塔,6层 img2Laps = [img2Gaus[5]] for i in range(5,0,-1): img = cv2.pyrUp(img2Gaus[i]) lap = cv2.subtract(img2Gaus[i-1],img) img2Laps.append(lap) #拉普拉斯金字塔拼接:图像1每层左半部分与和图像2每层右半部分拼接 imgLaps = [] for la,lb in zip(img1Laps,img2Laps): rows,cols,dpt = la.shape ls=la.copy() ls[:,int(cols/2):]=lb[:,int(cols/2):] imgLaps.append(ls) #从拉普拉斯金字塔恢复图像 img = imgLaps[0] for i in range(1,6): img = cv2.pyrUp(img) img = cv2.add(img, imgLaps[i]) #图像1原图像的半部分与和图像2原图像的右左半部分直接拼接 direct = img1.copy() direct[:,int(cols/2):]=img2[:,int(cols/2):] cv2.imshow('Direct',direct) #显示直接拼接结果 cv2.imshow('Pyramid',img) #显示图像金字塔拼接结果 cv2.waitKey(0) cv2.destroyAllWindows()
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
长按识别二维码并关注微信
更方便到期提醒、手机管理