2014年3月18日 星期二

Image Enhancement and Edge Detection

第二次作業主要是實作兩個演算法,分別是:
  1. Histogram Equalization
  2. Sobel Operator

Histogram Equalization

(圖片取自 Wikipedia

直方圖均化(Histogram Equalization),這種方法主要是將原本集中在某個區塊的機率函數(Probability Density Function),平均的分布在所有顏色上,藉此來增加圖像的全局對比度。


上圖為範例圖片,左部分是一般灰階處理,而右半部則是經過直方圖均化的產物,可以很明顯的看見其對比度的提高。接著可以看到,下圖是兩張圖片的直方圖比較表。

(直方圖)

Equalize 的主要演算法如下:
def equalize(histogram):
    lut = []
    for x in xrange(0, len(histogram), 256):
        step = reduce(operator.add, histogram[x:x + 256]) / 255
        n = 0
        for y in xrange(256):
            lut.append(n / step)
            n = n + histogram[y + x]

    return lut



Sobel Operator

在網路上 Survey 之後,發現索貝爾運算子(Sobel Operator)只是圖像處理中的運算子之一。其主要方法就是,算出影像的垂直梯度(gradient)與水平梯度兩者取絕對值相加即可。而該運算子的兩個加權函數(weighting function)是:


在知道加權函數後,我們得讓圖片的 pixel 與函數相乘

最後將其取絕對值相加

如此一來便能能夠得到結果,如下圖:


下面的程式碼是索貝爾運算子的部分核心代碼:
    # sobel weighting function
    sobelX = [-1, 0, 1, -2, 0, 2, -1, 0, 1]
    sobelY = [-1, -2, -1, 0, 0, 0, 1, 2, 1]

    # 相乘、取絕對值
    for x in xrange(1, height - 1):
        for y in xrange(1, width - 1):
            for k in xrange(3):
                for m in xrange(3):
                    tempX[k * 3 + m] = imagePixel[y - 1 + m, x - 1 + k] * sobelX[k * 3 + m]
                    tempY[k * 3 + m] = imagePixel[y - 1 + m, x - 1 + k] * sobelY[k * 3 + m]

            sharpPixel[y, x] = abs(sum(tempX)) + abs(sum(tempY))


Conclusion

這次作業完成後,原本想拿這支程式去對驗證碼進行前處理,看能不能有效的把雜訊去除,結果好像有點碰壁,希望之後了解更多後,能夠實作出來!

2014年3月8日 星期六

Image Scaling and Rotation

第一次作業,題目是影像的縮放與旋轉,重點就是操作影像的位置。而我們要實作的演算法,總共有三個:NN、Bilinear、Bicubic。

Nearest Neighbor Interpolation

(圖片取自 Tech-Algorithm

如上圖所示,這個演算法縮放圖片的方法,就是找其最近的一個鄰居,根據鄰居的顏色,來填補空缺的格子。NN追求的是簡單與快速,所以在圖片處理上相較含糊,如果放大的倍率很大的話,很容易看到鋸齒狀的結果。以下是 lena 放大三倍後的結果。

(3x lena.bmp with NN)

Bilinear Interpolation

(圖片取自 Tech-Algorithm

Bilinear與NN不同的地方是,找其最近的四個鄰居,並且根據內插法(Interpolation)去決定顏色。因此,這個縮放出來會比 NN 還要平滑,鋸齒狀的結果會比較少見,但當然只是相對少見。

(3x lena.bmp with Bilinear)

Bicubic Interpolation

Bicubic 使用鄰近十六個鄰居的像素來決定本身的值,所以相對前面兩個會比較清晰,但花費時間也久了一點。而當你將他放大看時,你能發現圖片的銳利度是比較高的。

(3x lena.bmp with Bicubic)

Image Rotation using Nearest Neighbor

這個部分,其實也可以使用 Bilinear 實作,不過比較複雜,所以就選擇了 NN。

(Rotated lena.bmp with NN)

Conclusion

在這次學習之後,讓我對於影像處理有初步的了解。個人覺得三個演算法中,就屬 Bilinear 最平衡,所需時間小於 Bicubic ,且品質大於 Nearest Neighbor。