思在樹人

當你用手機時，你有用過手寫的輸入嗎？相信很多人用過，不過我想知道原理的人應該不多，讓我為大家介紹一下這個技術的大概。
文字辨識是圖形辨識的一個應用，中文和英文的辨識方法可以相同，也可以有區別，為何存在這個區別，不是本文的主題，就不說了。
要瞭解文字辨識的技術，我們要先瞭解辨識的東西是什麼，能夠手寫的手機螢幕其實是一個數位板，根據螢幕上手寫區域的大小，我們可以將之想成m * n 的數位影像，影像的大小就以128 ＊ 128為例來說明好了，每一個點稱為像素，由於手寫對每一個像素只有經過與未經過，所以每一像素的值也就只有0和1,當我們的手指劃過時，所有經過的位置上面的像素值都會變成1；還有一個想法是當手指劃過時，上面的座標值會被儲存在成一個序列，我們就把他們叫做軌跡好了，軌跡上面有我們寫的順序資訊，也可以稱為動態資訊，這個資訊對辨識英文和數字有用，但用來辨識中文字，死路一條，理由之一是大家手寫的筆畫順序不同。好了，簡單一句話，你的輸入就是一個二元的數位影像啦。（再囉唆一下，二元就是0和1.）
辨識的概念也很直覺，將輸入的影像特徵和預先建立好的字典裡的M個影像特徵比較（或稱為模型庫──我不想用這個字，一般人讀起來比較「硬」），誰比較像，這個輸入的文字就是誰。這裡的「比較像」在手寫中文字辨識時，可以找出前十名（可以調整）最像的，然後由使用者點選他要的，如果前十名沒有輸入的字，只好再輸入一次，我最近使用iPad的經驗，第一、二名的辨識結果已經蠻高的，這辨識率當然和螢幕大小和手寫字工不工整有關係了（iPhone螢幕相對的比較小，比較不好寫）。一般說來常用的中文字有五千多個，我們就取整數6000好了，也就是說字典裡已經建立好6000個（上面的M）特徵值。

(繼續閱讀...)

快樂的園丁發表在痞客邦留言(0) 人氣(1,714)

當你買手機的時候，你也許會希望你手機的像素是3M或5M,這個值到底代表什麼意思呢？
首先解釋一下這個M的意義，M代表1百萬，10的六次方，你可以把它分解成1000＊1000,這不就是1百萬。為什麼要這樣分解？我們可以簡單的這樣想，一張圖的長或寬，你都可以將之分成1000等分，每一個格子就是一個基本的影像元素（Picture element),我們可以將之簡稱為像素或畫素（Pixel).一個像素的實際大小有多少，早期的掃描器會有所謂300DPI（Dot-per-inch)的說法（現在的印表機也還是這樣說的），它的意思就是每英吋有多少點，現在的數位相機就不是那麼的絕對囉，跟取像的元件數還有拍照的距離有關。
表示每一個像素的方法，可以有三個基本的分法，如果只有黑與白，那用0與1表示就夠了，也就是用一個bit。如果是黑白照片，一般把黑白分成256種不同的變化，就稱為灰階值（人的眼睛對黑白的變化能分得出來的灰階值不多，10-20；又醫學影像的灰階值分得更細，有些種影像會達4096種），在電腦上，如果要表示256種可能性，就要用一個byte,這是我們平常定義記憶體大小的基本單位（有些地方講上網速度，其實講的是bit），我們說記憶體有1M,就是說他有1M byte.好了，那如果是彩色影像呢？色彩的表示法其實還是個大學問，我們用最簡單的RGB（Red-Green-Blue,紅綠藍）來表示，每一種顏色一個byte（位元組），代表一個像素就要三個byte.那麼大小為1M的數位影像就要3M的記憶體了。順便一提的是彩色影像除了用RGB表示以外，還有很多種不同的表示方法。
一張影像的像素不會只有1000＊1000,現在的數位相機會標出來影像的大小，像我最近拍花花草草的像素為2816 ＊ 2112,約為6M,如果用RGB的表示法就要用掉記憶體18M 喔，我們用「檔案總管」看一下影像檔案的大小，好像也沒有這麼大呀，我查了一下，約略的只有1.0-3.0M,這是怎麼一回事呀？答案是影像的檔案被壓縮了，影像壓縮的方法有兩種類型，一種是無失真的壓縮，這對一般的文字資料也有用，一種是有失真的壓縮，對影像或視訊的壓縮通常是使用後面這一種，簡單的講法是有失真的壓縮倍率高，而且你也看不出來。不管哪一類型的壓縮，都有很多的方法和原理，我們平常看影像檔後面有.jpg或.gif或.tiff（請參考下面的迴響，謝謝提供說明的隱形人。）等，就是表示壓縮的方法，電腦看到這個檔名的尾部（擴充部），就會有相對應的程式去「解壓縮」，然後還原給影像處理的程式應用。

(繼續閱讀...)

快樂的園丁發表在痞客邦留言(2) 人氣(415)

我思並我在、樹木兼樹人；臉書粉絲專業：「草木居」 https://www.facebook.com/succulentgarden (since June 13, 2010)；

淺談手寫中文輸入

你的手機有多少畫素？──數位影像知一二

參觀人氣

文章搜尋

最新文章

文章分類

花蓮生活 (3)

盆景與盆栽 (4)

多肉植物 (9)

熱門文章

最新迴響

誰來我家

個人資訊

文章精選