當你用手機時,你有用過手寫的輸入嗎?相信很多人用過,不過我想知道原理的人應該不多,讓我為大家介紹一下這個技術的大概。
文字辨識是圖形辨識的一個應用,中文和英文的辨識方法可以相同,也可以有區別,為何存在這個區別,不是本文的主題,就不說了。
要瞭解文字辨識的技術,我們要先瞭解辨識的東西是什麼,能夠手寫的手機螢幕其實是一個數位板,根據螢幕上手寫區域的大小,我們可以將之想成m * n 的數位影像,影像的大小就以128 * 128為例來說明好了,每一個點稱為像素,由於手寫對每一個像素只有經過與未經過,所以每一像素的值也就只有0和1,當我們的手指劃過時,所有經過的位置上面的像素值都會變成1;還有一個想法是當手指劃過時,上面的座標值會被儲存在成一個序列,我們就把他們叫做軌跡好了,軌跡上面有我們寫的順序資訊,也可以稱為動態資訊,這個資訊對辨識英文和數字有用,但用來辨識中文字,死路一條,理由之一是大家手寫的筆畫順序不同。好了,簡單一句話,你的輸入就是一個二元的數位影像啦。(再囉唆一下,二元就是0和1.)
辨識的概念也很直覺,將輸入的影像特徵和預先建立好的字典裡的M個影像特徵比較(或稱為模型庫──我不想用這個字,一般人讀起來比較「硬」),誰比較像,這個輸入的文字就是誰。這裡的「比較像」在手寫中文字辨識時,可以找出前十名(可以調整)最像的,然後由使用者點選他要的,如果前十名沒有輸入的字,只好再輸入一次,我最近使用iPad的經驗,第一、二名的辨識結果已經蠻高的,這辨識率當然和螢幕大小和手寫字工不工整有關係了(iPhone螢幕相對的比較小,比較不好寫)。一般說來常用的中文字有五千多個,我們就取整數6000好了,也就是說字典裡已經建立好6000個(上面的M)特徵值。
文字辨識是圖形辨識的一個應用,中文和英文的辨識方法可以相同,也可以有區別,為何存在這個區別,不是本文的主題,就不說了。
要瞭解文字辨識的技術,我們要先瞭解辨識的東西是什麼,能夠手寫的手機螢幕其實是一個數位板,根據螢幕上手寫區域的大小,我們可以將之想成m * n 的數位影像,影像的大小就以128 * 128為例來說明好了,每一個點稱為像素,由於手寫對每一個像素只有經過與未經過,所以每一像素的值也就只有0和1,當我們的手指劃過時,所有經過的位置上面的像素值都會變成1;還有一個想法是當手指劃過時,上面的座標值會被儲存在成一個序列,我們就把他們叫做軌跡好了,軌跡上面有我們寫的順序資訊,也可以稱為動態資訊,這個資訊對辨識英文和數字有用,但用來辨識中文字,死路一條,理由之一是大家手寫的筆畫順序不同。好了,簡單一句話,你的輸入就是一個二元的數位影像啦。(再囉唆一下,二元就是0和1.)
辨識的概念也很直覺,將輸入的影像特徵和預先建立好的字典裡的M個影像特徵比較(或稱為模型庫──我不想用這個字,一般人讀起來比較「硬」),誰比較像,這個輸入的文字就是誰。這裡的「比較像」在手寫中文字辨識時,可以找出前十名(可以調整)最像的,然後由使用者點選他要的,如果前十名沒有輸入的字,只好再輸入一次,我最近使用iPad的經驗,第一、二名的辨識結果已經蠻高的,這辨識率當然和螢幕大小和手寫字工不工整有關係了(iPhone螢幕相對的比較小,比較不好寫)。一般說來常用的中文字有五千多個,我們就取整數6000好了,也就是說字典裡已經建立好6000個(上面的M)特徵值。
