掃描的文章想要把它轉成文字,需要的就是光學文字辨識系統(Optical Character Recognition,簡稱OCR)。市面上還有許多其它的軟體,以後會再介紹。
網址:http://home.megapass.co.kr/~woosjung/Product_JOCR.html
載點:http://home.megapass.co.kr/~woosjung/Files/JOCR.exe
之所以放上載點是因為這網站做得不好,點進JOCR之後,下面沒有載點,要回到首頁之後點download,才會看到。另外,你可能會注意到這軟體有點舊了,但在vista上跑還是沒有問題的。不過要能正確使用這套軟體,你必須安裝Office裡面的Microsoft Office Document Imaging(MODI)。怎麼知道你有沒有呢?下載JOCR並執行,點辨識後如果你沒安裝的話,它就會要你安裝。
由於我懶得掃圖,就先試試網頁上截取一段文字,看看效果怎麼樣。
Yahoo新聞網址:http://tw.news.yahoo.com/article/url/d/a/081208/17/1arjr.html
沒多久就說辨識好了。
這是成品。
可是仔細一看,不少地方有問題 (P.S.第二行最後面兩個將是原文有誤,但我看了礙眼還是給它個圈圈)。雖然速度快,省了不少時間,但校對仍是必要的,萬一重要quote引到自己的文章,結果辨識錯了,那不是很窘嗎?
非常好用的軟體