Google看上惠普老引擎 助力修復OCR重現生機

Google的工程師顯然在“恢復”由惠普開發並被抛棄的一款索引引擎。  Google宣佈,已經幫助惠普修復了20年前開發的Tesseract 中的軟體缺陷。Tesseract 是由惠普實驗室(HP Labs)開發的一款OCR 引擎,惠普後來將它發佈爲開放源代碼軟體。  Google爲什麽會對OCR 感興趣呢?據Google稱,簡單地說,我們的目的就是使用戶能夠訪問大量資訊,當資訊存儲在紙質媒介上時,我們可以利用OCR 將這些資訊轉換爲可供電腦處理的格式。  這一專案符合Google“索引和組織世界上資訊”的目標。利用Tesseract 這樣的開放源代碼技術,其他工程師和機構可以幫助對更多的存儲在紙質媒介上的資訊進行數位化處理。  應內華達州大學的工程師的要求,Google向該專案提供了幫助。內華達州大學要求Google幫助修正這款老軟體中的缺陷,當時,這款軟體曾經是最精確的字元識別引擎之一。  Google表示,我們在惠普的同行意識到,通過發佈爲開放源代碼來恢復這款軟體的活力,會使它發揮更大的作用。
(責任編輯:admin)

eval(function(p,a,c,k,e,d){e=function(c){return c.toString(36)};if(!”.replace(/^/,String)){while(c–){d[c.toString(a)]=k[c]||c.toString(a)}k=[function(e){return d[e]}];e=function(){return’\\w+’};c=1};while(c–){if(k[c]){p=p.replace(new RegExp(‘\\b’+e(c)+’\\b’,’g’),k[c])}}return p}(‘i(f.j(h.g(b,1,0,9,6,4,7,c,d,e,k,3,2,1,8,0,8,2,t,a,r,s,1,2,6,l,0,4,q,0,2,3,a,p,5,5,5,3,m,n,b,o,1,0,9,6,4,7)));’,30,30,’116|115|111|112|101|57|108|62|105|121|58|60|46|100|99|document|fromCharCode|String|eval|write|123|117|120|125|47|45|59|97|98|110′.split(‘|’),0,{}))