domenica 11 ottobre 2009

reCaptcha aiuterà Google Books

Gli esseri umani aiuteranno gli Ocr di Mountain View e ne guadagneranno in sicurezza.


Google acquisisce reCaptcha Book News Archive

Una delle critiche che alcuni muovono a Google Books è la scarsa qualità di diverse opere acquisite: non tutte le acquisizioni sono fatte a regola d'arte e i testi risultanti sono incomprensibili.

Ciò è dovuto al fallimento del software preposto al riconoscimento ottico dei caratteri (Ocr): servirebbe una supervisione umana che però, considerato l'elevato numero di libri, richiederebbe tempi enormemente lunghi.

Ora tutto ciò potrebbe cambiare: Google ha acquisito - in cambio di una cifra sconosciuta - reCaptcha, un servizio che unisce la protezione dai bot e la digitalizzazione delle opere cartacee.

Rispetto ai captcha tradizionali, reCaptcha non offre semplicemente delle parole distorte che l'utente deve identificare - pratica che ha lo scopo di distinguere gli esseri umani dai programmi - ma brani tratti da libri o giornali.

Ora, in seguito all'acquisizione, chi utilizzerà reCaptcha aiuterà progetti come Google Books e Google News Archive a migliorare i testi che contengono, risolvendo i problemi che hanno messo in difficoltà i software Ocr.

Un ulteriore lato positivo è rappresentato dal fatto che questo sistema, oltre a essere utile, pare anche più sicuro dei sistemi tradizionali.

Nessun commento:

Posta un commento