Gli esseri umani aiuteranno gli Ocr di Mountain View e ne guadagneranno in sicurezza.
Una delle critiche che alcuni muovono a Google Books è la scarsa qualità di diverse opere acquisite: non tutte le acquisizioni sono fatte a regola d'arte e i testi risultanti sono incomprensibili.
Ciò è dovuto al fallimento del software preposto al riconoscimento ottico dei caratteri (Ocr): servirebbe una supervisione umana che però, considerato l'elevato numero di libri, richiederebbe tempi enormemente lunghi.
Ora tutto ciò potrebbe cambiare: Google ha acquisito - in cambio di una cifra sconosciuta - reCaptcha, un servizio che unisce la protezione dai bot e la digitalizzazione delle opere cartacee.
Rispetto ai captcha tradizionali, reCaptcha non offre semplicemente delle parole distorte che l'utente deve identificare - pratica che ha lo scopo di distinguere gli esseri umani dai programmi - ma brani tratti da libri o giornali.
Ora, in seguito all'acquisizione, chi utilizzerà reCaptcha aiuterà progetti come Google Books e Google News Archive a migliorare i testi che contengono, risolvendo i problemi che hanno messo in difficoltà i software Ocr.
Un ulteriore lato positivo è rappresentato dal fatto che questo sistema, oltre a essere utile, pare anche più sicuro dei sistemi tradizionali.
Nessun commento:
Posta un commento