reclame

joi, 24 iunie 2010

Google Docs stie OCR

Deşi în ziua de azi sunt destule site-uri care ofera convertirea unui fişier PDF sau o poză care conţine text în format electronic pe care ulterior sa-l puteţi edita. De curând şi google docs face acest lucru la documentele urcate în contul dumneavoastră. Lucurul acesta îl facea şi înainte google dar era o metodă destul de complicată şi care necesită destul timp deoparece se publica PDF-ul pe web, aşteptai ca Google să îl indexeze, să creeze versiunea text, apoi cautai documentul tău PDF online şi luai textul.
Eu am testat astăzi această facilitate şi pentru un document făcut PDF din calculator dintr-un document word, şi un al doilea test cu un articol din ziar scanat ca JPEG.
Pasul următor, după ce aveţi PDF-ul, este să îl încărcaţi în Google Docs. Aveţi o nouă opţiune: Convertiţi textele din fişiere PDF sau fişiere imagine în documente Google Docs.
Aşteptaţi să se încarce şi apoi vedeţi documentul. În el va fi o notă de la Google şi PDF-ul ca imagine. Le puteţi şterge. După ele apare textul interpretat!
Rezultatele pe textul trasformat din document word în pdf a fost unul foarte bun, diacriticele au fost recunoscute fără probleme! La testul cu articolul din ziar a fost unu dezamagitor, dar dacă se corecteaza problemele de contrast, litere semişterse sau fonturi ciudate, calitatea redării textului se va îmbunatăţi dar acest lucru necestă ceva cunoştinţe şi timp.
Va las şi pe voi să testaţi diverse fişiere PDF cu parola, şi alte tipuri de securitate.