4 herramientas de OCR en línea gratuitas puestas a prueba

4 herramientas de OCR en línea gratuitas puestas a prueba

Si desea convertir cualquier texto impreso en texto digital que pueda copiar, pegar, editar y buscar, deberá utilizar escáneres de reconocimiento óptico de caracteres (OCR).





Cuando elige escanear o tomar una foto de un documento, este se guardará en un formato como JPEG o PDF. Software de OCR luego puede reconocer las letras y números dentro de estos documentos y convertirlos en un PDF con capacidad de búsqueda o en un archivo que puede editar en programas como Microsoft Word.





El problema es que algunos escáneres OCR funcionan mucho mejor que otros, y el mejor es bastante pesado.





Omnipage18, por ejemplo, cuesta $ 150, pero es especialmente bueno para reconocer diferentes idiomas. Adobe Acrobat Pro DC cuesta $ 400, pero tiene una precisión increíble. ABBYY FineReader cuesta $ 150, pero es fantástico para convertir documentos como revistas y folletos en texto con capacidad de búsqueda. Probaremos la oferta en línea de ABBYY más adelante en este artículo.

Sin embargo, si buscas alternativas gratuitas, puedes descargar y usarlo en Windows u OS X, debe probar estas herramientas de OCR. Pero si prefiere utilizar un en línea Herramienta de OCR, siga leyendo, ya que probamos los primeros, con los resultados a continuación.



La prueba

Parece que la mayoría de la gente ahora usa sus teléfonos inteligentes para escanear por ellos, decidí usar Aplicación escaneable de Evernote (Gratis en iOS y Android). Escaneé la primera página de Richard Dawkin Escalar el monte improbable , para ver qué resultados podríamos obtener con un formato muy básico. También escaneé una página de Tim Ferriss El chef de 4 horas para probar los escáneres con un formato un poco más complicado. Guardé cada uno de estos archivos como PDF.

Luego, estos documentos se procesaron a través de algunas de las mejores herramientas de OCR en línea supuestamente para ver qué tan bien les fue.





OCR en línea gratuito [ya no está disponible]

Afortunadamente, no es necesario registrarse para utilizar Free Online OCR. Y quedé doblemente impresionado cuando vi su reclamo de mantener el formato y el diseño de mi documento.

El sitio afirma poder admitir PDF, GIF, BMP, JPEG, TIFF y PNG como entrada. Las salidas pueden ser DOC, un documento de texto PDF, RTF y TXT. Desafortunadamente, no pude averiguar si tenían un límite de tamaño de archivo.





Documento básico a PDF

Convertido absolutamente perfectamente. ¡No hay mucho más que decir! Nos vamos a un muy buen comienzo.

Documento básico a DOC

Las palabras reales parecen haberse convertido a la perfección, aparte del 'ount' de 'Mount Rushmore' que de alguna manera se ausentó sin permiso. Sin embargo, el formato es una historia diferente. Muchas comas se reemplazaron por guiones bajos y se insertaron espacios aleatorios en algunos puntos del documento. Sin embargo, cuando vea más tarde cómo le fue al software premium en esta prueba, este no es un mal esfuerzo en absoluto .

Documento complejo a PDF

Documento complejo a DOC

Esta vez, la conversión solo tomó 10 segundos, y el texto se volvió a convertir con una precisión de alrededor del 95%. Hubo algunos problemas de espaciado extraños, y el software tuvo problemas para convertir la fuente en la parte superior derecha del documento y perdió algunos caracteres aquí y allá.

Veredicto

i2OCR

i2OCR hace algunas afirmaciones impresionantes. La herramienta reconoce más de 60 idiomas, puede manejar diseños de varias columnas (eliminando el formato), no tiene límites de tamaño de archivo, puede convertir archivos cargados y de las URL. Y tampoco es necesario que se registre para utilizar esta herramienta.

El servicio funciona simplemente extrayendo el texto de su imagen y luego generando texto sin formato. Puede corregir rápidamente cualquier error en la vista en paralelo, antes de copiar el texto a otros programas o descargarlo como DOC, PDF o HTML.

Nota: cuando intenté cargar mis documentos PDF, i2OCR los rechazó, por lo que necesitaba convertirlos a JPEG (tomando una captura de pantalla y luego cargando los archivos).

Documento básico a texto sin formato

Documento complejo a texto sin formato

La mayor parte del texto se convirtió sin demasiados errores, aparte del título y la receta en la parte superior derecha, que era ilegible para esta herramienta. La forma en que las columnas se convirtieron a texto sin formato distaba mucho de ser ideal. Si desea que esta conversión funcione, se necesitará mucho tiempo para reorganizar las líneas en oraciones coherentes.

Veredicto

OCR en línea

El OCR en línea admite actualmente 46 idiomas diferentes y puede convertir PDF, JPG, BMP, TIFF y GIF a formato Word, Excel o texto sin formato. El sitio afirma que 'los documentos convertidos se ven exactamente como el original: tablas, columnas y gráficos'.

La versión que puede utilizar sin registrarse le permite convertir hasta 15 imágenes por hora (límite de 5 MB). Si se registra para obtener una cuenta, puede comprar más páginas además de este límite, al mismo tiempo que puede convertir documentos de varias páginas y archivos ZIP.

Documento básico a DOC

El documento básico convertido sin problemas aparte del número romano I no ser recogido. Como prometió el sitio, el formato fue exactamente como estaba en el libro. Felicitaciones a esta herramienta.

Documento complejo a DOC

Después de estar decepcionado por las herramientas de OCR anteriores para convertir el documento complejo, quedé enormemente impresionado por el OCR en línea. El diseño era casi perfecto, como puede ver arriba. Una vez más, sin embargo, la receta no se recogió demasiado bien, pero cualquier otro error menor fue insignificante.

Veredicto

Resultados absolutamente fantásticos de Online OCR. El único inconveniente que veo es que no hay forma de descargar los documentos convertidos como PDF, ya que los formatos de salida mencionados incluyen solo DOCX, XLSX y TXT.

ABBYY FineReader Online (prueba de 10 páginas)

Como se mencionó anteriormente, ABBYY es uno de los líderes del mercado en software de OCR y cuesta alrededor de $ 150 por su programa completo descargable. Ofrecen un Prueba gratuita de 10 páginas para su herramienta en línea, sin embargo (se requiere registro). Por una suscripción de $ 5, su herramienta en línea le permitirá convertir 200 páginas cada mes.

Los archivos aceptados pueden tener un tamaño de hasta 100 MB, en cualquiera de estos formatos: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP y PNG. ABBYY también reconoce casi 200 idiomas. Los resultados son especialmente impresionantes, con la posibilidad de elegir entre DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 y EPUB.

Incluso puede probar un par de funciones BETA durante su prueba. La primera es la opción de traducir su documento a otro idioma. La otra es exportar su documento convertido a su cuenta de almacenamiento en la nube, ya sea Dropbox, Google Drive, Evernote, Microsoft OneDrive o Box.

Documento básico a DOCX

Documento complejo a DOCX

Una vez convertido, hubo muy pocas fallas en el texto dentro del documento (¡aparte de que el OCR luchó con la fuente de esa receta nuevamente!), Pero el formato dejaba mucho que desear.

Las tres columnas de alguna manera ocupaban dos páginas, con la columna central solamente que aparece en la segunda página. Si quisieras realmente hacer cualquier cosa con este documento convertido, terminaría tirándose de los pelos.

Documento básico a PDF

Documento complejo a PDF

Veredicto

El resultado final

Si, como la mayoría de las personas, solo está buscando escanear algunos artículos de revistas y algunas facturas del hogar, no necesitará editar estos documentos. Por lo tanto, la conversión directa a PDF será adecuada para usted, porque aún podrá buscar esos documentos. Para esto, Free Online OCR fue definitivamente la mejor herramienta gratuita que probamos. Dicho esto, si está dispuesto a pagar $ 5 por mes por casi la perfección, FineReader en línea de ABBYY fue un poco más precisa.

Cuando se trata de convertir documentos a DOC, no logramos encontrar ninguna solución que fuera perfecta, pero los mejores resultados provienen de OCR en línea . La conversión no fue perfecta, pero la integridad del formato se mantuvo en gran parte intacta y los errores fueron insignificantes. Cuando comparamos estos resultados con la oferta 'premium' de ABBYY, no puede evitar quedar enormemente impresionado.

No incluimos las capacidades de OCR de Google Drive en esta publicación; un poco por la omnipresencia de Google, pero más por el hecho de que queríamos probar algunos otros servicios gratuitos de OCR en línea que existen.

A usted le toca: ¿Qué otras herramientas de OCR en línea recomendaría a nuestros lectores? ¿Y cuál has probado que nunca volverías a usar?

Cuota Cuota Pío Correo electrónico Una guía para principiantes para animar el habla

Animar el habla puede ser un desafío. Si está listo para comenzar a agregar diálogos a su proyecto, analizaremos el proceso por usted.

mejores prácticas de la política de grupo de Windows 10
Leer siguiente Temas relacionados
  • Internet
  • Productividad
  • Conversión de archivos
  • LOC
Sobre el Autor Rob Nightingale(272 Artículos publicados)

Rob Nightingale es licenciado en Filosofía por la Universidad de York, Reino Unido. Ha trabajado como gestor y consultor de redes sociales durante más de cinco años, mientras impartía talleres en varios países. Durante los últimos dos años, Rob también ha sido un escritor de tecnología y es el administrador de redes sociales y editor de boletines de MakeUseOf. Por lo general, lo encontrará viajando por el mundo, aprendiendo a editar videos y experimentando con la fotografía.

Más de Rob Nightingale

Suscríbete a nuestro boletín

¡Únase a nuestro boletín de noticias para obtener consejos técnicos, reseñas, libros electrónicos gratuitos y ofertas exclusivas!

Haga clic aquí para suscribirse