Anuncio
Si desea convertir cualquier texto impreso en texto digital que pueda copiar, pegar, editar y buscar, deberá usar escáneres de reconocimiento óptico de caracteres (OCR).
Cuando elige escanear o tomar una foto de un documento, se guardará en un formato como JPEG o PDF. Software de OCR puede reconocer las letras y números dentro de estos documentos y convertirlos en un PDF con capacidad de búsqueda 4 métodos para crear y editar archivos PDF gratisDe todos los tipos de archivos comunes que se encuentran en nuestro mundo informático, el PDF es probablemente uno de los más restrictivos, al mismo tiempo que está disponible para que todos lo usen (principalmente para leer) ... Lee mas , o en un archivo que puede editar en programas como Microsoft Word.
El problema es que algunos escáneres de OCR funcionan mucho mejor que otros, con lo mejor siendo bastante pesado en la billetera.
Omnipage18, por ejemplo, cuesta $ 150, pero es especialmente bueno para reconocer diferentes idiomas. Adobe Acrobat Pro DC
Cuesta unos lagos de $ 400 pero tiene una precisión increíble. ABBYY FineReader cuesta $ 150, pero es fantástico para convertir documentos como revistas y folletos en texto de búsqueda. Probaremos la oferta en línea de ABBYY más adelante en este artículo.Sin embargo, si buscas alternativas gratuitas que puedas descargar y usar en Windows u OS X, deberías pruebe estas herramientas de OCR Las 5 mejores herramientas de OCR para extraer texto de imágenesCuando tiene resmas de papel, ¿cómo puede convertir todo ese texto impreso en algo que un programa digital podrá reconocer e indexar? Mantenga un buen software de OCR cerca. Lee mas . Pero si prefieres usar gratis, en línea Herramienta de OCR, sigue leyendo, ya que probamos los primeros, con los resultados a continuación.
La prueba
Parece que la mayoría de la gente ahora usa su teléfonos inteligentes para escanear por ellos Escanee y administre sus recibos, ahorre espacio, papel y tiempoLos recibos en papel se pierden fácilmente y son difíciles de encontrar cuando más los necesita. Afortunadamente, la digitalización resuelve ambos problemas. Lee mas Decidí usar La aplicación escaneable de Evernote (Gratis en iOS y Android). Escaneé la primera página de Richard Dawkin Montañismo improbable, para ver qué resultados podríamos obtener con un formato muy básico. También escaneé una página de Tim Ferriss El chef de 4 horas probar los escáneres con un formato un poco más complicado. Guardé cada uno de estos archivos como PDF.
Luego, estos documentos se revisaron con algunas de las herramientas de OCR en línea supuestamente mejores para ver qué tan bien les fue.
OCR en línea gratis [ya no está disponible]
Afortunadamente, no es necesario registrarse para usar el OCR gratuito en línea. Y me impresionó doblemente cuando vi su reclamo de mantener el formato y el diseño de mi documento.
El sitio afirma que puede admitir PDF, GIF, BMP, JPEG, TIFF y PNG como entrada. Las salidas pueden ser DOC, un documento de texto PDF, RTF y TXT. Lamentablemente, no pude averiguar si tenían un límite de tamaño de archivo.
Documento Básico a PDF
Convertido absolutamente perfecto. ¡No hay mucho más que decir! Nos vamos a un muy buen comienzo.
Documento Básico a DOC
Las palabras reales parecen haberse convertido sin problemas, aparte de la "ount" del "Monte Rushmore" de alguna manera va AWOL. Sin embargo, el formato es una historia diferente. Muchas comas se reemplazaron con guiones bajos y se insertaron espacios aleatorios en los puntos de todo el documento. Sin embargo, cuando más tarde vea cómo le fue al software premium en esta prueba, no es un mal esfuerzo en absoluto.
Documento complejo a PDF
¡La conversión del documento tomó 120 segundos! Una vez completado, todo el texto se había convertido con aproximadamente un 95% de precisión, aunque el texto en el cuadro separado en la parte superior derecha de la página no se podía buscar. Algunos otros caracteres en todo el PDF también eran incorrectos.
Documento complejo a DOC
Esta vez, la conversión solo tomó 10 segundos, con el texto nuevamente convertido con alrededor del 95% de precisión. Hubo algunos problemas de espacio extraños, y el software tuvo problemas para convertir la fuente en la parte superior derecha del documento, y omitió algunos caracteres aquí y allá.
Veredicto
Si desea convertir documentos simplemente formateados a PDF, esta es una herramienta fantástica. En términos de conversión a DOC, los resultados no fueron nada del otro mundo.
i2OCR hace algunas afirmaciones impresionantes. La herramienta reconoce más de 60 idiomas, puede manejar diseños de varias columnas (al eliminar el formato), no tiene límites de tamaño de archivo, puede convertir archivos cargados y de las URL. Y tampoco necesita registrarse para usar esta herramienta.
El servicio funciona simplemente extrayendo el texto de su imagen y luego enviando texto sin formato. Puede corregir rápidamente cualquier error en la vista en paralelo, antes de copiar el texto a otros programas o descargarlo como DOC, PDF o HTML.
Nota: cuando intenté cargar mis documentos PDF, i2OCR los rechazó, por lo que necesitaba convertirlos a JPEG (tomando una captura de pantalla de ellos y luego cargando los archivos).
Documento básico a texto sin formato
Debido a la forma en que funciona esta herramienta, se pierde todo el formato, aunque la conversión de imagen a texto fue casi perfecta. Hubo algunos pequeños errores, como el espacio entre párrafos, y algunas comas fueron reemplazadas por puntos, pero estos son pequeños detalles.
Documento complejo a texto sin formato
La mayoría del texto se convirtió sin demasiados errores, aparte del título y la receta en la parte superior derecha, que era ilegible para esta herramienta. La forma en que las columnas se convirtieron en texto plano distaba mucho de ser ideal. Si desea hacer esta conversión viable, se necesitaría mucho tiempo para reorganizar las líneas en oraciones coherentes.
Veredicto
Para documentos básicos, i2OCR funciona muy bien. La capacidad de editar el texto antes de descargar también es un toque muy agradable. Sin embargo, para documentos más complejos, la conversión sigue siendo bastante precisa, pero la forma en que se genera el texto no le facilitará la vida.
El OCR en línea actualmente admite 46 idiomas diferentes y puede convertir PDF, JPG, BMP, TIFF y GIF en formato Word, Excel o Texto sin formato. El sitio afirma que "los documentos convertidos se ven exactamente como el original: tablas, columnas y gráficos".
La versión que puede usar sin registrarse le permite convertir hasta 15 imágenes por hora (límite de 5 MB). Si se registra para obtener una cuenta, puede comprar más páginas por encima de este límite, al tiempo que también puede convertir documentos de varias páginas y archivos ZIP.
Documento Básico a DOC
El documento básico convertido sin problemas aparte del número romano yo No ser recogido. Como prometió el sitio, el formato era exactamente como estaba en el libro. Felicitaciones a esta herramienta.
Documento complejo a DOC
Después de estar decepcionado por las herramientas de OCR anteriores al convertir el documento complejo, el OCR en línea me impresionó enormemente. El diseño era casi perfecto, como puedes ver arriba. Sin embargo, una vez más, la receta no se recogió demasiado bien, pero cualquier otro error menor fue insignificante.
Veredicto
Resultados absolutamente fantásticos de OCR en línea. El único inconveniente que veo es que no hay forma de descargar los documentos convertidos como PDF, ya que los formatos de salida mencionados incluyen DOCX, XLSX y TXT solamente.
Como se mencionó anteriormente, ABBYY es uno de los líderes del mercado en software OCR, con un costo de alrededor de $ 150 para su programa completo y descargable. Ellos ofrecen un Prueba gratuita de 10 páginas para su herramienta en línea, sin embargo (se requiere registro). Por una suscripción de $ 5, su herramienta en línea le permitirá convertir 200 páginas cada mes.
Los archivos aceptados pueden tener hasta 100mb, en cualquiera de estos formatos: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP y PNG. ABBYY también reconoce casi 200 idiomas. Las salidas son especialmente impresionantes, con una opción entre DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 y EPUB.
Incluso puede probar un par de funciones BETA durante su prueba. La primera es la opción de traducir su documento a otro idioma. El otro es exportar su documento convertido a su cuenta de almacenamiento en la nube, ya sea Dropbox, Google Drive, Evernote, Microsoft OneDrive o Box.
Documento Básico a DOCX
Los resultados generales fueron buenos, pero no sorprendentes teniendo en cuenta que este es un producto premium. Se intercambiaron varias comas y puntos, varias comillas invertidas se reemplazaron con un asterisco, faltaban un par de letras mayúsculas y una palabra (literalista) se deletreaba incorrectamente.
Documento complejo a DOCX
Una vez convertido, hubo muy pocos fallos en el texto dentro del documento (¡aparte del OCR que luchó con la fuente de esa receta nuevamente!), Pero el formato dejó mucho que desear.
Las tres columnas ocuparon de alguna manera dos páginas, con la columna central. solamente apareciendo en la segunda página. Si realmente quisieras hacer cualquier cosa con este documento convertido, terminarías arrancándote el pelo.
Documento Básico a PDF
Mientras revisaba el PDF convertido, no pude encontrar ninguna falla en absoluto. Tal vez hemos encontrado donde ABBYY sobresale. Fantásticos resultados.
Documento complejo a PDF
Nuevamente, no pude encontrar ningún error en este archivo convertido. ABBYY obviamente sabe cómo convertir a PDF excepcionalmente bien.
Veredicto
Si está satisfecho pagando unos pocos dólares, la conversión a PDF parece funcionar fenomenalmente bien con este servicio, y ser poder sincronizar archivos convertidos a su almacenamiento en la nube es especialmente útil si está escaneando un gran volumen de documentos. Sin embargo, al igual que con las otras opciones, ABBYY todavía no ha descubierto cómo convertir sin problemas documentos a DOC para una fácil edición.
El resultado final
Si, como la mayoría de las personas, solo está buscando escanear algunos artículos de revistas y algunas facturas domésticas, no necesitará editar estos documentos. Por lo tanto, la conversión directa a PDF será adecuada para usted, ya que aún podrá buscar esos documentos. Para esto, Free Online OCR fue definitivamente la mejor herramienta gratuita que probamos. Dicho esto, si está dispuesto a pagar $ 5 por mes por casi la perfección, FineReader en línea de ABBYY fue un poco más preciso.
Cuando se trata de convertir documentos a DOC, no logramos encontrar ninguna solución que fuera perfecta, pero de lejos los mejores resultados provienen de OCR en línea. La conversión no fue perfecta, pero la integridad del formato se mantuvo en gran parte intacta y los errores fueron insignificantes. Cuando comparamos estos resultados con la oferta "premium" de ABBYY, no puede evitar quedar impresionado.
No incluimos Capacidades de OCR de Google Drive en este post; un poco para la presencia de Google en todas partes, pero más por el hecho de que queríamos probar algunos otros servicios gratuitos de OCR en línea.
A usted: ¿Qué otras herramientas de OCR en línea recomendaría a nuestros lectores? ¿Y qué has probado que nunca volverías a usar?
Rob Nightingale es licenciado en Filosofía por la Universidad de York, Reino Unido. Ha trabajado como gerente y consultor de redes sociales durante más de cinco años, mientras daba talleres en varios países. Durante los últimos dos años, Rob también ha sido escritor de tecnología, y es el Gerente de Redes Sociales y Editor de Boletines de MakeUseOf. Por lo general, lo encontrarás viajando por...