Anuncio
Buscando la mejor gratis Software de Windows para el discurso a texto? El mas repetido pagado recomendación es Dragón Hablando Naturalmente (DNS) Pero algunos podrían burlarse de pagar dinero por el software. Afortunadamente, existen varios programas gratuitos excelentes como Google Docs Voice Typing (GDVT) y Windows Speech Recognition (WSR).
Dragon NaturallySpeaking Basics 13 (descontinuado)Dragon NaturallySpeaking Basics 13 (descontinuado) Compre ahora en Amazon $79.73
Quizás se pregunte cómo se comparan estos dos productos con el DNS, y si DNS satisface o no sus necesidades. Para este artículo, he identificado tres tipos de usuarios: aquellos que necesitan transcripción de voz a texto para escribir novelasaquellos que necesitan transcripción académicay los que escriben documentos empresarialescomo memos Con este fin, probé tres programas de transcripción de voz (DNS, GDVT y WSR).
Configuración de transcripción de voz
Antes de comenzar la prueba, veamos primero la configuración recomendada de hardware y software.
Requisitos de hardware y software
Escritura de voz de Google Docs requiere el navegador Chrome y un micrófono. Y también necesita una conexión a Internet persistente (que no se menciona en los requisitos). De lo contrario, este es probablemente el método más fácil para comenzar con la transcripción del habla.
DNS requiere un procesador hecho en 2001 o posterior, Windows 7 o posterior, y alrededor de 4 GB de almacenamiento gratuito. Su requisito más estricto es 2 GB de RAM. Aquí hay una lista completa de Requisitos de hardware de DNS.
Reconocimiento de voz de Windows Habilite el control de voz a texto y voz configurando el reconocimiento de voz en WindowsEl reconocimiento de voz sigue siendo más poderoso que Cortana. Impulsa el control de voz a texto y voz. Este artículo le mostrará lo que puede hacer el reconocimiento de voz, cómo configurarlo, entrenarlo y usarlo. Lee mas , también conocido como Speech Platform Runtime (descargar WSR), no cuesta nada y solo requiere un sistema operativo Windows 7 o posterior.
Consideraciones de micrófonos
Yo uso un micrófono dinámico (mejor micrófono para podcasting El mejor micrófono para podcasting¿Comenzando un nuevo podcast? ¡Necesitarás un buen micrófono! Aquí están sus opciones para el mejor micrófono para podcasting. Lee mas ) y un procesador Intel Core i7 relativamente rápido. Si bien se desea un micrófono de alta calidad, no es necesario. Aun así, sus resultados mejorarán con una mejor calidad de sonido y un ruido de fondo reducido.
El micrófono con el precio más bajo que recomendaría para la grabación de alta calidad es el Audio-Technica ATR-2100. Sin embargo, la diferencia de precisión entre un micrófono de $ 5 y un dispositivo de $ 200 es bastante mínima.
Audio-Technica ATR2100-USB Cardioide Dinámico USB / XLR MicrófonoAudio-Technica ATR2100-USB Cardioide Dinámico USB / XLR Micrófono Compre ahora en Amazon
Por otro lado, los requisitos mínimos para Microsoft Speech son prácticamente cualquier computadora remotamente moderna (la mayoría de las computadoras fabricadas en los últimos diez años) y un micrófono. Si posee una computadora portátil o tableta fabricada en los últimos cinco años, debería tener lo que necesita de manera predeterminada.
Configurar programas de transcripción de voz
A continuación, se explica cómo usar la escritura por voz de Google:
Aquí le mostramos cómo comenzar con el reconocimiento de voz de Windows:
Y, finalmente, así es cómo comenzar con Dragon Naturally Speaking:
Metodología de prueba
Quiero encontrar lo mejor gratis Aplicación de voz a texto basada en Windows. Debido a que diferentes consumidores pueden necesitar un producto diferente, he ideado una prueba simple. Leí tres pasajes diferentes de textos sin derechos de autor: uno de Charles Darwin Sobre la tendencia de las especies a formar variedades. Uno de H.P. Lovecraft Llamada de Cthulu. El último es el discurso del Estado de la Unión de Jerry Brown en 2017. Mi metodología de ninguna manera es perfecta, pero da una impresión de las precisiones de cada suite de reconocimiento de voz.
Muestra de escritura de ficción (de H.P. Lovecraft’s Llamada de Cthulu)
“Creo que la cosa más misericordiosa del mundo es la incapacidad de la mente humana para correlacionar todos sus contenidos. Vivimos en una plácida isla de ignorancia en medio de los mares negros del infinito, y no significa que debamos viajar lejos. Las ciencias, cada una esforzándose en su propia dirección, hasta ahora nos han perjudicado poco; pero algún día la unión del conocimiento disociado abrirá vistas tan aterradoras de la realidad y de nuestro espantoso posición allí, que nos volveremos locos por la revelación o huiremos de la luz mortal hacia la paz y la seguridad de un nuevo edad Oscura."
Muestra de redacción comercial (discurso de Jerry Brown sobre el estado de la Unión de 2017)
“En una ocasión como esta, es habitual establecer una agenda específica para el año próximo. Seis veces antes desde esta tribuna, lo he hecho, y con cierto detalle. Y, al releer esas propuestas expuestas en discursos anteriores del Estado del Estado, me sorprendió ver cuánto hemos logrado juntos ”.
Muestra de escritura académica (Charles Darwin's Sobre la tendencia de las especies a formar variedades)
"Ahora, cuando ocurre una variedad de tal animal, que tiene un mayor poder o capacidad en cualquier órgano o sentido, tal el aumento es totalmente inútil, nunca se pone en acción e incluso puede existir sin que el animal se dé cuenta de eso. En el animal salvaje, por el contrario, todas sus facultades y poderes se ponen en acción para las necesidades de la existencia, cualquier aumento se vuelve disponible de inmediato, se fortalece con el ejercicio e incluso debe modificar ligeramente la comida, los hábitos y la economía en su conjunto raza."
3 suites de transcripción de voz probadas
Es sorprendente cómo reconocimiento de voz gratis Las mejores aplicaciones de creación de listas para comandos de vozMuchas herramientas de productividad gratuitas admiten voz a texto para listas. Le mostraremos las mejores aplicaciones para crear listas con reconocimiento de voz y comandos que debe probar. Lee mas pruebas realizadas contra software pago. Pero al final del día, la aplicación más precisa es Dragon Naturally Speaking. Sin embargo, tanto Google Voice Typing como Windows Speech Recognition no cuestan nada y ofrecen una precisión superior al 90 por ciento. Pero cada uno tiene sus propias fortalezas y debilidades y es posible que prefiera uno sobre el otro.
H.P. Lovecraft (Prueba de escritura de ficción)
A Lovecraft le encantaba escribir en prosa larga, ininterrumpida y entre paréntesis. Si bien las tres suites hacen un gran trabajo al transcribir con precisión el texto vocalizado de Lovecraft, DNS sale por delante de sus competidores. Incluye tanto la capitalización como la puntuación (que es completamente una locura).
DNS: DNS solo dejó caer una sola palabra del texto. En general, obtuvo 107 respuestas correctas de 108 palabras. Clavó varias oraciones largas y sin parar también.
WSR: Windows hizo un muy buen trabajo, pero no sorprendente, al transcribir Lovecraft. Obtuvo alrededor de 97 de alrededor de 108 palabras correctas. Si bien eso no alcanza tanto a GDVT como a DNS, todavía es bueno para un programa de voz a texto gratuito que no requiere acceso en línea.
GDVT: No estoy seguro de lo que sucedió porque Google clavó la transcripción de los otros extractos. GDVT solo logró 103 de 108, dejando caer dos palabras y transcribiendo erróneamente tres. Incluso una vez deletreó "punto y coma" en lugar de insertar la puntuación correcta. También puso en mayúscula ciertas palabras, convirtiéndolas en sustantivos propios (pero no las penalizaré ya que lo que importa es la precisión y no las mayúsculas).
Estoy bastante seguro de que si vuelvo a leer el documento por segunda vez, no tendría ningún error.
Charles Darwin (Prueba de escritura científica o académica)
Darwin escribe, como Lovecraft, largas oraciones cargadas de información entre paréntesis. Sin embargo, su uso del lenguaje es muy claro y casi no usa jerga, que difiere de la escritura científica casi incomprensible de hoy.
DNS: El texto de Darwin sale casi perfecto en Dragon Naturally Speaking. DNS escribió mal una sola palabra ("en") y, de lo contrario, clavó completamente la prueba con 87 palabras de 88.
WSR: Microsoft hizo un gran trabajo, combinando 82 de 88 palabras. Sin embargo, cometió algunos errores relativamente extraños, como deletrear "sentido" como "centavos".
GDVT: A Google le fue genial en el extracto de Darwin. GDVT solo ensució dos palabras, de 88. En general, para una aplicación gratuita, no puede encontrar una alternativa más precisa.
Jerry Brown Estado del Estado Dirección 2016 (Prueba de escritura comercial)
El discurso de Brown no usa muchas oraciones complicadas o vocabulario (aparte de la palabra "tribuna"). En general, la mayoría de los servicios de transcripción tuvieron un desempeño sorprendente. Más o menos, si necesita un servicio que maneje oraciones simples y vocabulario limitado, cualquiera de estos funciona muy bien.
DNS: DNS clavó a Brown Estado del Estado Dirección. Si bien se redujo un punto, de lo contrario, obtuvo cada palabra perfectamente. Sin embargo, tenga en cuenta que los discursos políticos a menudo carecen del tipo de lenguaje complejo que puede ver en la ficción o en la academia. Una nota o discurso es directo y al grano. Eso es algo que un cliente de reconocimiento de voz no debería tener problemas para manejar.
WSR: Windows Speech Recognition hizo un gran trabajo, aunque no tan bueno como DNS o Google, al transcribir el discurso de Brown. Obtuvo 55 de 58 palabras. Incluso reconoció la palabra "tribuna", que ni siquiera sabía que era una palabra, ni sabía cómo pronunciarla. Aparentemente, o entendí bien o la tecnología de reconocimiento de voz puede incluso captar pronunciaciones erróneas.
GDVT: El software de transcripción de Google clavó absolutamente la transcripción, con una precisión del 100 por ciento. Incluso logró capitalizar correctamente el "Estado del Estado", sin necesidad de la intervención del usuario. Curiosamente usó el número, en lugar de la ortografía, para la palabra "seis". Lo que resultó en un error estilístico.
¿Vale la pena usar los servicios de transcripción gratuitos?
Hay una diferencia entre Dragon Naturally Speaking, Google Voice Typing y el Reconocimiento de voz de Windows de Microsoft. Dragon es más preciso que sus competidores. Sin embargo, el mejor programa gratuito en términos de precisión es, por un margen estrecho, la escritura por voz de Google. Si bien los servicios de transcripción de Microsoft y Google se comparan de manera desfavorable con el DNS, no cuestan $ 30.
Al contrastar los dos servicios gratuitos entre sí, Google ofrece una mejor precisión de reconocimiento de voz, puntuación y, por lo que requiere una conexión a Internet. Google también captura muchas cosas que no tiene intención, como la puntuación y las mayúsculas.
Sin embargo, si desea un programa de transcripción gratuito que no necesita una conexión a Internet para usar, Reconocimiento de voz de Windows cumple con los requisitos. De ninguna manera es malo y ofrece el 90 por ciento de lo que ofrece Dragon Naturally Speaking. Pruébalo si aún no lo has hecho.
Para más información, eche un vistazo a maneras de hacer que su computadora le lea documentos 5 maneras de hacer que su computadora le lea documentos¿Puedes hacer que tu computadora te lea en voz alta? ¡Por supuesto! Pruebe estos métodos y herramientas de texto a voz en su PC. Lee mas . Y para obtener ayuda con su teléfono Android, consulte las mejores aplicaciones de Android de voz a texto 7 mejores aplicaciones de dictado de Android para voz a texto fácil¿Estás buscando las mejores aplicaciones de voz a texto para Android? Estas aplicaciones de dictado de Android te permiten tomar notas y más. Lee mas .
¿Cuál es tu servicio de transcripción favorito? ¡Por favor, háganos saber en los comentarios!
Kannon es un periodista técnico (BA) con experiencia en asuntos internacionales (MA) con énfasis en el desarrollo económico y el comercio internacional. Sus pasiones son los dispositivos de origen chino, las tecnologías de la información (como RSS) y los consejos y trucos de productividad.