Anuncio publicitario

이 웹사이트에 환영. 이것은 보기 원본이다

¿Qué lenguaje es este? ¿Chino? ¿Japonés?

De hecho, es coreano. Detectar esto manualmente me habría llevado mucho tiempo. Afortunadamente, encontré algunas herramientas muy precisas que pueden hacer esto automáticamente. Todos se enumeran a continuación.

El experimento: Probé los sitios web usando texto de muestra (1-2 oraciones con 8 palabras) de los siguientes idiomas: portugués, ruso, coreano, vietnamita, italiano, Turco, polaco, ucraniano, azerbaiyano, esloveno, macedonio, holandés, filipino (tagalo), griego, gallego, checo, bielorruso, finlandés, tártaro y Noruego.

En general, probé 20 idiomas diferentes.

3 herramientas para detectar texto en idioma desconocido

1. LangId (pasó 18 de las 20 pruebas, no pasó el tártaro ni el bielorruso)

lang-id

Pros: En general, es una gran herramienta en línea. Ofrece una funcionalidad básica de detección de texto y también tienen Gorjeo y bots de detección de correo electrónico para obtener resultados aún más rápidos.

instagram viewer

Contras: Su motor se basa en la API de Google, pero parecen tener mejores resultados que el detector de Google que se describe a continuación. Parece que saben cómo utilizar las cosas muy bien. No me gustó que no tuvieran su propio algoritmo único para detectar idiomas.

2. Detector de idioma de Google [ya no está disponible] (pasó 17 de 20 pruebas, no pasó portugués, Taglog ni bielorruso)

Qué lenguaje es este

Pros: Google tiene una de las mejores API del mundo para la detección de idiomas. Lo bueno es que puede ver la probabilidad de que el resultado que muestran sea cierto. Fueron capaces de pasar la mayoría de las pruebas de muestra.

Contras: Me sorprendió bastante que no pasaran el examen de portugués. Parece que tienen un error (espero que sea temporal) con este idioma. También seguramente pueden hacer un mejor trabajo para mejorar el diseño de la página.

3. Qué lenguaje es este (Aprobó 11 de las 20 pruebas, no aprobó el ruso, el coreano, el ucraniano, el azerbaiyano, el macedonio, el tagalo, el griego, el gallego ni el tártaro)

Qué lenguaje es este

Pros: Algunos idiomas como los eslavos del sur (serbio, croata, esloveno) son bastante similares. En caso de que ingrese algún texto en croata, digamos, este sitio web le dirá que el texto también podría ser serbio o esloveno.

Contras: Necesitan trabajar para hacer que su sistema de detección sea más sofisticado. Estaba pensando en poner Translated.net (otro sitio web para la detección de idiomas) en lugar de este, pero Translated prometió la detección de más idiomas y en realidad lo hizo peor que WhatLanguageIsThis.com.

2 herramientas para detectar sitios web en idiomas desconocidos

4. Traductor de google con Detectar idioma como primera opción

Aprobado: 18 de 20, no pasó de Bielorrusia y Tártaro.

Pros: Esta herramienta hace muy bien su trabajo. Lo que me gusta de Traductor de google Google Translate 2.1 aparece con el teclado nativo iOS 7 y más compatibilidad con idiomasActualice a Google Translate 2.1 en su dispositivo iOS y lleve consigo la compatibilidad con la traducción y la entrada de escritura a mano para nuevos idiomas. Google Translate finalmente obtiene un nuevo teclado iOS 7 para hacer todo el ... Lee mas es que si no es compatible con un idioma específico te da la siguiente pantalla:

Identificar idiomas desconocidos

¡Es un gran detector de idiomas si me preguntas!

5. Traductor de Microsoft Bing con Detección automática como primera opción.

traductor Bing

Aprobado: 8 de 20, no aprobaron holandés, vietnamita, turco, ucraniano, azerbaiyano, esloveno, macedonio, tagalo, griego, gallego, checo y bielorruso

Pros: Admite un número limitado de idiomas. Para esos idiomas, hace bien su trabajo.

Contras: Estoy muy decepcionado con Microsoft. Tienen un número muy limitado de idiomas para la detección y traducción Olvídese del Traductor de Google: tres formas de obtener una traducción rápida y precisaYa sea que esté planeando postularse para un trabajo o un apartamento en el extranjero, o esté buscando traducir su página web, necesita hacer las cosas bien incluso con un idioma extranjero. Lee mas y su función de detección automática es terrible. En caso de que ingrese un idioma que no admite, obtendrá un resultado incorrecto en lugar de decirle que no admite ese idioma.

Pensamientos

En general, mi opinión es que las herramientas anteriores van en una buena dirección. Actualmente son los mejores para detectar idiomas en línea y hacen su trabajo bastante bien cuando se trata de idiomas populares. Sin embargo, deben trabajar para agregar idiomas más oscuros (ninguna de las herramientas pudo reconocer el tártaro) y estoy seguro de que todos ellos, especialmente Google, irán en esa dirección en un futuro próximo.

Credito de imagen: Kanko *

Mi nombre es Darko (apodo Darren). Me gusta la Web 2.0, creando sitios web especializados (mi último proyecto es la búsqueda de personas) y así sucesivamente... qué más puedo decir de mí en un perfil tan corto, sígueme en Twitter si quieres saber más :)