PangeaMT Masker

DÉTECTEUR DE LANGUES

Détectez automatiquement la langue d’un passage, d’un texte, d’un document en quelques secondes

Vous avez besoin d’identifier la langue et l’encodage des caractères de vos documents ?

Parlez à un expert

 

Notre détecteur de langue peut être utilisé pour :

previo

Le traitement du texte avant la traduction automatique

entrenar-algoritmo

Le renforcement du texte et l’amélioration de la qualité des données reçues lors de l’entraînement des algorithmes

procesos

L’organisation des données (synthèse vocale, documents, etc.) avant d’autres étapes

extraer-textos

L’extraction de textes bilingues de ressources en ligne pour la traduction automatique

correos

La recherche, la collecte et la compréhension d’informations pertinentes (textes générés par les utilisateurs, courriels, etc.) dans un environnement multilingue

Le détecteur de langue de Pangeanic détermine avec précision non seulement la langue du document, mais aussi celle de chaque extrait, paragraphe ou fragment

Notre détecteur de langue combine des technologies statistiques et neuronales afin d’obtenir les meilleurs résultats de reconnaissance. Notre algorithme est basé sur un modèle mathématique d’algorithme vectoriel robuste.

detector-idiomas

Nous créons un espace multidimensionnel avec des vecteurs qui analysent le contenu des documents et utilisons la notion de n-grammes pour calculer les fréquences. L’algorithme analyse les positions des vecteurs nécessaires dans l’espace afin de déterminer leur similarité.

Enfin, les résultats combinés de l’algorithme sont corrigés à l’aide de règles linguistiques spéciales mises au point par notre équipe de linguistes experts.

À des fins d’évaluation, nous avons créé une page de démonstration capable de détecter les langues les plus populaires atteignant une précision d’identification de 95 à 99 (résultats moyens des concurrents. La vitesse moyenne de traitement est de plus de 8000 Ko/s.

Vous souhaitez en savoir plus sur notre détecteur de langues ?

Parlez à un expert

il_encriptada