Gérer les entités NLU

Dans le moteur NLU de Hexabot, les entités jouent un rôle crucial pour extraire des informations significatives des saisies des utilisateurs. Les entités peuvent être classées en trois types : Entités de trait, Entités mot-clé et Entités de motif. Ces types d'entités offrent flexibilité et profondeur dans la compréhension des saisies utilisateur, permettant à Hexabot de traiter à la fois les intentions générales et les détails granulaires.

Entités de trait

Les entités de trait sont déduites en analysant la phrase entière ou le contexte global de la saisie. Ces entités représentent des attributs ou des caractéristiques de haut niveau de la saisie et ne sont pas liées à des mots ou expressions spécifiques. Voici quelques exemples :

Entité
Description
Texte
Valeur

Intention

Le but de la saisie de l'utilisateur.

"Bonjour"

salutation

Intention

Le but de la saisie de l'utilisateur.

"Je veux réserver un vol"

reserver_vol

Sentiment

Le ton émotionnel derrière la saisie.

"Je suis vraiment frustré par mon forfait actuel."

négatif

Urgence

Un attribut qui détermine la priorité de la saisie.

"J'ai besoin d'aide tout de suite !"

élevée

Les entités de trait permettent à Hexabot de saisir le contexte global de la saisie, fournissant une compréhension plus approfondie qui informe les réponses et actions appropriées.

Entités mot-clé

Les entités mot-clé sont des mots ou expressions spécifiques extraits de la saisie pour identifier des attributs importants et convertir des données non structurées en informations structurées. Ces entités sont liées à des motifs identifiables ou à des termes spécifiques dans la saisie utilisateur. Voici quelques exemples :

Entité
Description
Texte
Valeur

Lieu

Identification des lieux à partir de la saisie.

"Je veux réserver un vol pour Paris."

Paris

Produit

Reconnaissance des noms ou types de produits.

"Je suis intéressé par l'achat du iPhone 15."

iPhone 15

Sujet

Détection de mots-clés spécifiques qui activent certains flux de travail ou réponses.

"Montre-moi les dernières offres."

offres

Entités de motif

Les entités de motif utilisent des expressions régulières (regex) pour extraire des informations structurées des saisies utilisateur grâce à une correspondance de motifs flexible. Contrairement aux entités mot-clé qui nécessitent des correspondances exactes, les entités de motif peuvent capturer des variations de format et de structure, ce qui les rend idéales pour extraire des numéros de téléphone, adresses e-mail, dates ou tout texte suivant un schéma prévisible.

Les entités de motif prennent en charge plusieurs options de prétraitement pour gérer les variations courantes du texte :

  • Correspondance sur les limites de mot: Assure que les motifs correspondent à des mots complets plutôt qu'à des sous-chaînes partielles

  • Suppression des espaces: Supprime les espaces blancs du texte correspondant pour une extraction plus propre

  • Normalisation de la casse: Convertit le texte correspondant en minuscules pour un traitement cohérent

  • Suppression des diacritiques: Retire les accents et caractères spéciaux pour une correspondance indépendante de la langue

Exemples d'entités de motif :

  • Numéros de téléphone: (\+?\d{1,3}[-.\s]?)?\(?(\d{3})\)?[-.\s]?(\d{3})[-.\s]?(\d{4}) - Capture divers formats de numéros de téléphone comme +1-555-123-4567, (555) 123-4567, ou 555.123.4567

  • Adresses e-mail: [a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,} - Correspond aux formats d'e-mail standard

  • Dates: \b\d{1,2}[/-]\d{1,2}[/-]\d{2,4}\b - Capture les dates au format MM/JJ/AAAA ou JJ-MM-AAAA

Gérer les entités NLU

Hexabot fournit une interface intuitive pour gérer efficacement les entités NLU, vous permettant de créer, mettre à jour et administrer à la fois les entités de trait et les entités mot-clé. Suivez ces étapes pour gérer les entités NLU :

  1. Accéder à la section NLU

  • Ouvrez le menu principal et sélectionnez l'option « NLU ».

  • Cliquez sur l'onglet « Entités NLU ».

  1. Afficher la liste des entités

  • Une grille de données affichera toutes les entités existantes, incluant à la fois les entités de trait et les entités mot-clé.

  • Utilisez la barre de recherche pour trouver des entités spécifiques, ou naviguez dans la liste à l'aide de la pagination.

  1. Ajouter de nouvelles entités

  • Cliquez sur le "+ Ajouter" bouton pour créer une nouvelle entité.

  • Choisissez le type d'entité en sélectionnant la Stratégie de recherche: Trait ou Mot-clé.

  • Remplissez les champs requis :

    • Nom: L'identifiant unique de l'entité.

    • Description: Une brève explication de l'objectif de l'entité.

    • Cliquez Enregistrer pour ajouter l'entité à la liste.

  1. Mettre à jour ou supprimer des entités

  • Localisez l'entité que vous souhaitez modifier.

  • Cliquez sur l'icône Modifier pour mettre à jour ses détails, ou sur l'icône Supprimer pour retirer l'entité définitivement.

  1. Administrer les valeurs d'entité

  • Pour chaque entité, vous pouvez gérer ses valeurs possibles en cliquant sur l'icône «Valeurs».

Gérer les valeurs d'entités

Une fois que vous cliquez sur l'icône «Valeurs» , une nouvelle grille de données affichera les valeurs possibles associées à l'entité sélectionnée.

  1. Directives pour les valeurs :

  • Utilisez du texte en minuscules et séparez les mots par des underscores (par exemple, high_priority, low_stock).

  • Assurez-vous que les valeurs sont descriptives et concises.

  1. Mettre à jour ou supprimer des valeurs :

  • Cliquez sur l'icône Modifier pour mettre à jour une valeur existante ou ses synonymes.

  • Utilisez l'icône Supprimer pour retirer une valeur définitivement.

Ce système de gestion flexible assure que le NLU de Hexabot reste robuste, adaptable et capable de gérer un large éventail de scénarios conversationnels.

Importation en masse d'entités et de valeurs NLU

Hexabot propose une fonctionnalité d'importation en masse qui vous permet d'importer des données d'entraînement NLU depuis des fichiers CSV, créant automatiquement des entités et des valeurs si nécessaire. Cette fonctionnalité simplifie le processus de peuplement de votre système NLU avec de grands ensembles de données.

Pour accéder à la fonctionnalité d'importation en masse, accédez à la vue de gestion NLU :

  1. Ouvrez le menu latéral principal et sélectionnez la page « NLU ».

  2. Allez à l'onglet « Échantillons NLP ».

  3. Cherchez le bouton « Importer » dans la zone des boutons d'action.

Format de fichier CSV

Le fichier CSV doit suivre un format spécifique avec les colonnes suivantes :

  • texte (obligatoire) : Le texte d'entraînement ou l'exemple de saisie utilisateur

  • intention (obligatoire) : L'intention principale ou le nom de l'entité

  • langue (obligatoire) : Le code de langue (par ex., "en", "fr", "es")

Des colonnes supplémentaires peuvent être ajoutées pour d'autres entités, où l'en-tête de colonne devient le nom de l'entité et les valeurs des cellules deviennent les valeurs d'entité.

Exemple de format CSV

texte,intention,langue,destination,heure
"Bonjour, je veux réserver un vol demain pour Paris.",reserver_vol,en,Paris,demain
"J'ai besoin d'un taxi pour le centre-ville maintenant",reserver_taxi,en,centre-ville,maintenant,

Comment fonctionne le processus d'importation

  1. Création d'entités NLU : Si une entité mentionnée dans le CSV n'existe pas, Hexabot la crée automatiquement avec la stratégie de recherche « trait ».

  2. Création de valeurs NLU : Pour chaque valeur unique dans une colonne d'entité, Hexabot crée la valeur d'entité correspondante si elle n'existe pas déjà.

  3. Création d'exemples NLU : Chaque ligne devient un nouvel exemple NLU. Si un exemple NLU avec un texte identique existe déjà, il sera ignoré pour éviter les doublons.

Jeu d'exemples

Pour une configuration et des tests rapides, vous pouvez utiliser notre jeu de données small talk publié disponible sur HuggingFace. Ce jeu de données contient des intentions de small talk de base en français et en anglais, fournissant un point de départ prêt à l'emploi pour les capacités conversationnelles de votre chatbot.

Ensemble de données : Hexastack/hexabot-smalltalk

Le jeu de données inclut des intentions conversationnelles courantes telles que salutations, adieux, expressions de gratitude et demandes générales. Vous pouvez télécharger les fichiers CSV directement depuis HuggingFace et les importer en utilisant la fonctionnalité d'importation en masse décrite ci-dessus.

Mis à jour

Ce contenu vous a-t-il été utile ?