Créer ses propres outils linguistiques

Vous aimeriez vous créer un correcteur orthographique ou une banque de terminologie à partir de données fiables? Le gouvernement du Canada met à votre disposition l’intégralité des données de TERMIUM Plus® afin que vous puissiez concevoir votre propre outil linguistique.

Instructions

Pour savoir comment télécharger les données, suivez les instructions suivantes :

  1. Visitez le Portail des données ouvertes du gouvernement du Canada.
  2. Dans le champ Recherche, tapez « Termium ». Cliquez Soumettre.
  3. Sélectionnez le jeu de données trouvé.
  4. À la page des données de TERMIUM Plus®, trouvez les domaines qui vous intéressent et cliquez sur le bouton Télécharger.
  5. La fenêtre « Voulez-vous ouvrir ou enregistrer ce fichier? » s’affichera. Cliquez sur Enregistrer.
  6. Une fois les dossiers compressés enregistrés dans l’ordinateur, il suffit de les ouvrir. Une liste de fichiers CSV s’affichera.
  7. Copiez les fichiers CSV désirés dans le répertoire de votre choix.
  8. Dans chaque fichier, vous devrez convertir les données pour être en mesure de les lire. Voici comment procéder.
    1. 8.1. Lancez un logiciel tableur (par exemple, Microsoft Excel, OpenOffice Calc,) et cliquez Ouvrir.
    2. 8.2. Choisissez le répertoire où vous avez copié les fichiers CSV. Si vous ne voyez aucun choix de fichiers, choisissez l’option « Tous les fichiers » à côté de la fenêtre « Nom du fichier ».
    3. 8.3. Ouvrez le fichier CSV désiré.
    4. 8.4. Dans la fenêtre Assistant, choisissez l’option Délimité et cliquez Suivant.
    5. 8.5. Dans la deuxième fenêtre, désélectionnez l’option Tabulation, cliquez sur l’option Virgule et cliquez sur Suivant.
    6. 8.6. Dans la troisième fenêtre, vérifiez que le format sélectionné soit Standard et cliquez sur Terminer.
  9. Vous verrez les données clairement réorganisées par colonne. Il ne reste plus qu’à jouer avec les colonnes pour tout voir l’ensemble des données de chacune.
  10. À partir de ces données, vous pourrez créer divers outils linguistiques, tels qu’un correcteur orthographique ou une banque de données terminologiques.

Liens connexes

Date de modification :