Contenus additionnels

X5GON

Copied with permission from the author

La recherche de ressources pédagogiques est une activité importante pour les enseignants : lorsqu’ils préparent un nouveau cours, explorent un nouveau domaine ou sujet, ou préparent une activité quelconque. Ce matériel (didacticiel) peut être juste pour la documentation, mais parfois l’enseignant peut vouloir construire un nouveau didacticiel à partir de ce matériel ; Et il est tentant et intellectuellement légitime de ne pas réinventer la roue et d’utiliser une forme intelligente de copier-coller. Bien sûr, ce n’est généralement pas légal dans la plupart des pays, car cela enfreint les lois sur le droit d’auteur.

Lorsque les auteurs des ressources accordent une licence à leur travail avec Licences Creative Commons, les ressources deviennent des Ressources éducatives ouvertes et l’enseignant peut les réutiliser, les transformer, les remixer et les redistribuer librement. La seule obligation, généralement, est de citer correctement l’auteur original. Il est donc important d’identifier quand une ressource est ouverte ou non.

Il existe quelques collections de ressources éducatives ouvertes sous licence et votre ministère en possède probablement une. Mais qu’en est-il de la recherche de ces ressources n’importe où sur le web ? Peut-on utiliser un moteur de recherche spécifique pour cela ?

Le projet X5-GON a été financé par l’Union européenne pour trouver et indexer les REL, utiliser l’intelligence artificielle pour gérer ces REL et proposer des outils d’IA, typiquement des outils de recherche, permettant aux utilisateurs de mieux trouver les REL.

Quand l’IA apparaît-elle dans un tel processus ?

Elle apparaîtra à toutes les étapes :

Pendant l’étape d’ingestion, les robots vont gratter le web et retourner les REL : c’est un processus complexe car il s’agit de reconnaître les REL et donc les licences. Une partie de ce processus peut être considérée comme une tâche typique de classification (une tâche courante de l’IA).

Lorsque le robot a trouvé une ressource, il faut récupérer le texte de cette ressource.

Lorsque la ressource est un fichier audio ou vidéo, cela signifie utiliser la transcription (plus d’informations à ce sujet au chapitre 7).

Le 5 dans X5-GON fait référence aux 5 barrières ou dimensions que le projet souhaitait aborder : l’une d’entre elles étant la langue. L’étape suivante du processus consiste donc à utiliser des outils de traduction automatique pour obtenir des versions de texte dans chacune des langues choisies. Là encore, un outil d’IA typique.

À ce stade, vous vous demandez peut-être : la transcription et la traduction automatiques sont des technologies en plein essor. Mais elles commettent encore de graves erreurs. N’est-il pas dangereux de s’y fier ? La réponse est que les algorithmes de recherche et de recommandation n’ont pas besoin du texte exact. Ils ont besoin de positionner le document dans un espace ; à côté de mots-clés, d’autres documents.

Pensez au moment où vous avez une boîte pleine de vieux papiers que vous devez organiser. Idéalement, vous voudriez avoir une organisation prédéfinie et classer chaque papier au bon endroit. Mais nous n’avons généralement pas ce système de classement préexistant et nous finissons par mettre les papiers les uns à côté des autres lorsqu’ils ont des points communs, avec des règles non écrites de toutes sortes : ces deux papiers vont ensemble parce qu’ils sont de la même année, ces deux-là parce qu’ils sont liés aux voitures, ces deux-là parce qu’ils ont la même taille, et ainsi de suite… Le terme clé ici est “à côté de’ : nous en parlerons plus tard dans le livre.

Une fois que les textes bruts ont été extraits, des modèles peuvent être construits.Les documents deviendront des vecteurs dans un certain espace à haute dimension et la comparaison des vecteurs nous permettra de répondre aux questions : quels sont les 10 documents les plus similaires à celui-ci ? Quels sont les 5 documents qui correspondent le mieux à ce mot-clé ?

Des modèles plus riches peuvent être obtenus par apprentissage. Ils peuvent répondre à des questions plus complexes :

  • Quelle est la difficulté de ce cours ? La réponse se trouve peut-être quelque part dans la description du cours, ou dans les méta-données, ces données cachées à l’observateur mais qui sont censées donner des informations sur un document. Plus vraisemblablement, elles peuvent être obtenues en analysant automatiquement le document : la longueur des phrases et des mots, les mots eux-mêmes sont des indicateurs forts de l’âge auquel un cours a été destiné
  • Dois-je regarder ce cours avant cet autre ? C’est le préquel pour pouvoir faire construire automatiquement un cours complet à partir d’un didacticiel donné.
  • Quelle est la qualité du cours ? C’est pour l’IA la question la plus difficile. C’est aussi peut-être une mauvaise question où l’IA peut faire plus de mal que de bien. Néanmoins, être capable de savoir si les faits dans un cours sont corrects a beaucoup de sens. Après les fake news, aurons-nous de faux cours ?

Quelques liens

X5-Discover (https://discovery.x5gon.org/) est un moteur de recherche.
La plateforme d’apprentissage X5-Learn (http://x5learn.org/) permet de choisir ses cours et de demander à l’IA de les organiser dans le meilleur ordre. Dans ce cas, c’est un moteur de recommandation qui est utilisé.
D’autres outils X5-GON (une API pour les développeurs, une version à installer dans Moodle) se trouvent ici.

Le projet X5GON a été financé par la subvention n° 761758 du programme de recherche et d’innovation Horizon 2020 de l’Union européenne.

Licence

Symbole de Licence Creative Commons Attribution 4.0 International

IA pour les enseignants : un manuel ouvert Droit d'auteur © 2024 par Colin de la Higuera et Jotsna Iyer est sous licence Licence Creative Commons Attribution 4.0 International, sauf indication contraire.

Partagez ce livre