Personnaliser l’éducation
23 Parlons IA : Comment Youtube vous apprend – Partie 2
Le processus
A travers Google, les réseaux neuronaux profonds sont désormais utilisés pour l’apprentissage automatique2. Sur la base du modèle vidéo, le réseau neuronal de Youtube prend des vidéos similaires à celles déjà regardées par l’utilisateur. Il essaie ensuite de prédire le temps de lecture de chaque nouvelle vidéo pour un modèle d’utilisateur donné et les classe en fonction de cette prédiction. L’idée est ensuite de montrer les 10 à 20 vidéos (selon l’appareil) les mieux classées.
Le processus est similaire au modèle d’apprentissage automatique que nous avons étudié précédemment. Tout d’abord, la machine prend les traits des modèles d’utilisateurs et de vidéos donnés par le programmeur. Elle apprend à partir des données d’entraînement quel poids donner à chaque trait pour prédire correctement le temps de lecture. Et ensuite, une fois testée et jugée conforme, elle peut commencer à prédire et à recommander.
L’entraînement
Pendant l’entraînement, des millions d’exemples positifs et négatifs sont donnés au système. Un exemple positif est lorsqu’un utilisateur a cliqué sur une vidéo et l’a regardée pendant un certain temps. Un exemple négatif est lorsque l’utilisateur n’a pas cliqué sur la vidéo ou ne l’a pas regardée longtemps2.
Le réseau prend en compte les traits de l’utilisateur et les traits de la vidéo abordés dans la section des modèles de Comment Youtube vous apprend partie 1. Il ajuste l’importance donnée à chaque trait d’entrée en vérifiant s’il a prédit correctement le temps de lecture pour une vidéo et un utilisateur donnés.
Il y a environ un milliard de paramètres (poids de chaque trait) à apprendre sur des centaines de milliards d’exemples2. Le réseau pourrait aussi apprendre à ne pas tenir compte de certains traits – lui donner une importance nulle. Ainsi, l’embedding ou le modèle que l’algorithme crée peut être très différent de ce que les développeurs ont envisagé.
Testing
Une fois le réseau entraîné, il est testé sur des données déjà disponibles et réglé. Outre la précision de la prédiction, la sortie du système doit être réglée par le programmeur sur la base de plusieurs jugements de valeur. Montrer des vidéos qui sont trop similaires à des vidéos déjà regardées ne sera pas très engageant. Qu’est-ce que cela signifie concrètement qu’une recommandation soit bonne ? Combien de vidéos similaires montrer et combien de diversité introduire ; – à la fois par rapport aux autres vidéos et par rapport à l’historique de l’utilisateur. Combien de intérêts de l’utilisateur faut-il cibler ? Quels types de recommandations conduisent à une satisfaction immédiate et lesquelles conduisent à une utilisation à long terme ?1,3 Ce sont toutes des questions importantes à prendre en compte.
Après ces tests, on procède à l’évaluation en temps réel des recommandations. Le temps de lecture total par ensemble de vidéos prédites est mesuré.2 Plus longtemps un utilisateur regarde l’ensemble de vidéos recommandées, le modèle est considéré comme plus performant. Notez que le simple fait de regarder combien de vidéos ont été cliquées n’est pas bon pour l’évaluation. Youtube évalue ses systèmes de recommandation en se basant sur le nombre de vidéos recommandées qui ont été regardées pendant une partie importante de la vidéo, la durée de la session, le temps jusqu’au premier long visionnage et la proportion d’utilisateurs connectés ayant des recommandations1.
Interface
Enfin, sur la façon dont les recommandations sont présentées au spectateur : Combien de vidéos à montrer ? Les meilleures recommandations doivent-elles être présentées en une seule fois, ou certaines doivent-elles être conservées pour plus tard ?3 Comment afficher les vignettes et les titres des vidéos ? Quelles autres informations afficher ? Quels paramètres l’utilisateur peut-il contrôler ?1 Les réponses à ces questions déterminent comment Youtube garde deux milliards d’utilisateurs accrochés 24 heures sur 24.
1 Davidson, J., Liebald, B., Liu, J., Nandy, P., Vleet, T., The Youtube Video Recommendation System, Proceedings of the 4th ACM Conference on Recommender Systems, Barcelona, 2010.
2 Covington, P., Adams, J., Sargin, E., Deep neural networks for Youtube Recommendations, Proceedings of the 10th ACM Conference on Recommender Systems, ACM, New York, 2016.
3 Konstan, J., Terveen, L., Human-centered recommender systems: Origins, advances, challenges, and opportunities, AI Magazine, 42(3), 31-42, 2021.
4 Spinelli, L., and Crovella, M., How YouTube Leads Privacy-Seeking Users Away from Reliable Information, In Adjunct Publication of the 28th ACM Conference on User Modeling, Adaptation and Personalization (UMAP ’20 Adjunct), Association for Computing Machinery, New York, 244–251, 2020.