Données : http://grouplens.org/datasets/movielens/
cours :
http://acsweb.ucsd.edu/~dklim/mf_presentation.pdf
http://clgiles.ist.psu.edu/IST441/materials/powerpoint/RC-week10/Tutorial_IJCAI_2013-modified.pptx
Ces travaux dirigés sont des "notebooks" fonctionnant sur l'interpréteur "jupyter". Les notebooks permettent d'écrire et d'exécuter des scripts python à l'aide d'un simple navigateur web. Les résultats d'exécution sont conservés et peuvent être retrouvés d'une session à l'autre.
Téléchargez les fichiers .ipynb
dans un dossier. Ouvrez un terminal dans ce même dossier et tapez :
jupyter-notebook
Ceci ouvre un onglet de l'interpréteur jupyter dans votre navigateur. Cliquez ensuite sur le notebook sur lequel vous souhaitez travailler.
Pour utiliser un notebook, voir :
Les exercices et problèmes seront réalisés à l'aide des librairies scientifiques de Python: numpy, scipy et matplotlib. Le lien suivant propose une introduction à la librairie numpy (manipulation de matrices et de vecteurs en Python) :
Filtrage collaboratif sur la base "MovieLens"
Le but de ce TD est de développer un moteur de recherche dans une base de textes. Nous utilisons une base constitués d'un peu plus de 11.000 messages postés sur des forums de discussion (anglophones), fréquemment utilisée en analyse des données.
Il s'agit de la base 20newsgroups.
Le TD est constitué de plusieurs exercices ainsi que d'un problème. Les principales opérations sont réalisées à l'aide de la librairie scikit-learn.