Professeur responsable
Daniel Lemire
Préalable
INF 1220
Objectifs
Décrire ce qu'est l'information non structurée et le rôle qu'elle joue dans l'organisation. Utiliser les techniques classiques de recherche d'informations (expressions régulières, recherche par mots-clés, etc.) et les techniques Web (algorithmes topologiques tels que PageRank et HUBS, filtrage collaboratif) dans le cadre du développement logiciel et d'activités scientifiques. Évaluer les différentes méthodes de recherche d'informations dans un contexte de gestion des connaissances (index, expressions régulières, modèles booléens, vectoriels et probabilistes, filtrage collaboratif, etc.).
Contenu
Les lois de Zipf et Mandelbrot. Théorie de l'information de Shannon. Formats des métadonnées, XML. Expressions régulières : ancrages, groupement atomique, tests avant/arrière, quantificateurs avides, paresseux et possessifs. Index inversés. Arbres de suffixes. Tableaux de suffixes. Modèles booléens, vectoriels et probabilistes. Modèles de la langue. Ergonomie en recherche d'informations. Hyperonymie, hyponymie, troncature, lemmatisation et thésaurus. Utilisation pratique d'un moteur de recherche dans une application avec Lucene et Snowball. Hyperliens et moteurs de recherche sur le Web : PageRank et HITS. Logistique d'un moteur de recherche Web. Systèmes de recommandation et filtrage collaboratif. Évaluation : précision, rappel, note F, validation croisée.
Matériel didactique
Le matériel didactique est accessible sur le site Web du cours.
Renseignements technologiques
Consultez l'information sur le matériel informatique recommandé.
Encadrement
L'encadrement est individualisé et assuré par une personne tutrice. Les communications se font principalement dans les forums de discussion et par courrier électronique.
Évaluation
L'évaluation repose sur six travaux (5 %, 10 %, 10 %, 10 %, 10 % et 5 %) et un examen à domicile (50 %).
Échelle de conversion
Notation | Valeur numérique | Valeur en pourcentage |
---|---|---|
A+ | 4,3 | 96 à 100 % |
A | 4 | 92 à 95 % |
A- | 3,7 | 88 à 91 % |
B+ | 3,3 | 84 à 87 % |
B | 3 | 80 à 83 % |
B- | 2,7 | 76 à 79 % |
C+ | 2,3 | 72 à 75 % |
C | 2 | 68 à 71 % |
C- | 1,7 | 64 à 67 % |
D+ | 1,3 | 60 à 63 % |
D | 1 | 50 à 59 % |
E | 0 | 0 à 49 % |
* Échelle de conversion actuellement en vigueur pour ce cours.
Particularités d'inscription
La connaissance de l'algèbre linéaire de niveau collégial est requise.