Professeur responsable
Daniel Lemire
Objectifs
Décrire ce que sont les connaissances et l'information non structurée et le rôle qu'elles jouent dans l'organisation. Utiliser les techniques classiques de recherche d'informations et les techniques Web dans le cadre du développement logiciel et d'activités scientifiques. Intégrer la recherche d'informations dans le développement informatique. Utiliser efficacement les informations contenues dans de grands ensembles de documents. Évaluer les différentes méthodes de recherche d'informations dans un contexte de gestion des connaissances.
Contenu
Les lois de Zipf et Mandelbrot. Théorie de l'information de Shannon. Les formats de métadonnées, XML. Expressions régulières : ancrages, groupement atomique, tests avant/arrière, quantificateurs avides, paresseux et progressifs. Index inversés. Arbres de suffixes. Tableaux de suffixes. Modèles booléens, vectoriels et probabilistes. Modèles de la langue. Ergonomie en recherche d'informations. Hyperonymie, hyponymie, troncature, lemmatisation et thésaurus. Utilisation pratique d'un moteur de recherche dans une application avec Lucene et Snowball. Hyperliens et moteurs de recherche sur le Web : PageRank et HITS. La logistique d'un moteur de recherche Web. Systèmes de recommandation et filtrage collaboratif. Évaluation : précision, rappel, validation croisée.
Matériel didactique
Le matériel didactique est accessible sur le site Web du cours.
Renseignements technologiques
Consultez l'information sur le matériel informatique recommandé.
Encadrement
Les communications se font principalement par courriel.
Évaluation
L'évaluation repose sur six travaux (5 %, 10 %, 10 %, 10 %, 10 % et 5 %) et un examen à domicile (50 %)
Échelle de conversion
Notation | Valeur numérique | Valeur en pourcentage |
---|---|---|
A+ | 4,3 | 90 à 100 % |
A | 4 | 85 à 89 % |
A- | 3,7 | 80 à 84 % |
B+ | 3,3 | 77 à 79 % |
B | 3 | 73 à 76 % |
B- | 2,7 | 70 à 72 % |
C+ | 2,3 | 66 à 69 % |
C | 2 | 60 à 65 % |
E | 0 | 0 à 59 % |
* Échelle de conversion actuellement en vigueur pour ce cours.
Particularités d'inscription
Pour suivre ce cours, une connaissance de l'algèbre linéaire de niveau collégial et une connaissance minimale du Java sont requises.
Si INF 6460 ou INF7900 de l'UQAM ont été suivis, on ne peut pas s'inscrire au présent cours.
Liste des programmes dont ce cours fait partie
- Maîtrise ès sciences (technologie de l'information), profil avec mémoire (1811)
- Maîtrise ès sciences (technologie de l'information), profil professionnel (1775)
- Maîtrise ès sciences (technologie de l'information), profil recherche (1776)
- Maîtrise ès sciences (technologie de l'information), profil sans mémoire (1810)
- Programme court en technologie de l'information (0810)