Sommaire

cours / présentation, exercice, expérience, outil

Fouille de données

Date de création :

16.07.2004

Auteur(s) :

Philippe Leray;Philippe, Alain Rakotomamonjy;Alain

Accéder à la ressource :

https://moodle.insa-rouen.fr/course/view.php?id=92

Présentation

Informations pratiques

Langue du document : Français

Type : cours / présentation, exercice, expérience, outil

Temps d'apprentissage : 1 jour 6 heures

Niveau : enseignement supérieur

Langues : Français

Contenu : texte, ensemble de données

Public(s) cible(s) : apprenant

Document : Document HTML, Document PDF

Age attendu : 18+

Droits d'auteur : pas libre de droits, gratuit
Ressources en libre accès, propriété exclusive de leurs auteurs et de l'INSA de Rouen.

Description de la ressource

Résumé

Toutes les entreprises collectent et stockent de grandes quantités de données. Ces mégabases de données, qui ne cessent d'augmenter jour après jour, sont peu exploitées, alors qu'elles cachent de connaissances décisives face au marché et à la concurrence. Pour combler ce besoin, une nouvelle industrie est en train de naître : le Data Mining (qu'on appellerait en français la fouille de données). Le but de cette UV est d'initier les élèves-ingénieurs aux méthodes et algorithmes issus des statistiques et utilisés en Data Mining. La première partie de ce cours aborde les méthodes de représentation de données multidimensionnelles (analyse en composantes principales, ...). Dans la seconde partie, le cours se concentre sur les méthodes de "clustering", méthodes permettant de regrouper les individus ressemblant dans des classes représentatives. La dernière partie du cours porte sur la notion de discrimination, c'est à dire les méthodes permettant de construire une fonction d'association entre un individu et une classe. Des séances de TD assurent une mise en application des algorithmes vus dans le cours afin de bien observer les différents problèmes pratiques posés, les limites, avantages et inconvénients de chaque méthode, etc ..

Granularité : cours
Structure : en réseau

"Domaine(s)" et indice(s) Dewey

Intelligence artificielle (006.3)

Domaine(s)

Intelligence artificielle : apprentissage, représentation
Fouille de données
Informatique

Intervenants, édition et diffusion

Intervenants

Validateur(s) de la métadonnée : Sylvain Duranton;Sylvain

Édition

Institut National des Sciences Appliquées de Rouen

Diffusion

Cette ressource vous est proposée par :

Fiche technique

Identifiant de la fiche : http://ori.unit-c.fr/uid/unit-ori-wf-1-103

Identifiant OAI-PMH : oai:www.unit.eu:unit-ori-wf-1-103

Version : 18/12/2007

Schéma de la métadonnée : oai:uved:Cemagref-Marine-Protected-Areas

LOMv1.0
LOMFRv1.0
SupLOMFRv1.0
Voir la fiche XML

Entrepôt d'origine : UNIT

Publication : 16.07.2004

extraction automatique d?informations

analyse statistique des données

discrimination

proximité

modélisation

classification hiérarchique ascendante

matlab

Voir aussi

31.12.2013

Un déluge de données

Description : Dans de nombreux domaines, scientifiques ou non, les données s’accumulent en masse. Les gérer et les exploiter est le défi posé à l’informatique du Big Data.

big data
science des données
extraction information
analyse de données
fuscia

03.08.2006

Traitement d’images pour l’évaluation des ressources forestières

Description : Les nouvelles données images très haute résolution ont beaucoup apporté aux inventaires forestiers en fournissant des informations à l’échelle de l’arbre. Des algorithmes, chargés de récupérer ces informations automatiquement, sont nécessaires pour aider les photo-interprètes.

image très haute résolution
géométrie stochastique
photointerprétation
dendrométrie
extraction automatique d'information
processus ponctuel marqué
distance de Bhattacharya
algorithme du recuit simulé
modélisation 2D
modélisation 3D
fuscia

Le ministère

Thématiques

Ressources humaines