cours / présentation, exercice, expérience, outil

Fouille de données

Toutes les entreprises collectent et stockent de grandes quantités de données. Ces mégabases de données, qui ne cessent d'augmenter jour après jour, sont peu exploitées, alors qu'elles cachent de connaissances décisives face au marché et à la concurrence. Pour combler ce besoin, une nouvelle industr...

Date de création :

16.07.2004

Auteur(s) :

Philippe Leray;Philippe, Alain Rakotomamonjy;Alain

Présentation

Informations pratiques

Langue du document : Français
Type : cours / présentation, exercice, expérience, outil
Temps d'apprentissage : 1 jour 6 heures
Niveau : enseignement supérieur
Langues : Français
Contenu : texte, ensemble de données
Public(s) cible(s) : apprenant
Document : Document HTML, Document PDF
Age attendu : 18+
Droits d'auteur : pas libre de droits, gratuit
Ressources en libre accès, propriété exclusive de leurs auteurs et de l'INSA de Rouen.

Description de la ressource

Résumé

Toutes les entreprises collectent et stockent de grandes quantités de données. Ces mégabases de données, qui ne cessent d'augmenter jour après jour, sont peu exploitées, alors qu'elles cachent de connaissances décisives face au marché et à la concurrence. Pour combler ce besoin, une nouvelle industrie est en train de naître : le Data Mining (qu'on appellerait en français la fouille de données). Le but de cette UV est d'initier les élèves-ingénieurs aux méthodes et algorithmes issus des statistiques et utilisés en Data Mining. La première partie de ce cours aborde les méthodes de représentation de données multidimensionnelles (analyse en composantes principales, ...). Dans la seconde partie, le cours se concentre sur les méthodes de "clustering", méthodes permettant de regrouper les individus ressemblant dans des classes représentatives. La dernière partie du cours porte sur la notion de discrimination, c'est à dire les méthodes permettant de construire une fonction d'association entre un individu et une classe. Des séances de TD assurent une mise en application des algorithmes vus dans le cours afin de bien observer les différents problèmes pratiques posés, les limites, avantages et inconvénients de chaque méthode, etc ..

  • Granularité : cours
  • Structure : en réseau

"Domaine(s)" et indice(s) Dewey

  • Intelligence artificielle (006.3)

Domaine(s)

  • Intelligence artificielle : apprentissage, représentation
  • Fouille de données
  • Informatique

Intervenants, édition et diffusion

Intervenants

Validateur(s) de la métadonnée : Sylvain Duranton;Sylvain

Édition

  • Institut National des Sciences Appliquées de Rouen

Diffusion

Cette ressource vous est proposée par :UNIT - accédez au site internetUNIT - accédez au site internet

Fiche technique

Identifiant de la fiche : http://ori.unit-c.fr/uid/unit-ori-wf-1-103
Identifiant OAI-PMH : oai:www.unit.eu:unit-ori-wf-1-103
Version : 18/12/2007
Schéma de la métadonnée : oai:uved:Cemagref-Marine-Protected-Areas
Entrepôt d'origine : UNIT

Voir aussi

UNIT
UNIT
31.12.2013
Description : Dans de nombreux domaines, scientifiques ou non, les données s’accumulent en masse. Les gérer et les exploiter est le défi posé à l’informatique du Big Data.
  • big data
  • science des données
  • extraction information
  • analyse de données
  • fuscia
UNIT
UNIT
03.08.2006
Description : Les nouvelles données images très haute résolution ont beaucoup apporté aux inventaires forestiers en fournissant des informations à l’échelle de l’arbre. Des algorithmes, chargés de récupérer ces informations automatiquement, sont nécessaires pour aider les photo-interprètes.
  • image très haute résolution
  • géométrie stochastique
  • photointerprétation
  • dendrométrie
  • extraction automatique d'information
  • processus ponctuel marqué
  • distance de Bhattacharya
  • algorithme du recuit simulé
  • modélisation 2D
  • modélisation 3D
  • fuscia