Datamining (I) : une vue d’ensemble

Le datamining s’agit d’un ensemble des techniques qui permettent d’obtenir des renseignements utiles provenant de grandes bases de données. Il mélange l’utilisation de la statistique, l’utilisation intensive des bases de données, le traitement des données, l’utilisation des algorithmes, de l’intelligence artificielle et des modèles de reconnaissance. C’est important de souligner la nécessité de dominer l’informatique et la statistique pour réussir.

L’existence de ces techniques est relativement nouvelle et dérive de la grande augmentation des données dans tous les secteurs. Quand la quantité de données est tellement grande, l’analyse s’avère très compliquée et coûteux dans le temps. D’autre part, on doit constater que la nature des données ont été recueillies pour d’autres propos que l’utilisation du ”datamining” et cela est le premier obstacle.

Le “datamining” permet d’obtenir des résumés utiles des données et de trouver des relations imprévues qui peuvent être très utiles pour le propriétaire des données. De cette manière, la prise des décisions sera plus efficace et plus facile.

On doit introduire un autre concept qui s’appelle “data warehousing” qui est l’ensemble de données (des différentes sources) qui sera ordonné et classifié logiquement pour être l’objet d’application du datamining. Le plus complexe les structures des données, les plus complexes seront les modèles, les algorithmes et les outils que nous aurons besoin d’utiliser.

La technique peut être directe ou indirecte, la première essaye d’analyser une série de variables encore connues, alors que la seconde essaye de trouver des rapports entre variables ou groupes de variables sans déterminer à priori.

Le “datamining” implique la création de modèles (ensemble d’algorithmes) qui permettront de lier une série de donnés à un résultat. Un modèle est utilisé pour la création de “scores” qui est une forme d’énoncer les résultats d’un modèle en un seul nombre.

Les tâches qui peuvent être réalisées avec le “datamining” sont les suivantes:

  1. Classification (technique directe)
  2. Estimation (technique directe)
  3. Prédiction (technique directe)
  4. Ressemblance groupe (technique indirecte)
  5. Groupement (technique indirecte)
  6. Description et profilage (technique directe ou indirecte)

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: