Apuntes sobre KDD o Knowledge discovery in databases
Ya estos son los últimos por esta semana. Ahora dejo algunos apuntes de KDD o descubrimiento de conocimiento (e información) en las bases de datos.
Esto tiene que ver con los sistemas de información y las tecnologías de la información.
Descubrimiento de conocimiento en bases de datos
La información sirve para tomar decisiones. Los datos son materia prima, son conocimiento.
Según estudios, la información de las empresas se duplica cada 20 meses.
El 80 % de la información se obtiene con SQL.
KDD procesa automáticamente los datos, identifica patrones comprensibles y los presenta de manera visual.
Lo que hace KDD:
- Procesar automáticamente grandes datos crudos
- Identificar patrones significativos y relevantes
- Presentarlos automáticamente al usuario
Para esto usa:
- Sistemas de información
- Bases de datos
- Redes neurales
- Inteligencia artificial
KDD reconoce patrones para que alguien visualice los datos, utiliza también a la computación distribuida.
Proceso de KDD
- Determinar fuentes de información
- Diseñar esquema de almacén de datos
- Implantación de almacén de datos
- Vista previa de datos, aspectos importantes
- Selección, limpieza y transformación
- Minería de datos con método apropiado
- Evaluar, interpretar y transformar patrones
- Disfusión de nuevo conocimiento obtenido