miércoles, 2 de mayo de 2012

EXTRACCION DE CONOCIMIENTO



Descubrimiento de patrones, relaciones y tendencias mediante análisis de gran cantidad de datos



Ejemplos de aplicaciones


Toma de decisiones
– Cuándo concedo un crédito hipotecario? por cuánto? Qué
tipo de solicitante no devolverá el crédito?
– Un cliente de tarjeta de crédito está realizando una compra,
pagará? se la han robado?


Diagnósticos
– Determinación de enfermedades
– Fallos en procesos industriales


Marketing y ventas
– Hábitos y fidelidad de clientes. Cuál es el perfil de los clientes
que se gastan al mes más dinero?
– Análisis de compras. Qué productos de nuestra empresa es
el que compran los clientes junto al detergente?
– Análisis de perfil más adecuado para publicidad directa.



Análisis de datos en Internet


• Web Mining: análisis de páginas para extraer
automáticamente información

• e-Mining: análisis de las interacciones de los clientes
con mis páginas

• Web para extraer información

• Tipo de información que busco:
– Qué tipo de clientes tengo
– Cómo interacciona cada tipo de cliente con las páginas Web
– Qué banners son los que siguen mis clientes (publicidad)
– Descubrimiento de patrones de compra/navegación.


Almacén de datos (data warehouse)


Técnicas para almacenar y manejar datos provenientes
de varias fuentes de una organización como medio de
soporte a la decisión.










El Proceso de KDD


• Contexto de un aplicación con Análisis de Datos.


– Proceso interactivo e iterativo. Ensayo y error

METODOLOGÍA

1. Formular el problema
2. Determinar la representación (atributos y clases)

– directamente
– hablando con expertos
– a partir de otras técnicas (filtros)

3. Identificar y recolectar datos de entrenamiento (bases de datos,
ficheros, …)
4. Preparar datos para análisis
5. Selección de modelo, construcción y entrenamiento
6. Evaluar lo aprendido

– validación cruzada, expertos

7. Integrar la base de conocimiento a la espera de nuevos datos
tras acciones.

Tipos de técnicas

• Paramétricas, no paramétricas

• Grado de supervisión
– Supervisadas, no supervisadas, por refuerzo
• Tipo de información resultante
– Simbólica, subsimbólica/numérica, mixta
• Número de técnicas empleadas
– Sencillos, meta-clasificadores
• Tipo de clases
– Discretas, continuas, desconocidas

Elementos básicos de entrada

• Concepto: qué se quiere aprender (estructura inteligible y útil para
cada tipo de problema). Salida: descripción del concepto

Clasificación
Predicción/Estimación
Asociación
Agrupamiento

• Atributo: qué características (variables) se van a utilizar para
describir el concepto

– Ej.: salario, crédito solicitado, categoría a la que pertenece, ...
– Tipos: continuos, nominales/categóricos

• Clase: diferentes valores (etiquetas) del concepto aprendido

– Ej.:sí, no, necesita-aval, etc.

• Instancia o ejemplo: cada muestra a partir de la cual se extrae el
concepto



TALLER

Desarrollar el siguiente cuestionario para afianzar los conocimientos adquiridos













martes, 20 de marzo de 2012

MOTOR DE INFERENCIA










DESCRIPCION GENERAL


Los Sistemas Expertos estan basados en conocimientos dedicados a tareas específicas que requieren una gran cantidad de conocimiento de un dominio de experiencia particular, proporcionan experiencia en forma de diagnósticos, instrucciones, predicciones o consejos ante situaciones reales que se planteen y pueden servir también como herramientas de entrenamiento. Son aplicables a numerosos campos de experiencia, como medicina, actividades militares, económicas financieras e industriales, ciencia, ingeniería, y derecho.

CONOCIMIENTO FACTUAL Y OPERATIVO




FACTUAL



Aprender a vincular el aprendizage  con loe desempeños y así lograr evidencias de calidad durante las actividades en el proceso de la construccion del aprendizaje significativo  para el alumno.
¿Como me puede ser útil en mi vida? ejercitando la evaluacion continua para evitar errores yo creo que hasta fracasos, si evaluó mis actividades en mi quehacer cotidiano, voy actuar o intervenir   en tiempo y forma de manera intelectual; en   el momento oportuno. ¿Cómo aplicaré esta lectura en mi quehacer docente? Poniéndola al servicio de los jóvenes estudiantes para evitar errores; como un recurso formativo   y al mismo tiempo de aprendizaje tanto intelectual como humano.



OPERATIVO



Las características intrínsecas de este hacen que se pueda difundir, transferir, poseer y vender. La evolución de la economía capitalista de mercado, en los últimos 150 años, ha venido siendo orientada por el desarrollo de este significativo recurso. La nueva economía de la información presenta regularidades que garantizan un marco relativamente predecible sobre la evolución y dinámica del conocimiento. Estos nuevos principios permiten inferir la forma como se desenvolverán las instituciones políticas, sociales y culturales en el futuro. Las posibilidades de los que no poseen el conocimiento son muy pocas concretamente los países en vías de desarrollo , porque las fuerzas que se perfilan en el nuevo entorno son de concentración y distanciamiento del conocimiento en los que ya lo tienen, y de exclusión de quienes no lo poseen



Maquina de Inferencias

La máquina de inferencias es la porción del sistema experto que razona utilizando el contenido de la base de del conocimiento n una secuencia determinada.
Durante la consulta, la máquina de inferencias examina las reglas de la base del conocimiento una por una, y cuando se cumple la condición de la regla, se realiza la acción especificada. En la terminología de los sistemas experto, la regla se extiende cuando se efectúa la acción.
Sean ideado dos métodos principales de la máquina de inferencias usa al examinar las reglas: prorazonamiento y razonamiento inverso.
Prorazonamiento
En el prorazonamiento, también llamado encadenamiento hacia delante, las reglas se examinan una tras otra en cierto orden. El orden podría ser la secuencia en que las reglas se introdujeron en el conjunto de reglas, o podrá ser alguna otra secuencia especificada por el usuario.
Razonamiento Inverso
En el razonamiento inverso, también llamado encadenamiento hacia atrás, la máquina de inferencia selecciona una regla y la considera como un problema a resolver. Pero luego se da cuenta, que para resolverla debe primero resolver las anteriores las cuales se constituyen en subproblemas.
Comparación entre l prorazonamiento y el razonamiento inverso
El razonamiento inverso es más rápido que el prorazomiento por que no tiene que considerar todas las reglas y no efectúa múltiples pasadas por el conjunto de reglas. El razonamiento inverso en apropiado cuando:
  * Hay múltiples variables de meta.
  * Hay muchas reglas.
  * No es preciso examinar la mayor parte de las reglas en el proceso de llegar a una solución.





MOTOR DE INFERENCIA





Es el componente de un Sistema Experto, encargado de gerenciar y controlar logicamente el manejo y utilización del conocimiento almacenado en la base. El paradigma del motor de inferencia es la estrategia de búsqueda para producir el conocimiento demandado.


El sistema sigue los siguientes pasos:
1. Evaluar las condiciones de todas las reglas respecto a la base de datos
2. Si no se puede aplicar ninguna regla, se termina sin éxito; en caso contrario se elige cualquiera de las reglas aplicables y se ejecuta su parte acción
3. Si se llega al objetivo, se ha resuelto el problema; en caso contrario, se vuelve al paso 1
El Motor de Inferencia realiza dos tareas principales:
  • Examina los hechos y las reglas, y si es posible, añade nuevos hechos
  • Decide el orden en que se hacen las inferencias.
Para realizar estas tareas utiliza estrategias de inferencia y estrategias de control.
Las estrategias de inferencia que más se emplean en sistemas expertos están basadas en la aplicación de las reglas lógicas denominadas “modus ponens” y modus tollens”.
Modus Ponens.


Es quizá la regla de inferencia mas comunmente utilizada. Se utiliza para obtener conclusiones simples, en ella se analiza la premisa de la regla, y si es cierta, la conclusión entra a formar parte del conocimiento. Como ilustración supóngase que se tiene la regla, “ Si A es cierto, entonces B es cierto”, y que se sabe además que “A es cierto” . La regla Modus Ponens, concluye que “B es cierto”.
Modus Tollens.



Se utiliza tambien para obtener conclusiones simples. En este caso se examina la conclusión, y si es falsa, se concluye que la premisa tambien es falsa. Por ejemplo, supóngase de nuevo que “Si A es cierto, entonces B es cierto” pero se sabe que “B es falso”. Entonces, utilizando la regla Modus Ponens no se puede obtener ninguna conclusión pero la regla Modus Tollens concluye que “A es falso”.
MANEJO DE INCERTIDUMBRE

En situaciones inciertas, es necesario introducir algunos medios para tratar la incertidumbre. Por ejemplo, algunos sistemas expertos usan la misma estructura de los sistemas basados en reglas, pero introducen una medida asociada a la incertidumbre de las reglas y a la de sus premisas. En este caso se pueden utilizar algunas fórmulas de propagación para calcular la incertidumbre asociada a las conclusiones. (FC, Bayesian Update, Bayesian networks, Fuzzy systems)

Los problemas con los que pueden tratar los sistemas expertos pueden clasificarse en dos tipos: problemas esencialmente deterministas y problemas esencialmente estocásticos. Por ejemplo, un cajero automático o un SE para control de tráfico vial pueden contener algunos elementos de incertidumbre, son esencialmente problemas deterministas.