Dra. María del Pilar Gómez Gil Coordinación de Computación Instituto Nacional de Astrofísica, Óptica y Electrónica Oficina 8228 [email protected], [email protected] http://ccc.inaoep.mx/~pgomez Presentación disponible en: http://ccc.inaoep.mx/~pgomez/temasTesis.pdf V:2014-10-24 (c) P. Gómez, INAOE 2014 [email protected] 1 Laboratorios/líneas de investigación en CCC 1. Aprendizaje y Reconocimiento de Patrones 2. Cómputo Reconfigurable y de Alto Desempeño 3. Procesamiento de Bio-Señales y Computación Médica 4. Cómputo y Procesamiento Ubicuo 5. Robótica 6. Tecnologías de Lenguaje 7. Visión Computacional (c) P. Gómez, INAOE 2014 [email protected] 2 Mi participación en investigación Formo parte de: Laboratorio de Aprendizaje Automático y Reconocimiento de Patrones (MLPR), Laboratorio de Cómputo y Procesamiento Ubicuo (CPU) Grupo de procesamiento de señales e Inteligencia Computacional (PSIC) PSIC está formado por investigadores y estudiantes de las coordinación de Electrónica y de Ciencias de la computación (c) P. Gómez, INAOE 2014 [email protected] 3 Áreas de interés de PGG Redes Neuronales Artificiales (RNA) aplicadas en problemas de: Reconocimiento de patrones Clasificación estática y temporal Predicción Diseño de RNA Otras áreas de inteligencia computacional aplicadas a dichos problemas (Lógica Difusa y Algoritmos Evolutivos) (c) P. Gómez, INAOE 2014 [email protected] 4 Las Redes Neuronales Artificiales Son modelos matemáticos capaces de adaptar su comportamiento en respuesta a ejemplos presentados por el medio ambiente de manera supervisada o no supervisada (esto es aprendizaje automático!) Están inspiradas en la construcción del cerebro y las neuronas biológicas. Una red neuronal artificial es un procesador paralelo y distribuido, hecho de varios procesadores simples, que puede almacenar y utilizar conocimiento adquirido de la experiencia (Haykin 2009). (c) P. Gómez, INAOE 2014 [email protected] 5 El Contexto de Redes Neuronales (Gómez-Gil, 2009) Entradas RNA Salidas Ejemplos (medio ambiente) (c) P. Gómez, INAOE 2014 [email protected] conocimiento 6 Aprendizaje basado en ejemplos Las redes neuronales son capaces de modificar su comportamiento en respuesta al medio ambiente, el cual es “presentado a la red” a través de ejemplos significativos del problema. Para una red neuronal, aprender significa modificar los valores de los pesos (números reales), siguiendo una estrategia determinada conocida como “algoritmo de aprendizaje.” (c) P. Gómez, INAOE 2014 [email protected] 7 Hay muchos tipos de RNA’s… algunos “típicos” (c) P. Gómez, INAOE 2014 [email protected] 8 Hay muchos tipos de RNA’s… otros mas “interesantes”… (c) P. Gómez, INAOE 2014 [email protected] 9 Características de mi investigación RETOS AREAS DEL CONOCIMIENTO AREAS DE APLICACIÓN Con respecto a DATOS: • ruidosos • clases sobrepuestas • muy pocos • difíciles de caracterizar • se requieren fusionar • etc… •Clasificación estática •Clasificación temporal •Predicción •Teoría de RNA •Brain Computer Interfaces • Biométrica • Diagnóstico médico • Economía y Finanzas • Astrofísica • Mobile Phone sensing • Reconocimiento de escritura (c) P. Gómez, INAOE 2014 [email protected] 10 Principales Proyectos vigentes de PGG Sistemas de aproximación de valores futuros en series de tiempo no estacionarias mediante modelos conexionistas recurrentes y análisis multi-resolución (proyecto CONACYT CB-2010) (finanzas, economía, clima etc.) (PSIC) 2. Clasificación y predicción temporal de señales EEG con aplicación a interfaces cerebrocomputadora (BCI, diagnóstico médicoepilepsia). (PSIC) 3. Priscus: Reconocimiento automático de escritura manuscrita en documentos antiguos 1. (c) P. Gómez, INAOE 2014 [email protected] 11 SOBRE PLAN DE ESTUDIOS PERIODO 1 (OTOÑO) Matemáticas para computación PERIODO 2 (PRIMAVERA) Curso área prioritaria PERIODO 3 (VERANO) Curso área escogida PERIODO 4 (OTOÑO) PERIODO 5 (PRIMAVERA) PERIODO & (VERANO) Preparación de tesis Preparación de tesis Terminación de tesis Diseño y análisis Curso área Curso de algoritmos prioritaria área de soporte Curso básico área 1 Curso otra área Seminario Curso básico área 2 Curso otra área Seminario de metodología Seminario (c) P. Gómez, INAOE 2014 [email protected] 12 Cursos posiblemente requeridos para mis proyectos 1. 2. 3. 4. 5. 6. Procesamiento digital de señales Inteligencia Computacional I Inteligencia Computacional II Reconocimiento de patrones Aprendizaje Computacional II Procesamiento de bio-señales (c) P. Gómez, INAOE 2014 [email protected] 13 (c) P. Gómez, INAOE 2014 [email protected] 14 Temas de tesis de maestría propuestos por proyecto (1/2) PROYECTO TEMA a desarrollarse en 2015 Sistemas de aproximación de valores futuros en series de tiempo no estacionarias mediante modelos conexionistas recurrentes y análisis multi-resolución * Mejoras a la red neuronal HCNN a través de aprendizaje de fases en los generadores armónicos, y otras herramientas de procesamiento de señales. (ASIGNADO) Clasificación temporal y predicción de señales EEG con aplicación a reconocimiento de enfermedades y a interfaces cerebro-computadora (BCI). •Asignación de clases temporales a través de lógica difusa • Predicción de eventos ictales basado en EEG • Predicción de eventos hipotensos súbitos en salas de terapia intensiva •Prediccion/clasificación en otras señales biológicas • Selección de funciones wavelts madre para redes wavelets aplicadas a clasificación/predicción (c) P. Gómez, INAOE 2014 [email protected] 15 Temas de tesis de maestría propuestos por proyecto (2/2) PROYECTO TEMA a desarrollarse en 2015 Priscus • Uso de la red neuronal “Long-short term Memory” (LSTM) para reconocimiento de palabras • Uso de técnicas conexionistas para identificación de áreas de interés en textos antiguos (c) P. Gómez, INAOE 2014 [email protected] 16 (c) P. Gómez, INAOE 2014 [email protected] 17 Resumen Este proyecto contiene varias vertientes, una de ellas tiene que ver con la clasificación de eventos, a través de analizar señales de Electro-encefalogramas Este proyecto se realiza en colaboración con el grupo de BCI de la coordinación de electrónica. Actualmente hay varias tesis de maestría y doctorado involucradas (c) P. Gómez, INAOE 2014 [email protected] 18 Resumen Este proyecto contiene varias vertientes, una de ellas tiene que ver con la clasificación de eventos, a través de analizar señales de Electro-encefalogramas Este proyecto se realiza en colaboración con el grupo de BCI de la coordinación de electrónica. Actualmente hay varias tesis de maestría y doctorado involucradas (c) P. Gómez, INAOE 2014 [email protected] 19 Interfaz cerebro-computadora No exige ninguna actividad muscular Permite controlar dispositivos Actividad cerebral [Carrera-León 2010] (c) P. Gómez, INAOE 2014 [email protected] 20 Ejemplo de una estructura básica de un sistema BCI [D’croz Barón 2010] (c) P. Gómez, INAOE 2014 [email protected] 21 Obtención de señales Usando el casco… [Ramírez et al 2010] Datos obtenidos de un casco EEG (c) P. Gómez, INAOE 2014 [email protected] 22 Existe Software para análisis de ECG… [Ramírez-Cortés et al. 2010] (c) P. Gómez, INAOE 2014 [email protected] 23 Un clasificador Adaptivo MEDIDAS SENSADO PREPROCESAMIENTO Y EXTRACCION DE VECTOR DE CARACTERÍSTICAS CARACTERÍSTICAS CLASSES OBJETOS ANÁLISIS DEL CONTEXTO DECISION APRENDIZAJE [Tao & Gonzalez 74] (c) P. Gómez, INAOE 2014 [email protected] 24 Algunos retos en este proyecto La identificación de los eventos no puede realizarse simplemente analizando la señal en el tiempo Hay muchos trabajos actualmente sobre el tema, pero sus resultados no son tan buenos como se desea Se requiere analizar tanto la parte de extracción de características como la de clasificación. Nosotros nos concentraremos en la clasificación (c) P. Gómez, INAOE 2014 [email protected] 25 Proyectos posibles • Asignación de clases temporales a través de lógica • • • • difusa Predicción de eventos ictales basado en EEG Predicción de eventos hipotensos súbitos en salas de terapia intensiva Prediccion/clasificación en otras señales biológicas Selección de funciones wavelts madre para redes wavelets aplicadas a clasificación/predicción (c) P. Gómez, INAOE 2014 [email protected] 26 Para conocer un poco mas de este proyecto leer.. 2010. Gómez-Gil P, García-Pedrero A and Ramírez-Cortes JM. “Composite Recurrent Neural Networks for Long-Term Prediction of Highly-Dynamic Time Series Supported by Wavelet Decomposition”, Soft Computing for Intelligent Control and Mobile Robotics, Vol. 318/2011, pp.253-268, Castillo O, Janusz K and Pedrycz W. Editors, Springer-Verlag. DOI:10.1007/978-3-642-15534-5_16 (para conocer algo sobre redes neuronales recurrentes) 2010. Luna-Pérez, R, Gómez-Gil, P. “Unconstrained Handwritten Word Recognition Using a combination of Neural Networks.” Lecture Notes in Engineering and Computer Science -Proceedings of the 2010 Word Congress on Engineering and Computer Science (WCECS 2010) – International Conference on Soft Computing and Applications (ICSCA 10), San Francisco, USA. Vol. 1, pp. 525 - 528. Eds. Ao SI, Douglas C, Grundfest WS, Burgstone J. International Association of Engineers. (para conocer algo sobre clasificación temporal) 2010. Ramírez-Cortés JM, Alarcón-Aquino V, Rosas-Cholula G, Gómez-Gil P, Escamilla-Ambrosio J. “P-300 rhythm detection using ANFIS algorithm and wavelet feature extraction in EEG signals”. Lecture Notes in Engineering and Computer Science -Proceedings of the 2010 Word Congress on Engineering and Computer Science (WCECS 2010) – International Conference on Soft Computing and Applications (ICSCA 10), San Francisco, USA, Vol. 2186, pp. 619 - 623. Eds. Ao SI, Douglas C, Grundfest WS, Burgstone. (para conocer algo sobre clasificación en BCI) Página de PhysioNet www.physionet.org (c) P. Gómez, INAOE 2014 [email protected] 27 (c) P. Gómez, INAOE 2014 [email protected] 28 Resumen PRISCUS es un proyecto para la construcción de un sistema lector de documentos manuscritos antiguos y modernos. Su objetivo es desarrollar un software inteligente integral. Está basado en redes neuronales artificiales y otros componentes de inteligencia computacional y entendimiento de lenguaje. Se busca la mejor implementación posible a problemas que aún son abiertos, tales como: segmentación de escritura continua, entendimiento de texto completo en base a clasificación de caracteres y palabras, e identificación de palabras Se están iniciando colaboraciones con un grupo en Grecia. (c) P. Gómez, INAOE 2014 [email protected] 29 El reconocimiento de manuscritos es un reto! [Spinola & Linares 2000] (c) P. Gómez, INAOE 2014 [email protected] 30 Un OCR para documentos manuscritos 1. Digitalización Documento original 3. Segmentación de palabras 2. Preprocesamiento Imagen digital imagen limpia Words Objetos de caracteres Parámetros de entrenamiento 7. Entrenamiento del reconocedor 6. Reconocimiento de caracteres/ palabras 8. Identificación de palabras Posibles palabras Diccionario (c) P. Gómez, INAOE 2014 [email protected] Conocimiento de la RNA Conocimiento de la RNA Objetos con caracteres 4. Segmentación de caracteres/palabras y extracción de características Palabras en el texto Parámetros para entrenamiento Segmentación para entrenamiento 5. Entrenamiento de la segmentación Posibles caracteres 10. Corrección de estilo [Gómez-Gil et al. 2007] Transcripción del documento 31 Algunos retos en este proyecto El modelo de reconocimiento de caracteres debe utilizar información probabilística a fin de reconocer palabras y utilizar el contexto. El sistema de segmentación de caracteres requiere implementarse Definir un de sistema de formación de sentencias basado en procesamiento de lenguaje natural (c) P. Gómez, INAOE 2014 [email protected] 32 Para conocer un poco mas de este proyecto ver las publicaciones listadas en la página: http://cpulabserver.inaoep.mx/~priscus/paginaPriscus/ (c) P. Gómez, INAOE 2014 [email protected] 33 Referencias 2010. Carrera-León, O. “Análisis en tiempo-frecuencia para extracción de características y clasificación de señales EEG; Interfaces BCI.” Propuesta de tesis de maestría, coordinación de electrónica, INAOE. 2010. D’Croz Barón, D.F. “Reconocimiento de imaginación Motora de señales EEG en el dominio temporal”, Propuesta de tesis de maestría, coordinación de electrónica, INAOE 2010. Gómez-Gil P. Las Matemáticas del Aprendizaje Automático Conexionista y su Aplicación en TI. Conferencia Plenaria. Tercer Foro de Matemáticas Aplicadas en las Tecnologías de Información. 21 de Mayo del 2010 2010. Ramírez-Cortés JM, Alarcón-Aquino V, Rosas-Cholula G, Gómez-Gil P, Escamilla-Ambrosio J. “P-300 rhythm detection using ANFIS algorithm and wavelet feature extraction in EEG signals”. Lecture Notes in Engineering and Computer Science -Proceedings of the 2010 Word Congress on Engineering and Computer Science (WCECS 2010) – International Conference on Soft Computing and Applications (ICSCA 10), San Francisco, USA, Vol. 2186, pp. 619 - 623. Eds. Ao SI, Douglas C, Grundfest WS, Burgstone J. International Association of Engineers. (c) P. Gómez, INAOE 2014 [email protected] 34 Proyectos posibles • Uso de la red neuronal “Long-short term Memory” (LSTM) para reconocimiento de palabras • Uso de técnicas conexionistas para identificación de áreas de interés en textos antiguos (c) P. Gómez, INAOE 2014 [email protected] 35 [email protected] [email protected] INAOE, Tonantzintla Puebla, oficina 8228 (222) 266-3100 ext. 8228 (c) P. Gómez, INAOE 2014 [email protected] 36
© Copyright 2024 ExpyDoc