Dra. María del Pilar Gómez Gil - Ciencias Computacionales - inaoe

Dra. María del Pilar Gómez Gil
Coordinación de Computación
Instituto Nacional de Astrofísica, Óptica y Electrónica
Oficina 8228
[email protected], [email protected]
http://ccc.inaoep.mx/~pgomez
Presentación disponible en:
http://ccc.inaoep.mx/~pgomez/temasTesis.pdf
V:2014-10-24
(c) P. Gómez, INAOE 2014
[email protected]
1
Laboratorios/líneas de investigación
en CCC
1. Aprendizaje y Reconocimiento de Patrones
2. Cómputo Reconfigurable y de Alto Desempeño
3. Procesamiento de Bio-Señales y Computación
Médica
4. Cómputo y Procesamiento Ubicuo
5. Robótica
6. Tecnologías de Lenguaje
7. Visión Computacional
(c) P. Gómez, INAOE 2014
[email protected]
2
Mi participación en investigación
Formo parte de:
 Laboratorio de Aprendizaje Automático y
Reconocimiento de Patrones (MLPR),
 Laboratorio de Cómputo y Procesamiento Ubicuo
(CPU)
 Grupo de procesamiento de señales e Inteligencia
Computacional (PSIC)
 PSIC está formado por investigadores y estudiantes de
las coordinación de Electrónica y de Ciencias de la
computación
(c) P. Gómez, INAOE 2014
[email protected]
3
Áreas de interés de PGG
 Redes Neuronales Artificiales (RNA) aplicadas en
problemas de:
 Reconocimiento de patrones
 Clasificación estática y temporal
 Predicción
 Diseño de RNA
 Otras áreas de inteligencia computacional
aplicadas a dichos problemas (Lógica Difusa y
Algoritmos Evolutivos)
(c) P. Gómez, INAOE 2014
[email protected]
4
Las Redes Neuronales Artificiales
 Son modelos matemáticos capaces de adaptar su
comportamiento en respuesta a ejemplos presentados
por el medio ambiente de manera supervisada o no
supervisada (esto es aprendizaje automático!)
 Están inspiradas en la construcción del cerebro y las
neuronas biológicas.
 Una red neuronal artificial es un procesador paralelo y
distribuido, hecho de varios procesadores simples, que
puede almacenar y utilizar conocimiento adquirido de
la experiencia (Haykin 2009).
(c) P. Gómez, INAOE 2014
[email protected]
5
El Contexto de Redes Neuronales
(Gómez-Gil, 2009)
Entradas
RNA
Salidas
Ejemplos
(medio
ambiente)
(c) P. Gómez, INAOE 2014
[email protected]
conocimiento
6
Aprendizaje basado en ejemplos
 Las redes neuronales son capaces de modificar su
comportamiento en respuesta al medio ambiente,
el cual es “presentado a la red” a través de ejemplos
significativos del problema.
 Para una red neuronal, aprender significa
modificar los valores de los pesos (números
reales), siguiendo una estrategia determinada
conocida como “algoritmo de aprendizaje.”
(c) P. Gómez, INAOE 2014
[email protected]
7
Hay muchos tipos de RNA’s…
algunos “típicos”
(c) P. Gómez, INAOE 2014
[email protected]
8
Hay muchos tipos de RNA’s… otros
mas “interesantes”…
(c) P. Gómez, INAOE 2014
[email protected]
9
Características de mi investigación
RETOS
AREAS DEL
CONOCIMIENTO
AREAS DE
APLICACIÓN
Con respecto a DATOS:
• ruidosos
• clases sobrepuestas
• muy pocos
• difíciles de
caracterizar
• se requieren
fusionar
• etc…
•Clasificación estática
•Clasificación temporal
•Predicción
•Teoría de RNA
•Brain Computer
Interfaces
• Biométrica
• Diagnóstico médico
• Economía y Finanzas
• Astrofísica
• Mobile Phone sensing
• Reconocimiento de
escritura
(c) P. Gómez, INAOE 2014
[email protected]
10
Principales Proyectos vigentes de PGG
Sistemas de aproximación de valores futuros en
series de tiempo no estacionarias mediante
modelos conexionistas recurrentes y análisis
multi-resolución (proyecto CONACYT CB-2010)
(finanzas, economía, clima etc.) (PSIC)
2. Clasificación y predicción temporal de señales
EEG con aplicación a interfaces cerebrocomputadora (BCI, diagnóstico médicoepilepsia). (PSIC)
3. Priscus: Reconocimiento automático de escritura
manuscrita en documentos antiguos
1.
(c) P. Gómez, INAOE 2014
[email protected]
11
SOBRE PLAN DE ESTUDIOS
PERIODO 1
(OTOÑO)
Matemáticas
para
computación
PERIODO 2
(PRIMAVERA)
Curso área
prioritaria
PERIODO 3
(VERANO)
Curso área
escogida
PERIODO 4
(OTOÑO)
PERIODO 5
(PRIMAVERA)
PERIODO &
(VERANO)
Preparación
de tesis
Preparación
de tesis
Terminación
de tesis
Diseño y análisis Curso área
Curso
de algoritmos
prioritaria área de soporte
Curso básico
área 1
Curso otra área
Seminario
Curso básico
área 2
Curso otra área
Seminario de
metodología
Seminario
(c) P. Gómez, INAOE 2014
[email protected]
12
Cursos posiblemente requeridos para
mis proyectos
1.
2.
3.
4.
5.
6.
Procesamiento digital de señales
Inteligencia Computacional I
Inteligencia Computacional II
Reconocimiento de patrones
Aprendizaje Computacional II
Procesamiento de bio-señales
(c) P. Gómez, INAOE 2014
[email protected]
13
(c) P. Gómez, INAOE 2014
[email protected]
14
Temas de tesis de maestría propuestos
por proyecto (1/2)
PROYECTO
TEMA a desarrollarse en 2015
Sistemas de aproximación de valores
futuros en series de tiempo no
estacionarias mediante modelos
conexionistas recurrentes y análisis
multi-resolución
* Mejoras a la red neuronal HCNN a través de
aprendizaje de fases en los generadores armónicos, y
otras herramientas de procesamiento de señales.
(ASIGNADO)
Clasificación temporal y predicción de
señales EEG con aplicación a
reconocimiento de enfermedades y a
interfaces cerebro-computadora (BCI).
•Asignación de clases temporales a través de lógica
difusa
• Predicción de eventos ictales basado en EEG
• Predicción de eventos hipotensos súbitos en salas de
terapia intensiva
•Prediccion/clasificación en otras señales biológicas
• Selección de funciones wavelts madre para redes
wavelets aplicadas a clasificación/predicción
(c) P. Gómez, INAOE 2014
[email protected]
15
Temas de tesis de maestría propuestos
por proyecto (2/2)
PROYECTO
TEMA a desarrollarse en 2015
Priscus
• Uso de la red neuronal “Long-short term
Memory” (LSTM) para reconocimiento de
palabras
• Uso de técnicas conexionistas para
identificación de áreas de interés en textos
antiguos
(c) P. Gómez, INAOE 2014
[email protected]
16
(c) P. Gómez, INAOE 2014
[email protected]
17
Resumen
 Este proyecto contiene varias vertientes, una de ellas
tiene que ver con la clasificación de eventos, a través de
analizar señales de Electro-encefalogramas
 Este proyecto se realiza en colaboración con el grupo
de BCI de la coordinación de electrónica.
 Actualmente hay varias tesis de maestría y doctorado
involucradas
(c) P. Gómez, INAOE 2014
[email protected]
18
Resumen
 Este proyecto contiene varias vertientes, una de ellas
tiene que ver con la clasificación de eventos, a través de
analizar señales de Electro-encefalogramas
 Este proyecto se realiza en colaboración con el grupo
de BCI de la coordinación de electrónica.
 Actualmente hay varias tesis de maestría y doctorado
involucradas
(c) P. Gómez, INAOE 2014
[email protected]
19
Interfaz cerebro-computadora
No exige ninguna
actividad muscular
Permite controlar
dispositivos
Actividad cerebral
[Carrera-León 2010]
(c) P. Gómez, INAOE 2014
[email protected]
20
Ejemplo de una estructura básica
de un sistema BCI
[D’croz Barón 2010]
(c) P. Gómez, INAOE 2014
[email protected]
21
Obtención de señales
Usando el casco…
[Ramírez et al 2010]
Datos obtenidos de un casco EEG
(c) P. Gómez, INAOE 2014
[email protected]
22
Existe Software para análisis de
ECG…
[Ramírez-Cortés et al. 2010]
(c) P. Gómez, INAOE 2014
[email protected]
23
Un clasificador Adaptivo
MEDIDAS
SENSADO
PREPROCESAMIENTO
Y EXTRACCION DE
VECTOR DE CARACTERÍSTICAS
CARACTERÍSTICAS
CLASSES
OBJETOS
ANÁLISIS
DEL
CONTEXTO
DECISION
APRENDIZAJE
[Tao & Gonzalez 74]
(c) P. Gómez, INAOE 2014
[email protected]
24
Algunos retos en este proyecto
 La identificación de los eventos no puede realizarse
simplemente analizando la señal en el tiempo
 Hay muchos trabajos actualmente sobre el tema, pero
sus resultados no son tan buenos como se desea
 Se requiere analizar tanto la parte de extracción de
características como la de clasificación. Nosotros nos
concentraremos en la clasificación
(c) P. Gómez, INAOE 2014
[email protected]
25
Proyectos posibles
• Asignación de clases temporales a través de lógica
•
•
•
•
difusa
Predicción de eventos ictales basado en EEG
Predicción de eventos hipotensos súbitos en salas
de terapia intensiva
Prediccion/clasificación en otras señales biológicas
Selección de funciones wavelts madre para redes
wavelets aplicadas a clasificación/predicción
(c) P. Gómez, INAOE 2014
[email protected]
26
Para conocer un poco mas de este
proyecto leer..




2010. Gómez-Gil P, García-Pedrero A and Ramírez-Cortes JM. “Composite Recurrent Neural Networks
for Long-Term Prediction of Highly-Dynamic Time Series Supported by Wavelet Decomposition”,
Soft Computing for Intelligent Control and Mobile Robotics, Vol. 318/2011, pp.253-268, Castillo O,
Janusz K and Pedrycz W. Editors, Springer-Verlag. DOI:10.1007/978-3-642-15534-5_16 (para conocer
algo sobre redes neuronales recurrentes)
2010. Luna-Pérez, R, Gómez-Gil, P. “Unconstrained Handwritten Word Recognition Using a
combination of Neural Networks.” Lecture Notes in Engineering and Computer Science -Proceedings
of the 2010 Word Congress on Engineering and Computer Science (WCECS 2010) – International
Conference on Soft Computing and Applications (ICSCA 10), San Francisco, USA. Vol. 1, pp. 525 - 528.
Eds. Ao SI, Douglas C, Grundfest WS, Burgstone J. International Association of Engineers. (para
conocer algo sobre clasificación temporal)
2010. Ramírez-Cortés JM, Alarcón-Aquino V, Rosas-Cholula G, Gómez-Gil P, Escamilla-Ambrosio J.
“P-300 rhythm detection using ANFIS algorithm and wavelet feature extraction in EEG signals”.
Lecture Notes in Engineering and Computer Science -Proceedings of the 2010 Word Congress on
Engineering and Computer Science (WCECS 2010) – International Conference on Soft Computing
and Applications (ICSCA 10), San Francisco, USA, Vol. 2186, pp. 619 - 623. Eds. Ao SI, Douglas C,
Grundfest WS, Burgstone. (para conocer algo sobre clasificación en BCI)
Página de PhysioNet www.physionet.org
(c) P. Gómez, INAOE 2014
[email protected]
27
(c) P. Gómez, INAOE 2014
[email protected]
28
Resumen
 PRISCUS es un proyecto para la construcción de un sistema
lector de documentos manuscritos antiguos y modernos.
Su objetivo es desarrollar un software inteligente integral.
 Está basado en redes neuronales artificiales y otros
componentes de inteligencia computacional y
entendimiento de lenguaje.
 Se busca la mejor implementación posible a problemas que
aún son abiertos, tales como: segmentación de escritura
continua, entendimiento de texto completo en base a
clasificación de caracteres y palabras, e identificación de
palabras
 Se están iniciando colaboraciones con un grupo en Grecia.
(c) P. Gómez, INAOE 2014
[email protected]
29
El reconocimiento de manuscritos
es un reto!
[Spinola & Linares 2000]
(c) P. Gómez, INAOE 2014
[email protected]
30
Un OCR para documentos manuscritos
1.
Digitalización
Documento
original
3.
Segmentación
de palabras
2. Preprocesamiento
Imagen digital
imagen limpia
Words
Objetos de
caracteres
Parámetros de
entrenamiento
7.
Entrenamiento
del reconocedor
6. Reconocimiento
de caracteres/
palabras
8.
Identificación
de palabras
Posibles palabras
Diccionario
(c) P. Gómez, INAOE 2014
[email protected]
Conocimiento
de la RNA
Conocimiento
de la RNA
Objetos con
caracteres
4.
Segmentación de
caracteres/palabras
y extracción de
características
Palabras en el texto
Parámetros
para
entrenamiento
Segmentación
para
entrenamiento
5.
Entrenamiento
de la
segmentación
Posibles caracteres
10.
Corrección
de estilo
[Gómez-Gil et al. 2007]
Transcripción del
documento
31
Algunos retos en este proyecto
 El modelo de reconocimiento de caracteres debe
utilizar información probabilística a fin de reconocer
palabras y utilizar el contexto.
 El sistema de segmentación de caracteres requiere
implementarse
 Definir un de sistema de formación de sentencias
basado en procesamiento de lenguaje natural
(c) P. Gómez, INAOE 2014
[email protected]
32
Para conocer un poco mas de este
proyecto ver las publicaciones
listadas en la página:
http://cpulabserver.inaoep.mx/~priscus/paginaPriscus/
(c) P. Gómez, INAOE 2014
[email protected]
33
Referencias
 2010. Carrera-León, O. “Análisis en tiempo-frecuencia para extracción de
características y clasificación de señales EEG; Interfaces BCI.” Propuesta de
tesis de maestría, coordinación de electrónica, INAOE.
 2010. D’Croz Barón, D.F. “Reconocimiento de imaginación Motora de señales
EEG en el dominio temporal”, Propuesta de tesis de maestría, coordinación de
electrónica, INAOE
 2010. Gómez-Gil P. Las Matemáticas del Aprendizaje Automático Conexionista
y su Aplicación en TI. Conferencia Plenaria. Tercer Foro de Matemáticas
Aplicadas en las Tecnologías de Información. 21 de Mayo del 2010
 2010. Ramírez-Cortés JM, Alarcón-Aquino V, Rosas-Cholula G, Gómez-Gil P,
Escamilla-Ambrosio J. “P-300 rhythm detection using ANFIS algorithm and
wavelet feature extraction in EEG signals”. Lecture Notes in Engineering and
Computer Science -Proceedings of the 2010 Word Congress on Engineering
and Computer Science (WCECS 2010) – International Conference on Soft
Computing and Applications (ICSCA 10), San Francisco, USA, Vol. 2186, pp. 619
- 623. Eds. Ao SI, Douglas C, Grundfest WS, Burgstone J. International
Association of Engineers.
(c) P. Gómez, INAOE 2014
[email protected]
34
Proyectos posibles
• Uso de la red neuronal “Long-short term
Memory” (LSTM) para reconocimiento de palabras
• Uso de técnicas conexionistas para identificación
de áreas de interés en textos antiguos
(c) P. Gómez, INAOE 2014
[email protected]
35
[email protected]
[email protected]
INAOE, Tonantzintla Puebla, oficina 8228
(222) 266-3100 ext. 8228
(c) P. Gómez, INAOE 2014
[email protected]
36