Logo
DATOS DEL INVESTIGADOR PRINCIPAL
Nombre JOHANY ARMANDO CARREÑO GAMBOA
Nombre del perfíl Investigador Por Proyecto
Grupo de investigación Sistemas y Computación
Línea de investigación Construcción de software y descubrimiento de conocimiento en bases de datos (kdd)
Equipo del proyecto
TÍTULO DEL PROYECTO Fase 2: Despliegue de aplicaciones de minería de datos y análisis de datos clínicos sobre los niveles de servicio compatibles con la infraestructura de red en malla – GRID del Politécnico Grancolombiano
PALABRAS CLAVE GRID Computing, Descubrimiento de Conocimiento, Datos Clínicos, Procesamiento Masivo y Distribuido, Neurología
OBJETIVOS DEL PROYECTO Objetivo General: Diseñar e implantar un portal dinámico que aloje información concerniente a diferentes tipos de neuropatías y despliegue de aplicaciones de minería de datos y análisis de datos clínicos sobre los niveles de servicio compatibles con la infraestructura de red en malla – GRID del Politécnico Grancolombiano, que puede ser usada por diferentes organizaciones comunitarias a través de RENATA.

Objetivos específicos:
a. Realizar y documentar la revisión bibliográfica y estructura de conceptos relacionados
b. Analizar la información derivada del objetivo especifico 1
c. Analizar y diseñar los requerimientos para la implantación del GRID Institucional
d. Implantar y realizar las pruebas de funcionamiento del GRID Institucional
e. Analizar y diseñar los requerimientos de la aplicación de minería de datos y análisis de datos clínicos sobre los niveles de servicio compatibles con la infraestructura de red en malla – GRID del Politécnico Grancolombiano
f. Integrar la aplicación al GRID Institucional
g. Diseñar, ejecutar y documentar las pruebas de integración y análisis de resultados
PERTINENCIA ESPISTEMOLÓGICA DEL PROYECTO GRID Colombia colocó a consideración de las universidades, una propuesta para la conformación de un grupo de investigación e innovación en Infraestructura y Aplicaciones para ambientes GRID, con quienes se conformó un equipo técnico de especialistas (Grupo GRID Colombia), del cual es miembro activo el Politécnico Grancolombiano Institución Universitaria, que ha venido trabajando en la adquisición de conocimiento y el diseño de aplicaciones que requieren las instituciones universitarias, los centros médicos y las soluciones que el mercado demanda.

El uso y aprovechamiento de tecnologías de información y comunicación (TICs) abren un amplio margen de aplicación en el manejo, análisis y difusión de información para diferentes propósitos. La academia y la gestión gubernamental a nivel nacional, regional y local, se pueden ver considerablemente beneficiadas del uso de las TICs. El relativo bajo costo actual de los elementos tecnológicos asociados a las TICs, y la consolidación de la infraestructura necesaria en nuestro país (RENATA, Redes de Nueva Generación - NGN, Redes Móviles, GRIDs Institucionales, entre otros), hacen aun más factible su aplicación. Es de destacar que el elemento esencial de las TICs es el recurso humano necesario para desarrollar y mantener los servicios basados en este tipo de tecnologías.

El diseño, montaje y puesta en operación de servicios de procesamiento distribuido tipo malla - GRID a través de la Red Académica de Alta Tecnología Avanzada – RENATA, incluirá información inherente a diferentes neuropatías como: diagnósticos, registros electro-encefalográficos, imágenes, etc. Adicionalmente incluirá técnicas novedosas relacionadas con el procesado de registros electro-encefalográficos que permitirán explorar, caracterizar y clasificar entre diferentes tipos de patologías como métodos de diagnóstico neurológico no invasivos. Con este fin la herramienta podría ser usada para estudiar el comportamiento de diferentes tipos de patologías neurológicas, epilepsia, demencia, alcoholismo, drogadicción, enfermedad de Parkinson, enfermedad vascular - cerebral y neuropatías periféricas. Los índices obtenidos podrían ser usados para caracterizar el comportamiento neurológico en diferentes patologías a ser estudiadas, lo que llevaría al uso de herramientas de diagnóstico no invasivas con el fin de ofrecer a la comunidad una serie de servicios de salud que permitiría aumentar la calidad de vida de los Colombianos. Todo esto contribuiría a divulgar nuestra producción nacional de salud y de bioingeniería al mundo, la normalización de las bases de datos de los centros médicos del País, la creación de una bodega de datos de las señales fisiológicas obtenidas en las diferentes patologías, así como también la creación de estadísticas epidemiológicas al día con el fin de contribuir a la toma de decisiones en las políticas de salud.

Importancia para la Comunidad
1.Contribuye al aprendizaje de nuevas técnicas para el tratamiento de diagnósticos en el área de neurología
2.Ayuda a la comunicación entre médico-pasante para su intercambio de información
3.Apoya a las entidades Gubernamentales en la toma de decisiones.

Importancia para el Estudiante
1.Permite la aplicación de los conocimientos obtenidos durante la carrera para el desarrollo de una herramienta de software
2.Construye una aplicación basada en software libre, haciendo de esta aplicación una herramienta accesible para la comunidad
3.Afianza conocimientos en el modelado de sistemas
4.Logra la comprensión de nuevas técnicas de desarrollo de software.

Importancia para los Investigadores
1.Aporta a la academia y las dependencias Gubernamentales de salud, conocimiento para la construcción de aplicaciones y servicios orientados al análisis de datos clínicos.
RELEVANCIA DEL PROYECTO PARA LA INSTITUCIÓN Y PARA LOS BENEFICIARIOS DEL PROYECTO Actualmente, la Facultad de Ingeniería y Ciencias Básicas ofrece los programas de Ingeniería de Sistemas e Ingeniería en Telecomunicaciones a nivel pregrado, la especialización en Gerencia de Proyectos de Telecomunicaciones y muy pronto una maestría, que requieren de laboratorios especializados de conocimiento en redes avanzadas y espacios propicios para la investigación, creación de nuevos productos y servicios y entrenamiento en el manejo de las tecnologías existentes y futuras.

Por todo lo anterior, el proyecto va dirigido al sector académico (Universidades que conforman a RENATA, Grupo GRID Colombia), sector médico de Bogotá, todas las comunidades y/o individuos que tengan acceso a internet con el propósito de: conocer más acerca de patologías neurológicas, avances, investigaciones recientes, nuevos tratamientos, así como, aportes a investigaciones en el área.
Dentro de los usuarios específicos podemos encontrar:
- Estudiantes de pregrado, postgrado y pasantes de medicina
- Estudiantes de pregrado, postgrado y pasantes de ingeniería de sistemas y telecomunicaciones
- Especialistas, personal médico y técnico del servicio de Neurología
- Epidemiólogos
- Pacientes
- Comunidad en general
- Redes de alta velocidad
- Organizaciones No Gubernamentales
- Dependencias gubernamentales de salud y de otras áreas de desarrollo social
- Otras instancias del Politécnico Grancolombiano involucradas con el servicio comunitario.
Uno de los puntos importantes de este proyecto, es la apropiación y el desarrollo de conocimiento y tecnología en el país, entre otros:
Para la comunidad
1.Permite que el diagnóstico de los pacientes pueda ser accedido por otras organizaciones o médicos que colaboren con técnicas más avanzadas y novedosas para el tratamiento del paciente, así como también, estas organizaciones pueden beneficiarse de la información publicada en el portal
2. Permite a los médicos publicar sus trabajos realizados de forma que éstos puedan ser vistos por otros médicos o pasantes de una manera más dinámica.
3. Permite a los estudiantes el desarrollo de proyectos de tesis de pregrado, especialización y maestría.
Para el Estudiante
1. Incorpora y fortalece valores personales relativos al deber del servicio social pertinente.
2. Genera un espacio para el desarrollo de capacitaciones de manera práctica sobre la plataforma GRID que se encuentre en el laboratorio.
Para los Investigadores
1. Incorpora métodos y técnicas con énfasis en la participación social, para la solución de problemas comunitarios
2. Desarrolla una actitud activa como actor social, para la transformación racional y consensuada de realidades comunitarias
3. Contribuye con los estudiantes para alcanzar satisfactoriamente su labor profesional y social.
PROBLEMA DE INVESTIGACIÓN Para Colombia es indispensable fortalecer las capacidades de colaboración y cooperación entre las instituciones de educación superior, centros e Instituciones Gubernamentales de Salud. Un componente importante en este contexto es el desarrollo de un servicio de computación de alto desempeño distribuido a escala nacional que aprovecha las ventajas de la red nacional de tecnología avanzada RENATA en búsqueda de un bien común.

La evolución en el uso de infraestructuras de cómputo distribuido ha dado lugar al surgimiento de tecnologías de alta complejidad, y un primer paso hacia la construcción y uso de un grid nacional que debe procurarse es “Cómo lograr la implantación de aplicaciones sobre los niveles de servicio compatibles con la infraestructura del GRID Colombia”.
La propuesta de grid nacional, Grid Colombia, reúne actualmente a 12 universidades y está abierta a la incorporación de más instituciones. En este contexto, se propone la realización del proyecto “Despliegue de aplicaciones de minería de datos y análisis de datos clínicos sobre los niveles de servicio compatibles con la infraestructura de red en malla – GRID del Politécnico Grancolombiano” como una iniciativa que permita la agregación del Politécnico Grancolombiano al GRID Colombia. De esta manera se abren las puertas a nuevos convenios con entidades gubernamentales nacionales y, se consolidan alianzas con organizaciones internacionales relacionadas con el tema; por una parte la Universidad de los Andes de Venezuela, por otra parte con el grupo Grid Nacional y la Open Science Grid (OSG) de los Estados Unidos, permitiendo el acceso a material de capacitación en tecnologías avanzadas.
METODOLOGÍA Tipo de Investigación: Investigación Aplicada, se pretende la utilización de los conocimientos en la práctica, para aplicarlos, en provecho de la sociedad y la investigación médica.

Universo de Investigación: El universo del estudio está dado por la población asistida en los Centros Médicos especializados en Neurología de Bogotá. Estudiantes de Pregrado y Postgrado de Medicina, Epidemiólogos y el apoyo del Departamento de Tecnología del Politécnico Grancolombiano.

Tamaño y Característica de la Muestra: La muestra seleccionada está dada por la población con problemas neurológicos de la ciudad de Bogotá, que son atendidos en un centro médico especializado en Neurología, y según investigaciones realizadas la prevalencia de enfermedades neurológicas en Colombia es de 20 por mil habitantes. Se selecciono la ciudad capital, basados en el hecho que tuviera un centro clínico especializado en neurología con un neurólogo clínico entrenado, una universidad con Facultad de Medicina especializada en Neurología, una universidad con infraestructura de red para la implantación del GRID y facilidad de acceso a la Red Nacional de Alta Velocidad (RENATA).

Técnicas de Recolección y Procesamiento de la Información: Para la recolección de la información se pretende realizar las siguientes actividades: revisión bibliográfica de fuentes virtuales, bibliotecas, hemerotecas, entrevistas con expertos y exploración de las bases de datos de los centros médicos, que contribuirán a la conceptualización y conformación de nichos conceptuales sobre el problema. El procesamiento se realizará a través de la gestión de bases de datos, bodegas de datos y el uso de técnicas de minería de datos.
RESULTADOS ESPERADOS Diseñar e implantar un portal dinámico que aloje información concerniente a diferentes tipos de neuropatías de manera que pueda ser accedido por las universidades que pertenecen a RENATA y diferentes organizaciones comunitarias.
DURACIÓN DEL PROYECTO
POSIBLES FUENTES DE FINANCIACIÓN EXTERNA
REVISIÓN BIBLIOGRÁFICA Descubrimiento de Conocimiento en Datos Clínicos
Los administradores y especialistas de los centros médicos y hospitalarios requieren ayuda para explorar y analizar grandes volúmenes de datos clínicos con el objeto de tomar buenas decisiones. El objetivo primordial de éste proyecto es ilustrar cómo usar la tecnología GRID y la minería de datos en el análisis de datos clínicos, descubrimiento de patrones de comportamiento de enfermedades, y mostrar cómo las herramientas de simulación y análisis existentes incorporan técnicas especializadas diseñadas para ayudar a los científicos y a los funcionarios de la salud a usar modelos matemáticos y estadísticos, con el propósito de descubrir y comprender patrones de comportamiento a partir de datos de observación o de resultados de experimentos. Se incluyen las técnicas, el poder de cómputo de los ambientes GRID y el aporte a la rama de investigación en el sector salud.
Al llegar a este punto los nuevos sistemas deben permitir de una manera cómoda y eficaz:
1. Asociación de síntomas y clasificación diferencial de patologías.
2. Estudio de factores (genéticos, precedentes, hábitos alimenticios, etc.) de riesgo/salud en distintas patologías.
3. Segmentación de pacientes para una atención más inteligente según su grupo.
4. Predicciones temporales de los centros asistenciales para el mejor uso de los recursos, consultas, salas y habitaciones.
5. Estudios epidemiológicos, análisis de rendimientos de campañas de información, prevención, sustitución de fármacos, entre otros.

Sistemas de Análisis de Datos Habilitados en Ambientes GRID
Los dos componentes principales de un sistema de análisis de datos habilitado en Grid (DataGrid) son el servidor y el cliente de análisis de datos.
El servidor está basado en la integración de una herramienta especializada en el descubrimiento de conocimiento en datos clínicos. Cada máquina participante en un ambiente GRID corre el componente del servidor, el cliente DataGrid es responsable de aceptar una tarea de aprendizaje, de la entrada de datos de un usuario y distribuir el trabajo en el GRID. El cliente implementa la funcionalidad necesaria para balancear la carga y para monitorear y recuperar las fallas. También le permite al usuario especificar las limitaciones de recursos para una tarea dada y tiene en cuenta esto cuando asigna los trabajos a los servidores. El servidor traduce las peticiones de los clientes en llamadas a las funciones de DataGrid correspondientes. También provee funciones adicionales como recuperación de grupos de datos de almacenamiento local después de un daño. El mismo servidor puede ser usado por varios clientes diferentes, lo cual permite a los usuarios compartir recursos de la misma máquina.

REFERENCIAS BIBLIOGRÁFICAS
- Cios, K. J. (2001). Medical Data Mining and Knowledge Discovery, ed. –Heidelberg, New York; Physica-Verl.
- Dubitzky. W. (2008). Data Mining Techniques in Grid Computing Environments. Willey-BlackWell. USA.
- Hernández Orallo, José. et al. (2004). Introducción a la Minería de Datos, Pearson Educación S.A., Madrid, ISBN: 84-205-4091-9.
- Ian H. Witten and Eibe Frank (2005). "Data Mining: Practical machine learning tools and techniques", 2nd Edition, Morgan Kaufmann, San Francisco.
- Kargupta, H., et. al. (2009).Next Generation of Data Mining, CRC Press, Boca Ratón, FL.
- Magoules, F. et. al. (2009). Introduction to Grid Computing. CRC Press, Boca Ratón, FL.
- Moreno, María., et al. (2002). Obtención y Validación de Modelos de Estimación de Software Mediante Técnicas de Minería de Datos, Revista Colombiana de Computación, Volumen 3, número 1, 53 – 71.
- Oktaba, H. and Piattini, M. ().Software Process Improvement for Small and Medium Enterprises: Techniques and Case Studies. Information Science Reference, USA.
- Pizzi, L.C., Ribeiro, M.X., Vieira, M.T.P. (2005). Analysis of Hepatitis Dataset using Multirelational Association Rules, ECML/PKDD Discovery Challenge.
- Taniar, D., et. al. (2008). High Performance Parallel Database Processing and Grid Databases, Wiley, New Jersey.
- Wang, L. and Jie, W. and Chen, J. (2009). Grid Computing: Infrastructure, Service, and Applications, CRC Press, Boca Ratón, FL.
ENTREGABLES
CRONOGRAMA
TIPO DESCRIPCIÓN F.INICIO F.FINAL
Actividad Revisión en bibliotecas y bases de datos bibliográficas 01/02/2011 26/08/2011
Actividad Análisis, relación, filtrado y documentación de los conceptos relevantes adquiridos 01/03/2011 26/08/2011
Actividad Modelado 01/03/2011 30/05/2011
Actividad Evaluación 04/04/2011 29/07/2011
Actividad Desarrollo 01/08/2011 28/10/2011
Actividad Integración de la aplicación al Grid Institucional 01/09/2011 26/11/2011
Actividad Ejecución de pruebas de integración y análisis de resultados 01/08/2011 26/11/2011
Actividad Diseño de la documentación 01/02/2011 26/11/2011
Entregable Artículo divulgación 01/11/2011 26/11/2011
Entregable Presentar los resultados ante la dirección de investigaciones de la FICB y de la Universidad: incluye software 01/02/2011 01/12/2011
PEDIDO DE BIBLIOGRAFÍA
AUTOR TÍTULO EDITORIAL
James Harrison Clinical Data Mining and Warehousing, An Issue of Clinics in Laboratory Medicine Saunders
Irwin Epstein Clinical Data Mining in Practice-Based Research: Social Work in Hospital Settings Routledge
Patricia Cerrito Clinical Data Mining for Physician Decision Making and Investigating Health Outcomes: Methods for Prediction and Analysis Medical Information Science Reference
Patricia Cerrito Cases on Health Outcomes and Clinical Data Mining: Studies and Frameworks Medical Information Science Reference
ANEXOS