« Volver Ficha del Documento

SEGMENTACIÓN AUTOMÁTICA DE LA GLOTIS EN VIDEOS ENDOSCÓPICOS DE ALTA VELOCIDAD UTILIZANDO COLORES Y FORMAS CARACTERÍSTICAS DE LAS REGIONES GLOTALES

2018

Para analizar y diagnosticar enfermedades y disfunciones vocales es indispensableanalizar visualmente las cuerdas vocales en acción. El uso de cámaras de alta velocidades la mejor forma de capturar el ciclo de fonación de las cuerdas vocales en gran detalle,pero debido a la inmensa cantidad de datos generado por estas cámaras se vuelvenecesario desarrollar técnicas automáticas para procesar estos videos de alta velocidad(HSV), en particular técnicas de segmentación automática de la glotis.Se plantean como objetivos para esta memoria implementar un método de segmentación automática de la glotis en HSV, evaluar cuantitativamente dicho método y compararlocon otros métodos existentes, investigar la utilidad del uso de la información decolor de los videos en la segmentación, e investigar la utilidad del uso de técnicas demachine learning en la segmentación.En esta memoria se implementa el paper [14] que describe un método automáticode segmentación de la glotis en HSV. Este método se basa en la aplicación de un umbralflexible, comparación de descriptores de Fourier, aplicación de contornos activos,machine learning y cálculo de una imagen de probabilidad a partir de las propiedadesde color de las glotis segmentadas, entre otras cosas. Se proponen varias mejoras:Cambios en la comparación de descriptores de Fourier, en la comparación de las propiedadesde color, resolución de colisiones en la segmentación y el cálculo de una ROIinicial a partir de la varianza de cada pixel a lo largo del video. También se desarrollóuna versión para videos en escala de grises, y se evaluó cuantitativamente el algoritmoutilizando el coeficiente Dice y el error de área.Los resultados muestran que el algoritmo original no entrega muy buenos resultados,pero al implementar las modificaciones propuestas se logran mejoras significativas.Se concluye que la información de color de los videos no debiera descartarse yaque puede ayudar a la segmentación, y que con la cantidad de datos de entrenamientolimitada que se tiene, la parte de machine learning del algoritmo no funciona lo suficientementebien.

Universidad Técnica Federico Santa María - Repositorio Institucional Bibliotecas USM - RIBUSM

Rimsky Espindola Astudillo

Valparaiso, Av. España 1680, Edificio U


Dirección: Av. Mariscal Antonio José de Sucre N58-63 y Fernández Salvador Edif. Olade - San Carlos, Quito - Ecuador.

Web: www.olade.org

Teléfonos: (593 2) 259 8122 / 2598 280

Correo: realc@olade.org

ADMIN
Desarrollado por: Aikyu-Systems