Wed, 21 Nov 18 .


Escuela de Ingeniería Electrónica



(:selectlang:)

Repositorio de Tesis de Procesamiento Digital de Señales (DSP)

Page: Maestria.RepositorioTesisPDS - Last Modified : Tue, 30 Oct 18

Active Dictionary Models: A framework for non-linear shape modeling.

Autor: Carl Michael Grüner Monzón

Fecha de Publicación: 16 de mayo de 2015

Resumen

El modelado de forma tiene aplicaciones en áreas de la ciencia y la industria. Los algoritmos clásicos se basan en métodos lineales y en distribuciones normales unimodales que no son apropiados para modelar deformaciones presentes en señales naturales. Este trabajo presenta un nuevo modelo de forma basado en aprendizaje de diccionario capaz de representar estas deformaciones.

En primer lugar se entrena un diccionario mediante K-SVD y OMP. Posteriormente éste se utiliza como modelo para representar formas mediante un vector disperso. Se demuestran las capacidades de reducción de ruido aditivo del modelo con la limitante de que el mismo puede representar también formas inválidas.

Posteriormente, para compensar la limitación del modelo de diccionario, se desarrolla un método de filtrado de ruido no lineal basado en proyecciones ortogonales sobre una variedad. Esta extensión asegura que la forma de salida sea válida.

Finalmente se presenta el algoritmo iterativo completo. En esta etapa, la aplicación ofrece una primera aproximación de la forma que se desea segmentar. Ésta se modela utilizando el diccionario y seguidamente se proyecta al manifold donde se asegura que la aproximación actual sea una forma válida. Este proceso se repite hasta que se alcanza el criterio de convergencia establecido. Se demuestra cómo el método propuesto es capaz de modelar deformaciones de forma tanto lineales como no-lineales con alto grado de éxito.

Palabras clave: aprendizaje de diccionario, K-SVD, modelo de forma, OMP, variedad.

Descargar Documento: active_dictionary_models_framework_non-linear.pdf


Detección de manos en imágenes de profundidad mediante el uso de bosques de decisión aleatorios.

Autor: Edison Fernández Alvarado

Fecha de Publicación: 19 de junio de 2015

Resumen

En el presente trabajo se propone un sistema para la detección de manos en imágenes de profundidad. Para realizar dicho cometido, se hace uso de bosques de decisión aleatoria con los cuales se hace una segmentación de la escena en 5 clases definidas: cabeza, brazos, cuerpo, manos y fondo.

Una vez segmentada la escena, mediante el algoritmo de componentes conectados, se procede a agrupar conjuntos de pixeles clasificados como pertenecientes a la misma clase en regiones. A partir de estas regiones se genera una lista de candidatos a mano mediante la validación de los componentes obtenidos.

Mediante la utilización del algoritmo de Dijkstra, se encuentran puntos a una distancia geodésica máxima de 50 cm del candidato a mano y sobre esta ruta se obtiene un histograma de clases el cual es utilizado como descriptor para que, mediante el uso de máquinas de vectores de soporte, se clasifiquen los candidatos como mano o no mano.

Con la propuesta realizada se alcanzan tasas de reconocimiento del 83,05% sobre una base de datos sintética de 80000 imágenes.

Palabras clave: Kinect, imágenes en profundidad, bosques de decisión aleatorios, componentes conectados, distancias geodésicas, Dijkstra, máquinas de vectores de soporte.

Descargar Documento: deteccion_manos_imagenes_profundidad_mediante.pdf


Modelado de forma de larvas utilizando máquinas restringidas de Boltzmann.

Autor: David Soto Vásquez

Fecha de Publicación: 23 de mayo de 2015

Resumen

La oclusión y presencia de formas incompletas en imágenes digitales de estructuras vermiformes como las larvas dificultan los procesos automatizados de segmentación y conteo de las mismas. El presente trabajo aporta un método que considera la información parcial de forma tomada de una imágen para regenerar el borde de una larva de acuerdo a la información global y local previamente aprendida a partir de datos disponibles. La oclusión se puede observar como un caso especial de forma incompleta y por tanto es considerado por el método.

El presente trabajo tiene como objetivo principal el desarrollo de un modelo de forma que incluya la información global y local de la estructura que representa a una larva y que a su vez sea invariable a las modificaciones causadas por la rotación, traslación y cambio de escala. La solución propuesta se basa en el uso del contorno de la larva, propiamente de segmentos de tamaño fijo traslapados a lo largo del contorno, que posteriormente son sometidos a un análisis de componentes principales (PCA) y a un cambio de escala y sistema numérico, para finalmente ser procesados por una máquina restringida de Boltzman (RBM) o un conjunto de ellas mediante aprendizaje profundo con el objetivo de aprovechar las capacidades generativas de la misma. El método sugerido involucra dos etapas; el entrenamiento y la evaluación de la RBM. De esta forma, al haber entrenado la RBM con segmentos de larvas completas las salidas generadas corresponden a la larva que mejor representa la probabilidad conjunta de sus entradas, que pueden ser larvas incompletas, o un traslape de larvas.

Palabras clave: Modelo de forma, segmentación, componentes principales, código gray, máquinas restringidas de Boltzman, aprendizaje profundo.

Descargar Documento: modelado_forma_larvas_utilizando_maquinas.pdf


Reconocimiento de pose estática de manos en imágenes de profundidad.

Autor: Marco Madrigal Solano

Fecha de Publicación: 15 de mayo de 2015

Resumen

Con el aumento del uso de nuevas tecnologías en actividades diarias, la demanda de sistemas de interacción humano-máquina (HCI por sus siglas en Inglés) ha incrementado. Sistemas de reconocimiento de pose de manos han sido ampliamente explorados para dicha tarea debido a su operación intuitiva para usuarios inexpertos. Sin embargo, el reconocimiento de pose de manos basados en visión es un problema extremadamente desafiante debido a la dinámica de la mano, la cual posee un gran número de grados de libertad que la hacen difícil de estimar y conlleva a problemas adicionales como la auto oclusión. Con el desarrollo se sistemas de visión confiables y asequibles para el usuario común como el Microsoft Kinect©, las imágenes de profundidad se han convertido en una herramienta útil para el reconocimiento de partes del cuerpo y por tanto, para el reconocimiento de manos.

En esta tésis se propone un sistema de clasificación de poses de mano estáticas basado solamente en imágenes de profundidad y considerando una perspectiva de vista superior. No se establecen restricciones adicionales a la posición de la mano en la escena, lo cual permite a otros objetos estar más cerca de la cámara que la mano. Un conjunto de datos sintéticos es generado para cuatro posturas de la mano (abierta, apuntando, puño y pinza). El diseño propuesto es dividido en dos etapas de procesamiento: segmentación de la mano y clasificación de la pose de la mano. La etapa de segmentación de la mano utiliza un bosque de decisión aleatorio (RDF por sus siglas en Inglés) para una clasificación a nivel de pixel de las imágenes de profundidad, segmentando la mano en cuatro regiones: brazo, palma y dedos. La clasificación de la pose de la mano se lleva a cabo utilizando un conjunto definido de características visuales de las regiones segmentadas. Siete características visuales son evaluadas en términos de su precisión de clasificación. Dos tipos de clasificadores son entrenados para la estimación de la pose: bosques de decisión aleatorios y máquinas de soporte vectorial (SVM por sus siglas en Inglés) para propósitos de evaluación. La implementación propuesta provee un 91% de precisión en la casificación de las poses de mano utilizadas con el conjunto de datos generado.

Palabras clave: RDF, SVM, imágenes de profundidad, pose de mano, momentos de Hu.

Descargar Documento: reconocimiento_pose_estatica_manos_imagenes.pdf


Tema Sinorca adaptado por David González y Edwin Orias, impulsado por PmWiki

Escuela de Ingeniería Electrónica

Sinorca theme adapted by David González and Edwin Orias, powered by PmWiki

Escuela de Ingeniería Electrónica