« Volver Ficha del Documento

Evaluación del efecto en el algoritmo de Análisis Semántico Latente al utilizar colecciones de datos cada vez más grandes para la detección y extracción de sinónimos y su independencia respecto al lenguaje, por medio de su implementación distribuida

2016-10-28T17:58:13Z

Instituto Tecnológico de Costa Rica.

Access to large data, especially for text processing applications, results in more effec tive algorithms and therefore becomes transcendental to take advantage of these large amounts of data. Latent Semantic Analysis (LSA) is an unsupervised machine learning algorithm which benefits from these features and can be used for synonym detection and extraction. LSA takes advantage of the implicit semantic structure that exists in the association between documents and the terms they contain to statistically analyze the relationships between the terms of the collection of text documents; and because it uses a strictly mathematical approach, it is inherently independent of language. This is a thesis for the Masters in Computing degree that analyzes the LSA algorithm in a distributed environment, in order to evaluate its effect for synonym detection and extraction on larger collections of data.

Proyecto de Graduación (Maestría de Ingeniería en Computación con énfasis en Ciencias de la Computación Instituto Tecnológico de Costa Rica, Escuela de Ingeniería en Computación, 2014.

Instituto Tecnológico de Costa Rica

Lidia Gómez

Cartago - 300m Este del Estadio Fello Meza. Apartado 159-7050.

2550-2263, 2550-2365


Dirección: Av. Mariscal Antonio José de Sucre N58-63 y Fernández Salvador Edif. Olade - San Carlos, Quito - Ecuador.

Web: www.olade.org

Teléfonos: (593 2) 259 8122 / 2598 280

Correo: realc@olade.org

ADMIN
Desarrollado por: Aikyu-Systems