Tesis doctorales de Economía


TRATAMIENTO AUTOMÁTICO DE NOTICIAS EMPRESARIALES EN LA WEB, MEDIANTE MINERÍA TEXTUAL. CASO DE ESTUDIO: UNIVERSIDADES PRIVADAS DE MÉXICO

Ismael Esquivel Gámez



Esta página muestra parte del texto pero sin formato.
Puede bajarse la tesis completa en PDF comprimido ZIP (227 páginas, 1.49 Mb) pulsando aquí

 

 

 

3.1.2 Estrategias

Los tres tipos de estrategias empleadas en los actuales sistemas de minería de texto son:

Etapa de pre-procesamiento Tipo de representación Tipo de descubrimientos

Categorización Vector de temas Nivel temático

Full-text Secuencia de palabras Patrones de lenguaje

Extracción de información Tabla de datos Relaciones entre entidades

Tabla 3.1 Estrategias empleadas en la Minería de Textos.

El autor considera que todos estos métodos limitan a un nivel temático o de entidad sus resultados, haciendo imposible descubrir cosas más detalladas como:

• Consensos, que por ejemplo respondan a preguntas como: ¿Cuál es la opinión mayoritaria de los mexicanos sobre el gobierno de Fox?

• Tendencias, que indiquen por ejemplo si han existido variaciones en la postura de Fox con respecto a la educción.

• Desviaciones, que identifiquen por ejemplo opiniones “raras” con respecto al desempeño de la selección mexicana de fútbol.

3.1.3 Aplicaciones

De acuerdo con Bordoni y d'Avanzo [26], las aplicaciones de la minería de textos se usan fundamentalmente para:

 Extraer información relevante de un documento (resumiendo, extrayendo lo más notable, etc.).

 Adquirir perspectivas sobre las tendencias, las relaciones entre gentes/lugares/organizaciones, etc. agregando y comparando automáticamente la información extraída de documentos de un cierto tipo.

 Clasificar y organizar documentos según su contenido; es decir, preseleccionar automáticamente grupos de documentos con un tema específico y asignarlos a la persona adecuada.

 Organizar depósitos de meta-información relacionada con documentos para la búsqueda y recuperación. Recuperar documentos basándose en varios tipos de información sobre el contenido del documento.

La lista de actividades muestra que las principales áreas de aplicación de las tecnologías de minería de textos cubren dos aspectos: el descubrimiento de conocimiento y la extracción de información.


Grupo EUMEDNET de la Universidad de Málaga Mensajes cristianos

Venta, Reparación y Liberación de Teléfonos Móviles
Enciclopedia Virtual
Biblioteca Virtual
Servicios