Ismael Esquivel Gámez
En este capítulo se presenta la necesidad de crear un mecanismo para analizar y describir el contenido de grupos de textos, aplicado a la inteligencia competitiva de un sector industrial. Con base en esta necesidad se plantean los objetivos de investigación de este trabajo; los cuales se enfocan en el diseño de un método de minería de texto que permita usar una representación semántica del contenido de los textos y que en consecuencia logre descubrir patrones descriptivos en los textos que consideren información sobre actores, acciones, objetos, atributos y sus relaciones. Como parte final del capítulo se describe la organización de la tesis y el contenido de los siguientes capítulos.
1.1 Motivación
En la actualidad la empresa para ser competitiva requiere conocer oportunamente lo que sucede en la industria en la cual se desarrolla. Al mismo tiempo, requiere informar a sus diversos públicos los eventos que realiza para fines publicitarios y de relaciones públicas. Para informar y ser informada, la empresa utiliza con mayor frecuencia la Web, por las ventajas económicas y de alcance que representa.
Continuamente la empresa está publicando noticias sobre las actividades que realiza y busca lo que están haciendo aquellas que forman parte del sector donde se desarrolla, están vinculadas con el comportamiento que desean informar, permanecen publicadas más de un día y generalmente son de tamaño reducido.
La lingüística computacional se enfoca principalmente en el diseño de los mecanismos que permitan a las computadoras entender el lenguaje natural, aunque también considera varias tareas relacionadas con el procesamiento de información textual. Algunos ejemplos de estas tareas son la búsqueda de información, la extracción de información y la minería de texto.
El procesamiento automático de las noticias mediante la minería de textos provee el descubrimiento de conocimientos no evidentes que surgen de relacionar el contenido de varias de ellas (Hearst y Kodratoff, 1999). Las técnicas usadas también se aplican en la minería Web, en su área de minería de contenido, para archivos tipo texto y HTML.
Un sistema computacional de minería textual que permita, a partir de las noticias empresariales publicadas en la Web, el desarrollo de la inteligencia competitiva para una mejor toma de decisiones estratégicas, es el motor principal para el presente trabajo.