Ismael Esquivel Gámez
Los tres tipos de estrategias empleadas en los actuales sistemas de minería de texto son:
Etapa de pre-procesamiento Tipo de representación Tipo de descubrimientos
Categorización Vector de temas Nivel temático
Full-text Secuencia de palabras Patrones de lenguaje
Extracción de información Tabla de datos Relaciones entre entidades
Tabla 3.1 Estrategias empleadas en la Minería de Textos.
El autor considera que todos estos métodos limitan a un nivel temático o de entidad sus resultados, haciendo imposible descubrir cosas más detalladas como:
• Consensos, que por ejemplo respondan a preguntas como: ¿Cuál es la opinión mayoritaria de los mexicanos sobre el gobierno de Fox?
• Tendencias, que indiquen por ejemplo si han existido variaciones en la postura de Fox con respecto a la educción.
• Desviaciones, que identifiquen por ejemplo opiniones “raras” con respecto al desempeño de la selección mexicana de fútbol.
3.1.3 Aplicaciones
De acuerdo con Bordoni y d'Avanzo [26], las aplicaciones de la minería de textos se usan fundamentalmente para:
Extraer información relevante de un documento (resumiendo, extrayendo lo más notable, etc.).
Adquirir perspectivas sobre las tendencias, las relaciones entre gentes/lugares/organizaciones, etc. agregando y comparando automáticamente la información extraída de documentos de un cierto tipo.
Clasificar y organizar documentos según su contenido; es decir, preseleccionar automáticamente grupos de documentos con un tema específico y asignarlos a la persona adecuada.
Organizar depósitos de meta-información relacionada con documentos para la búsqueda y recuperación. Recuperar documentos basándose en varios tipos de información sobre el contenido del documento.
La lista de actividades muestra que las principales áreas de aplicación de las tecnologías de minería de textos cubren dos aspectos: el descubrimiento de conocimiento y la extracción de información.