Ismael Esquivel Gámez
M. Montes-y-Gómez et. Al [37], reportan haber desarrollado un método para la minería de noticias. Éste busca analizar las colecciones de noticias aparecidas en periódicos y otros medios masivos. El interés surge por la fuerte relación que existe entre los intereses de la sociedad y los tópicos de las noticias. Las noticias son muy diversas de cambio constante y se influyen entre sí.
El método utiliza una representación estadística sencilla de los reportes noticiosos para la detección de tendencias, desviaciones y asociación efímera entre temas. A continuación se describen brevemente cada una de estas representaciones.
Análisis de Tendencias. El objetivo principal del análisis de tendencias es estudiar el comportamiento de los intereses de la sociedad, determinando si ellos cambian o permanecen estables de un periodo a otro. Para realizar el método se utilizan dos colecciones, por ejemplo: dos nuevas fuentes, los periódicos de dos sitios geográficos, etc. Se divide en dos tareas principales: Descubrimiento general de tendencias e identificación de temas o factores que contribuyen a esta tendencia.
Descubrimiento de asociación efímera. Un fenómeno usual en noticias es la influencia de un tema de interés máximo en las noticias, es decir, un tema a corto plazo de una sola vez de frecuencia máxima, sobre los otros asuntos de las noticias. Esta influencia se demuestra en dos diversas formas: el tema máximo induce a algunos asuntos que emerjan o lleguen a ser importantes junto con él, y a los otros que se olvidarán momentáneamente. Esta clase de influencias (relaciones de tiempo) es lo que se determina como asociaciones efímeras. Una asociación efímera se puede ver como relación directa o inversa entre las distribuciones de la probabilidad de los asuntos dados sobre una duración fija.
Detección de desviación. La detección de desviaciones en una enorme cantidad de datos es una tarea importante, pero difícil. Tiene como objetivo descubrir elementos irregulares en una gran cantidad de datos.
Resultados Experimentales. Análisis de Tendencias. Se consideraron noticias económicas del Universal en la última semana de Enero y la primera semana de Febrero de 1999. Hubo 47 temas en esas dos semanas, de las cuales de un filtrado y fusión de estos, se obtuvieron solo 15 temas. Con sus distribuciones de probabilidad se detectó un cambio global de tendencia entre estos dos periodos. Descubrimiento de Asociaciones Efímeras. Se consideró la noticia nacional de la visita del Papa Juan Pablo II a la ciudad de México, como tema principal, en el Universal por diez días. Se detectaron dos asociaciones efímeras: Una asociación entre el tema principal y la Virgen de Guadalupe. Por otro lado hay una asociación inversa entre el tema principal y el tema de Raúl Salinas de Gortari. Esto indica que el tema de la Virgen se vuelve importante, mientras que la otra asociación pudo haber causado el olvido de la sentencia de Raúl Salinas.
Los informes de noticias son una fuente importante de información acerca de la sociedad. Su análisis permite entender mejor sus intereses actuales y para medir la importancia social de muchos eventos. En este método solo se utilizan las medidas estadísticas en el procedimiento de descubrimiento, tales como el promedio, la desviación estándar y coeficiente de correlación.