Ismael Esquivel Gámez
Desde cualquier punto de vista que se observe, debe entenderse que cuando se define la inteligencia organizacional, como la capacidad para reunir, analizar y diseminar información no solo interna sino también sobre el mercado, los competidores y los proveedores, es necesario procesar grandes volúmenes de información, imposible de realizar sin la creación de una infraestructura tecnológica en la organización que permita procesar, analizar, almacenar y distribuir dicha información. La aplicación de los enfoques de la inteligencia organizacional requiere de redes locales que garanticen el flujo de información en la institución, bases de datos, técnicas y herramientas para el análisis de los datos disponibles, así como de un acceso libre a Internet, como una enorme fuente de información que posibilita la realización de búsquedas a bajo costo y la comunicación interpersonal y grupal, entre otros.
“Uno de los impactos más fuertes de Internet en el interior de las organizaciones es el relacionado con la aplicación de las tecnologías web en los ambientes corporativos. Su migración a las redes locales (intranets) y corporativas (extranets) ha aportado una maravillosa interfaz que permite normalizar la presentación de la información de las organizaciones en una forma gráfica atractiva e independiente de las plataformas de los servidores y de las estaciones de trabajo. Esta posibilidad significó un importante salto en el camino para la creación de una cultura de la información -acceder a la información, compartir la información, gestionar la información y consumir la información requerida- en las empresas.” Vilaragut [18].
Ante esta situación, han existido grandes avances de tres tecnologías de información, las cuales serán descritas sucintamente a continuación:
Minería de datos (Data Mining)
Minería Web (Web Mining)
Minería textual (Text Mining )
2.5.1 Minería de datos
De acuerdo con Estivill-Castro [19], la minería de datos es el análisis de archivos y bitácoras de transacciones con el fin de descubrir patrones, relaciones, reglas, asociaciones o incluso excepciones que sean útiles para la toma de decisiones.
El descubrir patrones o relaciones útiles en una colección de datos ha recibido tradicionalmente muchos nombres. El término data mining llegó incluso a ser muy desprestigiado en la estadística, pues representaba masajear suficientemente los datos hasta que los mismos confirmasen lo que uno quería postular. En este sentido, la minería de datos es un proceso que invierte la dinámica del método científico en el siguiente sentido.
En el método científico, primero se formula la hipótesis y luego se diseña el experimento para coleccionar los datos que confirmen o refuten la hipótesis. Si esto se hace con la formalidad adecuada (cuidando cuáles son las variables controladas y cuáles experimentales), se obtiene un nuevo conocimiento.
En la minería de datos, se coleccionan los datos y esperamos que de ellos emerjan hipótesis. Queremos que los datos nos describan o indiquen por qué son como son. La más inocente mirada a los datos por un humano, puede inspirarle una hipótesis. Recuérdese que los humanos tenemos grandes poderes de generalización e identificación de patrones. Luego entonces, validar esa hipótesis inspirada por los datos en los datos mismos, será numéricamente significativa, pero experimentalmente inválida. De ahí que la minería de datos debe presentar un enfoque exploratorio, y no confirmador. Usar la minería de datos para confirmar nuestras hipótesis puede ser peligroso, pues estamos haciendo una inferencia poco válida.