Tesis doctorales de Economía


TRATAMIENTO AUTOMÁTICO DE NOTICIAS EMPRESARIALES EN LA WEB, MEDIANTE MINERÍA TEXTUAL. CASO DE ESTUDIO: UNIVERSIDADES PRIVADAS DE MÉXICO

Ismael Esquivel Gámez



Esta página muestra parte del texto pero sin formato.
Puede bajarse la tesis completa en PDF comprimido ZIP (227 páginas, 1.49 Mb) pulsando aquí

 

 

 

5.9.7 EJEMPLO 4. NOTICIA DE TIPO VAO

Procedimiento.

1. Encontrar y englobar los nombres propios

2. Etiquetar y sustituir nombres propios

3. Determinar el objeto, en todos y cada uno de sus elementos

4. Detectar las locuciones no verbales y sustituir

5. Encontrar los verbos y sustituir

6. Determinar el verbo principal y los secundarios

7. Distinguir los nombres propios

8. Definir el lugar y fecha del evento

9. Analizar los términos no participantes

Texto original

"El Budismo ha llegado a Occidente para quedarse" afirmó el maestro coreano Samu Sunim, en conferencia frente a estudiantes y catedráticos de la Universidad de las Américas Puebla (UDLA).

1.

"El_Budismo_ha_llegado_a_Occidente_para_quedarse" afirmó el maestro coreano Samu_Sunim, en conferencia frente a estudiantes_y_catedráticos_de_la_Universidad_de_las_Américas_Puebla_(UDLA).

2.

NP1 afirmó el maestro coreano NP2, en conferencia frente a NP3

NP1 = "El_Budismo_ha_llegado_a_Occidente_para_quedarse"

NP2 = Samu_Sunim

NP3= estudiantes_y_catedráticos_de_la_Universidad_de_las_Américas_Puebla_(UDLA).

3.

Se busca un término que represente un objeto, entre los nombres propios y de no encontrarse, entre los demás términos, de lo que se desprende que:

OR = conferencia

NP1 afirmó el maestro coreano NP2, en OBJETO[OR] frente a NP3

4. De entre los términos restantes, se buscan las locuciones y se sustituyen

NP1 afirmó el maestro coreano NP2, en OBJETO[OR] L1 NP3

L1 = frente_a

5.

Se detectan los verbos y se sustituyen por sendas etiquetas.

NP1 V1 el maestro coreano NP2, en OBJETO[OR] L1 NP3

V1 = afirmar

6.

Al tener un solo verbo, se consigna como verbo principal

NP1 VERBO el maestro coreano NP2, en OBJETO[OR] L1 NP3

VERBO = V1

7.

Para distinguir los nombres propios, se procesan NP1, NP2 y NP3. El primero al estar acotado entre comillas indica una alta probabilidad de tratarse del tema (determinativo del objeto).

OBJETO[OD] VERBO el maestro coreano NP2, en OBJETO[OR] L1 NP3

OD = NP1

Enseguida, las locuciones no verbales encontradas se buscan en los términos previos a elementos básicos (Anexo E). Para este caso, frente_a se encuentra como previo de un paciente, por tanto resulta:

OBJETO[OD] VERBO el maestro coreano NP2, en OBJETO[OR] L1 PACIENTE

PACIENTE = NP1

Finalmente, del texto se buscan las preposiciones, conjunciones y adverbios que aparecen como elementos previos (Anexo E) y se procede a la asignación. Para este caso, el único elemento es en, el cual aparece como previo a un objeto o paciente. En el texto, se encuentra como previo de un objeto, por lo que se descarta que vaya antes de un paciente.

El nombre propio restante NP3 se califica como el agente de la noticia, porque en las estructuras de tipo V-A-O, el agente es el nombre propio encontrado luego del verbo.

OBJETO[OD] VERBO el maestro coreano AGENTE, en OBJETO[OR] L1 PACIENTE

AGENTE = NP2

Al final del procesamiento, se obtiene lo mostrado en la tabla 5.12

Elemento Subelemento Contenido

Lugar NA

Fecha NA

Agente Samu_Sunim

Acción afirmar

Objeto

OR= Referente conferencia

OD = Determinativo del ref. "El_Budismo_ha_llegado_a_Occidente_para_quedarse"

OC = Calificación NA

ODC= Determinativo de la Cal. NA

Paciente estudiantes_y_catedráticos_de_la_Universidad_de_las_Américas

_Puebla_(UDLA).

Complemento

I = Instrumento NA

E = Efecto NA

K = Contexto NA

Relator NA

Tabla 5.12 Elementos de una noticia de estructura V-A-O


Grupo EUMEDNET de la Universidad de Málaga Mensajes cristianos

Venta, Reparación y Liberación de Teléfonos Móviles
Enciclopedia Virtual
Biblioteca Virtual
Servicios