¿Cómo citar estas ¿Cómo poner un
|
|
Estructura de la propiedad agraria
José Mª Franquet Bernis
-ANNEX Núm:8 -
- ALTRES ESPECIFICACIONS METODOLÒGIQUES -
LA PROVA DEL TXI-QUADRAT
1. FREQÜÈNCIES OBSERVADES I TEÒRIQUES
A diferents parts del nostre estudi (vegem. v. gr., el Capítol 3, epígraf 1.7) es recorreix a l’ús de la distribució teòrica de probabilitat “txi-quadrat” amb l’objectiu de contrastar certes hipòtesis.
Com ja s'ha vist molt cops, els resultats obtinguts de les mostres d'una població o univers no sempre concorden exactament amb els resultats teòrics estimats, segons les regles de probabilitat. Per exemple, encara que les consideracions teòriques ens portin a esperar 50 cares y 50 creus quan es llença a l'aire 100 cops una moneda ben feta, és rar que s'obtinguin exactament aquests resultats.
Suposem que a una determinada mostra s'observen una sèrie de possibles successos: E1, E2, E3, ... , Ek (veure la taula següent) que passen amb freqüències o1, o2, o3, ... , ok , anomenades freqüències observades i que, segons les regles de probabilitat, s'espera que ocorreixin amb freqüències e1, e2, e3, ... , ek anomenades freqüències teòriques o esperades.
QUADRE Núm.: A8-1
FREQÜÈNCIA OBSERVADA I ESPERADA DE LA PROVA DEL TXI QUADRAT
SUCCESSOS E1 E2 E3 ... Ek
Freqüència observada o1
o2
o3
...
ok
Freqüència esperada e1
e2
e3
...
ek
Sovint es desitja saber si les freqüències observades difereixen significativament de les freqüències esperades. Per al cas en què solament són possibles dos successos: E1 i E2 (sovint anomenat dicotomia o classificació dicotòmica), com, per exemple, cares i creus, defectuós o no defectuós, etc., el problema queda resolt satisfactòriament amb els mètodes clàssics. En aquest apartat aclaratori, es considera el problema general.
2. DEFINICIÓ DE *2
Una mesura de la discrepància o divergència existent entre les freqüències realment observades i les esperades o teòriques, és la subministrada per l'estadígraf *2 de Pearson, donat per l'expressió:
(1)
on si el total de freqüències és N, tindrem:
*oj = *ej = N (2)
Una explicació equivalent a (1) és la següent:
(3)
Si *2 = 0. les freqüències observades i les teòriques concorden exactament; mentre que si *2>0, no coincideixen exactament. A valors majors de *2, majors són les discrepàncies entre les freqüències observades i les estimades.
La distribució mostral de *2 s'aproxima molt estretament a la distribució teòrica de probabilitat txi-quadrat, de configuració analítica:
(4)
si les freqüències estimades són almenys iguals a 5; l'aproximació millora per a valors superiors. Aquí és el nombre de graus de llibertat, Y0 és una constant que depén de amb la qual cosa l'àrea total sota la corba val 1. Algunes distribucions 2 corresponents a diferents valors de es mostren a la següent figura:
FIG. A8-1. Distribucions de Txi-quadrat per a diferents valors de .
El valor màxim que assoleix Y es presenta en 2 = * - 2, per a * * 2.
El nombre de graus de llibertat * ve donat per:
a) * = k -1, si les freqüències esperades poden calcular-se sense haver d'estimar paràmetres poblacionals amb els estadístics mostrals. Advertint-se que el restar 1 a k és a causa de la condició restrictiva (2) que denota que si són conegudes (k-1) de les freqüències esperades, la freqüència restant pot ésser determinada.
b) * = k -1 -m, si les freqüències esperades solament poden calcular-se estimant m paràmetres de la població a partir dels estadístics mostrals.
3. ASSAIGS DE SIGNIFICACIÓ
A la pràctica, les freqüències esperades d'acord amb una hipòtesi H0. Si sota aquesta hipòtesi el valor calculat de *2 donat per (1) o (3) és major que algun valor crític (tal com pot ésser *20'95 o *20'99 , que són valors crítics als nivells de significació de 0'05 i 0'01, respectivament), es dedueix que les freqüències observades difereixen significativament de les esperades i es rebutja H0 al nivell de significació corresponent. En cas contrari, s'acceptarà o almenys no es rebutjarà. Aquest procediment s'anomena assaig o prova de txi-quadrat de la hipòtesi, i és el que hem realitzat al nostre ajust de les temperatures extremes.
S'ha d'advertir, que en aquelles circumstàncies en que *2 estigui molt pròxim a zero ha de mirar-se amb cert recel, ja que és rar que les freqüències observades concordiguen prou bé amb les esperades. Per a examinar aquestes situacions, es pot determinar si el valor calculat de *2 és menor que: *20'05 o *20'01, respectivament. Aquest és, justament, el cas que ens ocupa de l'ajustament de la funció de retorn.
4. LA PROVA TXI-QUADRAT PER A LA BONESA DE L'AJUST
La prova txi-quadrat pot ésser utilitzada per a determinar de quina manera distribucions teòriques de probabilitat, com pot ésser la normal, binomial, etc., s'ajusten a distribucions empíriques, és a dir, aquelles que s'obtenen de les dades mostrals. En el nostre cas, com ja s'ha vist, s'ha utilitzat per a determinar la bonesa de l'ajust de la funció de retorn de les temperatures a una equació no lineal de tipus semi-logarítmic (neperià o decimal).
5. TAULES DE CONTINGÈNCIA
La taula o quadre A8-1, en la qual les freqüències observades ocupen una sola fila, és una taula de classificació simple. Ja que el nombre de columnes és k, també s'anomena taula 1•k. Desenvolupant aquesta idea s'arriba a les taules de classificació doble o taules h•k, en les que les freqüències observades ocupen h files i k columnes. Aquestes taules s'anomenen, normalment, taules de contingència.
Corresponent-se amb cada freqüència real o observada en un taula de contingència h•k, hi ha una freqüència teòrica o esperada que es calcula sota alguna hipòtesi i segons les regles de probabilitat. Aquestes freqüències, que ocupen les caselles d'una taula de contingència, s'anomenen freqüències elementals. La freqüència total de cada fila o columna és l'anomenada freqüència marginal.
Per estudiar l'acord entre les freqüències observades i les esperades, es calcula, com ja s'ha dit, l'estadístic:
, (5)
on la suma s'estén a totes les caselles de la taula de contingència, els símbols oj i ej representen, respectivament, les freqüències observades i esperades en la casella j. Aquesta suma, la qual és anàloga a (1), conté h•k termes. La suma de totes les freqüències observades es denota per N i és igual a la suma de totes les freqüències esperades.
Com abans, l'estadístic (5) té una distribució mostral molt estretament aproximada a la donada per (4), amb tal de que les freqüències esperades no siguin massa petites. El nombre de graus de llibertat d'aquesta distribució txi-quadrat està donat per h>1, k>1 per:
(a) * = (h-1)(k-1) si les freqüències esperades poden calcular-se sense haver d'estimar paràmetres poblacionals amb els estadístics mostrals.
(b) * = (h-1)(k-1) - m si les freqüències observades poden solament calcular-se estimant m paràmetres poblacionals amb els estadístics mostrals.
Els assajos de significació per a taules h•k són anàlegs als de les taules 1•k. Les freqüències esperades són trobades sota una determinada hipòtesi Ho. Una hipòtesi normalment suposada és aquella en la qual les dues classificacions són independents entre si.
Les taules de contingència poden estendre's a un nombre major de dimensions. Així, per exemple, es poden tenir taules hkl on siguin presents tres classificacions.
6. CORRECCIÓ DE YATES PER A LA CONTINUÏTAT
Quan s'apliquen a dades discretes els resultats per a distribucions continues, cal fer unes determinades correccions, com s'ha vist en capítols anteriors. Una correcció anàloga és aplicable quan s'utilitza la distribució txi-quadrat. La correcció consisteix en posar (1) de la següent forma:
(6)
que es coneix freqüentment com a correcció de YATES. També existeix una modificació anàloga de la formulació (4).
En general, la correcció es fa solament quan el nombre de graus de llibertat es * =1. En mostres grans s'obtenen pràcticament els mateixos resultats que la *2 no corregida, però poden aparèixer certes dificultats en relació amb els valors crítics. Per a mostres petites, on cada freqüència esperada es troba entre 5 i 10, potser que sigui millor comparar els valors de *2 corregit i *2 no corregit. Si ambdós valors condueixen a la mateixa conclusió segons una hipòtesi, tal com rebutjar-la al nivell de significació del contrast del 0'05, rarament es presenten dificultats. Si condueixen a conclusions diferents, es pot o bé incrementar les dimensions mostrals o, si això no és possible, es poden utilitzar mètodes de probabilitat exactes, d'acord amb la distribució multinomial.
Volver al INDICE DE CONTENIDOS de esta tesis