Creiem, arribats a aquest punt, que pot ésser interessant disposar d'una predicció o prognosi prou fiable referent al capteniment futur de certes variables que estem utilitzant en el nostre estudi. Concretament, ens en referirem a dues: el nombre total d'explotacions agràries (amb terres i sense terres) i la superfície total censada. D'aquesta mena, podem resumir els quadres següents que ja hem vist a l’anterior capítol 2 del nostre llibre, en base a les dades corresponents als censos agraris oficials dels anys 1962, 1972, 1982, 1989 i 1999 (elaborats per l'Institut Nacional d'Estadística) i el darrer referit a l'any 2009.
Les regressions lineals mínimo-quadràtiques corresponents a les quatre comarques constituents de la "Vegueria de les Terres de l'Ebre", així com el total de la mateixa, són les següents. En tots els casos es tindrà l’expressió genèrica:
y = a + b·t, essent:
y = nombre total d'explotacions (amb i sense terres);
t = temps, expressat en anys.
Sempre s’han calculat els paràmetres definitoris del model de predicció així com els coeficients de correlació i determinació i les corresponents covariàncies de la mostra i de la població o univers de dades. Així:
a) Comarca del Baix Ebre:
ANY (t) Núm. EXP. (y) CARACT.
1962 (1) 10.745 a = 11.438,16
1972 (11) 9.542 b = -103,34
1982 (21) 10.586 r = -0,876
1989 (28) 9.720 R = 0,768
1999 (38) 7.184 sty = -30.867,6
2009 (48) 5.661 σty = -25.723
d'on resultaria l'equació:
y = 11.438,16 - 103,34·t
que ofereix les següents prediccions:
t = 58 (2019) y = 5.444 exp.
t = 68 (2029) y = 4.411 exp.
t = 78 (2039) y = 3.378 exp.
b) Comarca del Montsià:
ANY (t) Núm. EXP. (y) CARACT.
1962 (1) 7.582 a = 9.126,94
1972 (11) 9.862 b = -104,85
1982 (21) 6.992 r = -0,859
1989 (28) 5.963 R = 0,738
1999 (38) 5.200 sty = -31.318,1
2009 (48) 3.750 σty = -26.098,4
d'on resultaria l'equació:
y = 9.126,94 - 104,85·t
que ofereix les següents prediccions:
t = 58 (2019) y = 3.046 exp.
t = 68 (2029) y = 1.997 exp.
t = 78 (2039) y = 949 exp.
c) Comarca de la Ribera d'Ebre:
ANY (t) Núm. EXP. (y) CARACT.
1962 (1) 4.761 a = 4.942,05
1972 (11) 4.113 b = -48,01
1982 (21) 4.408 r = -0,939
1989 (28) 3.823 R = 0,882
1999 (38) 3.126 sty = -14.340,3
2009 (48) 2.364 σty = -11.950,25
d'on resultaria l'equació:
y = 4.942,05 - 48,01·t
que ofereix les següents prediccions:
t = 58 (2019) y = 2.157 exp.
t = 68 (2029) y = 1.677 exp.
t = 78 (2039) y = 1.197 exp.
d) Comarca de la Terra Alta:
ANY (t) Núm. EXP. (y) CARACT.
1962 (1) 3.684 a = 3.795,89
1972 (11) 3.314 b = -29,68
1982 (21) 3.460 r = -0,943
1989 (28) 3.127 R = 0,889
1999 (38) 2.530 sty = -8.864,1
2009 (48) 2.298 σty = -7.386,75
d'on resultaria l'equació:
y = 3.795,89 - 29,68·t
que ofereix les següents prediccions:
t = 58 (2019) y = 2.075 exp.
t = 68 (2029) y = 1.778 exp.
t = 78 (2039) y = 1.481 exp.
e) Regió de l'Ebre:
ANY (t) Núm. EXP. (y) CARACT.
1962 (1) 26.772 a = 29.303,59
1972 (11) 26.831 b = -285,86
1982 (21) 25.446 r = -0,946
1989 (28) 22.638 R = 0,895
1999 (38) 18.040 sty = -85.386,6
2009 (48) 14.073 σty = -71.155,5
d'on resultaria l'equació:
y = 29.303,59 - 285,86·t
que ofereix les següents prediccions:
t = 58 (2019) y = 12.722 exp.
t = 68 (2029) y = 9.863 exp.
t = 78 (2039) y = 7.005 exp.
f) Consideracions metodològiques:
Per determinar fefaentment el grau de satisfactorietat dels ajustaments lineals anteriors convé calcular altres estadístics o paràmetres, per la qual cosa establirem el corresponent quadre o taula auxiliar de càlculs. Ara bé, entre les variables del problema t i y suposem l'existència d'una certa relació de causalitat, que també es pot manifestar mitjançant el contrast d'hipòtesi adequat, utilitzant la distribució t de Student (Gosset). La forma d'aquesta distribució és molt semblant a la de la corba o funció de densitat normal; és simètrica, amb mitjana zero, però existint una probabilitat lleugerament superior d'obtenir valors situats entre ambdues cues1 .
Així doncs, contrastarem la hipòtesi d'independència entre les variables t i y, emprant com a estadístic de contrast el següent:
Amb un nivell de significació del contrast d'hipòtesi del 5% (a =0'05), la regió crítica serà:
NOTA: Quan la taula es llegeix de baix cap a dalt, s'ha d'anteposar un signe menys als valors tabulats. La interpolació ha de realitzar-se emprant els recíprocs dels graus de llibertat.
Alternativament, podríem contrastar la hipòtesi nul·la d'absència de relació o dependència entre ambdues variables del problema. Per això ens referirem a una taula especial que ha estat calculada sobre la base de la distribució mostral de r quan les variables són valors mostrals provinents de poblacions que tenen, aproximadament, la forma de distribucions teòriques de probabilitat normal.
Acceptant, doncs, que es tracta de poblacions normals, es descarta la hipòtesi nul·la d'absència de correlació al nivell de significació si el valor de r calculat per al conjunt de parells de dades excedeix de r/2 o si és menor de -r/2/2. Altrament, si el valor en qüestió es troba entre ambdós, podríem afirmar que el coeficient de correlació no és pas significatiu, procedint aleshores fer els contrasts d'hipòtesis als nivells de significació de 0,05, 0,02 i 0,01.
g)Conclusions:
S'observa, en els cinc casos o territoris analitzats, una tendència a la disminució del nombre d'explotacions agràries en els propers anys, ja que els coeficients de regressió i de correlació són negatius en tots els casos.
Nogensmenys, s'ha de tenir en compte les diferències de fiabilitat de les prediccions esmentades, en base al corresponent valor del coeficient de correlació lineal o bé del seu quadrat: R = r2 (coeficient de determinació o crític). Casualment, la "bondat" de les expressades regressions augmenta en el mateix ordre que han estat contemplats els territoris en el nostre estudi.
NOTA: Les xifres corresponents als anys assenyalats amb (*) són prognosis efectuades al nostre estudi, sobre la base dels ajusts lineals mínimo-quadràtics anteriors.
1 Realment, la forma de la distribució depèn de la grandària de la mostra o, millor encara, del nombre de graus de llibertat del problema plantejat.