L'estadística ha estat durant molt de temps una part integral de la vida. La gent s'enfronta a tot arreu. A partir de les estadístiques, s'extreuen conclusions sobre on i quines mal alties són comunes, què hi ha més demanda en una regió determinada o entre un determinat segment de la població. Fins i tot la construcció de programes polítics de candidats a òrgans de govern es basa en dades estadístiques. Les cadenes minoristes també les fan servir a l'hora de comprar productes, i els fabricants es guien per aquestes dades a les seves propostes.
L'estadística té un paper important en la vida de la societat i afecta a cadascun dels seus membres, fins i tot en petites coses. Per exemple, si segons les estadístiques, la majoria de la gent prefereix els colors foscos a la roba d'una ciutat o regió en particular, serà extremadament difícil trobar un impermeable groc brillant amb un estampat floral als punts de venda locals. Però quines quantitatssumen aquestes dades per tenir aquest impacte? Per exemple, què és "estadísticament significatiu"? Què s'entén exactament amb aquesta definició?
Què és això?
L'estadística com a ciència està formada per una combinació de diferents quantitats i conceptes. Un d'ells és el concepte de "significació estadística". Aquest és el nom del valor de les variables, la probabilitat d'aparició d' altres indicadors en què és insignificant.
Per exemple, 9 de cada 10 persones es posen sabates de goma als peus durant una caminada matinal per buscar bolets al bosc de tardor després d'una nit plujosa. La probabilitat que en algun moment 8 d'ells es posin mocassins de lona és insignificant. Així, en aquest exemple concret, el número 9 és el que s'anomena "importància estadística".
En conseqüència, si continuem desenvolupant l'exemple pràctic donat, les botigues de sabates compren botes de goma al final de la temporada d'estiu en quantitats més grans que en altres èpoques de l'any. Per tant, la magnitud del valor estadístic té un impacte en la vida normal.
Per descomptat, en càlculs complexos, per exemple, a l'hora de predir la propagació de virus, es tenen en compte un gran nombre de variables. Però l'essència mateixa de determinar un indicador significatiu de dades estadístiques és similar, independentment de la complexitat dels càlculs i del nombre de valors variables.
Com es calcula?
S'utilitza per calcular el valor de l'indicador de "importància estadística" de l'equació. És a dir, es pot argumentar que en aquest cas tot ho decideixen les matemàtiques. L'opció de càlcul més senzilla és una cadena d'operacions matemàtiques, en què intervenen els paràmetres següents:
- dos tipus de resultats obtinguts a partir d'enquestes o de l'estudi de dades objectives, com ara la quantitat de compres, indicada amb a i b;
- indicador de mida de la mostra per als dos grups – n;
- valor de la quota de mostra combinada - p;
- error estàndard - SE.
El següent pas és determinar la puntuació global de la prova: t, el seu valor es compara amb el número 1,96. 1,96 és el valor mitjà, que transmet un rang del 95%, segons la funció de distribució t de Student.
Sovint sorgeix la pregunta de quina diferència hi ha entre els valors de n i p. Aquest matís és fàcil d'aclarir amb un exemple. Suposem que es calcula la importància estadística de la llei altat a qualsevol producte o marca d'homes i dones.
En aquest cas, les lletres aniran seguides del següent:
- n - nombre d'enquestats;
- p - nombre de satisfets amb el producte.
El nombre de dones entrevistades en aquest cas es designarà com a n1. En conseqüència, els homes - n2. El mateix valor tindrà els números "1" i "2" del símbol p.
Comparar la puntuació de la prova amb la mitjana dels fulls de càlcul de l'estudiant es converteix en el que s'anomena "importància estadística".
Què s'entén per verificació?
Els resultats de qualsevol càlcul matemàtic sempre es poden comprovar, això s'ensenya als nens de primària. És lògic assumirque com que les estadístiques es determinen mitjançant la cadena de càlculs, llavors es comprova.
No obstant això, provar la significació estadística no són només matemàtiques. L'estadística s'ocupa d'un gran nombre de variables i probabilitats diverses, que estan lluny de ser sempre susceptibles de càlcul. És a dir, si tornem a l'exemple de les sabates de goma al principi de l'article, aleshores la construcció lògica de les dades estadístiques en què confiaran els compradors de béns per a botigues es pot veure interrompuda pel clima sec i calorós, que no és típic de la tardor.. Com a conseqüència d'aquest fenomen, disminuirà el nombre de persones que adquireixen botes de goma i els punts de venda patiran pèrdues. Per descomptat, una fórmula matemàtica no és capaç de preveure una anomalia meteorològica. Aquest moment s'anomena "error".
Aquesta és només la probabilitat d'aquests errors i té en compte la comprovació del nivell de significació calculada. Té en compte tant els indicadors calculats com els nivells de significació acceptats, així com les quantitats anomenades convencionalment hipòtesis.
Quin és el nivell de significació?
El concepte de "nivell" s'inclou en els principals criteris de significació estadística. S'utilitza en estadístiques aplicades i pràctiques. Aquest és un tipus de valor que té en compte la probabilitat de possibles desviacions o errors.
El nivell es basa en la identificació de diferències en mostres ja fetes, permet establir-ne la significació o, per contra, l'aleatorietat. Aquest concepte no només té significats digitals, sinó també les seves peculiars interpretacions. Ho expliquencom cal entendre el valor i el nivell en si es determina comparant el resultat amb l'índex mitjà, això revela el grau de fiabilitat de les diferències.
Per tant, podem imaginar el concepte de nivell simplement: és un indicador d'un error o error acceptable i probable en les conclusions extretes de les dades estadístiques obtingudes.
Quins nivells d'importància s'utilitzen?
La significació estadística dels coeficients de probabilitat d'error a la pràctica es basa en tres nivells bàsics.
El primer nivell és el llindar en què el valor és del 5%. És a dir, la probabilitat d'error no supera el nivell de significació del 5%. Això vol dir que la confiança en la impecabilitat i la infal·libilitat de les conclusions fetes a partir de dades de recerca estadística és del 95%.
El segon nivell és el llindar de l'1%. En conseqüència, aquesta xifra significa que es pot guiar per les dades obtingudes durant els càlculs estadístics amb un 99% de confiança.
Tercer nivell - 0,1%. Amb aquest valor, la probabilitat d'un error és igual a una fracció d'un percentatge, és a dir, els errors s'eliminen pràcticament.
Què és una hipòtesi a les estadístiques?
El concepte d'error es divideix en dues àrees, pel que fa a l'acceptació o el rebuig de la hipòtesi nul·la. Una hipòtesi és un concepte darrere del qual, segons la definició, s'amaga un conjunt de resultats d'enquesta, altres dades o enunciats. És a dir, una descripció de la distribució de probabilitat d'alguna cosa relacionada amb el tema de la comptabilitat estadística.
Hi ha dues hipòtesis en càlculs simples: zero i alternativa. La diferència entre elles és que la hipòtesi nul·la es basa en la idea que no hi ha diferències fonamentals entre les mostres implicades en la determinació de la significació estadística, i l' alternativa és totalment oposada a aquesta. És a dir, la hipòtesi alternativa es basa en la presència d'una diferència significativa en aquestes mostres.
Quins són els errors?
Els errors com a concepte estadístic estan en proporció directa a l'acceptació d'aquesta o aquella hipòtesi com a certa. Es poden dividir en dues direccions o tipus:
- el primer tipus es deu a l'acceptació de la hipòtesi nul·la, que va resultar ser incorrecta;
- segon - causat per seguir l' alternativa.
El primer tipus d'error s'anomena fals positiu i és força comú en totes les àrees on s'utilitzen estadístiques. En conseqüència, l'error del segon tipus s'anomena fals negatiu.
Per què necessitem una regressió a les estadístiques?
La significació estadística de la regressió és que amb la seva ajuda és possible establir fins a quin punt el model de diverses dependències calculats a partir de les dades correspon a la realitat; permet identificar la suficiència o la manca de factors per a la comptabilitat i les conclusions.
El valor de regressió es determina comparant els resultats amb les dades que figuren a les taules de Fisher. O utilitzant l'anàlisi de la variància. Els indicadors de regressió són importants quanestudis i càlculs estadístics complexos que impliquen un gran nombre de variables, dades aleatòries i canvis probables.