Statistička značajnost: definicija, koncept, značaj, regresijske jednadžbe i testiranje hipoteza

Sadržaj:

Statistička značajnost: definicija, koncept, značaj, regresijske jednadžbe i testiranje hipoteza
Statistička značajnost: definicija, koncept, značaj, regresijske jednadžbe i testiranje hipoteza

Video: Statistička značajnost: definicija, koncept, značaj, regresijske jednadžbe i testiranje hipoteza

Video: Statistička značajnost: definicija, koncept, značaj, regresijske jednadžbe i testiranje hipoteza
Video: КАК ПРОИЗНОШАЕТСЯ ДЕМОНСТРАБИЛЬНОСТЬ? #демонстративность (HOW TO PRONOUNCE DEMONSTRA 2024, Svibanj
Anonim

Statistika je odavno sastavni dio života. Ljudi se s tim susreću posvuda. Na temelju statističkih podataka donose se zaključci o tome gdje su i koje su bolesti uobičajene, što je traženije u pojedinoj regiji ili među određenim segmentom stanovništva. Čak se i izrada političkih programa kandidata za državna tijela temelji na statističkim podacima. Koriste ih i trgovački lanci pri kupnji robe, a proizvođači se u svojim prijedlozima rukovode tim podacima.

Statistika igra važnu ulogu u životu društva i utječe na svakog pojedinog člana, čak i u malim stvarima. Na primjer, ako prema statistikama većina ljudi preferira tamne boje u odjeći u određenom gradu ili regiji, tada će u lokalnim prodajnim mjestima pronaći svijetlo žuti baloner s cvjetnim printom. Ali koje količineda li se ti podaci zbrajaju da bi imali takav utjecaj? Na primjer, što je "statistički značajno"? Što točno znači ova definicija?

Što je ovo?

Statistika kao znanost sastoji se od kombinacije različitih veličina i koncepata. Jedan od njih je koncept „statističke važnosti“. Ovo je naziv vrijednosti varijabli, vjerojatnost pojave drugih pokazatelja u kojima je zanemariva.

Izračun statističkih pokazatelja
Izračun statističkih pokazatelja

Na primjer, 9 od 10 ljudi obuva gumene cipele na noge tijekom jutarnje šetnje za gljive u jesenskoj šumi nakon kišne noći. Vjerojatnost da u nekom trenutku njih 8 obuče platnene mokasine je zanemariva. Dakle, u ovom konkretnom primjeru, broj 9 je ono što se naziva "statistički značaj".

Prema tome, ako dalje razvijamo navedeni praktični primjer, dućani cipela kupuju gumene čizme do kraja ljetne sezone u većim količinama nego u druga doba godine. Dakle, veličina statističke vrijednosti ima utjecaj na običan život.

Naravno, u složenim izračunima, recimo, prilikom predviđanja širenja virusa, u obzir se uzima veliki broj varijabli. Ali sama bit određivanja značajnog pokazatelja statističkih podataka je slična, bez obzira na složenost izračuna i broj varijabilnih vrijednosti.

Kako se izračunava?

Upotrebljava se pri izračunavanju vrijednosti pokazatelja "statističke važnosti" jednadžbe. Odnosno, može se tvrditi da u ovom slučaju sve odlučuje matematika. Najjednostavnija opcija izračuna je lanac matematičkih operacija u koji su uključeni sljedeći parametri:

  • dvije vrste rezultata dobivenih anketama ili proučavanjem objektivnih podataka, kao što je količina kupnji, označena s a i b;
  • indikator veličine uzorka za obje grupe – n;
  • vrijednost kombiniranog udjela uzorka - p;
  • standardna pogreška - SE.

Sljedeći korak je određivanje ukupnog rezultata testa - t, njegova vrijednost se uspoređuje s brojem 1,96. 1,96 je prosječna vrijednost, koja prenosi raspon od 95%, prema Studentovoj funkciji t-distribucije.

Formula za jednostavan izračun
Formula za jednostavan izračun

Često se postavlja pitanje koja je razlika između vrijednosti n i p. Ovu nijansu je lako razjasniti na primjeru. Recimo da se izračunava statistička značajnost lojalnosti bilo kojem proizvodu ili marki muškaraca i žena.

U ovom slučaju, iza slova će slijediti sljedeće:

  • n - broj ispitanika;
  • p - broj zadovoljnih s proizvodom.

Broj intervjuiranih žena u ovom slučaju bit će označen kao n1. Sukladno tome, muškarci - n2. Istu vrijednost imat će brojevi "1" i "2" simbola p.

Uspoređivanje rezultata testa s prosjekom studentskih proračunskih tablica postaje ono što se naziva "statistički značaj".

Što znači potvrda?

Rezultati bilo kojeg matematičkog izračuna uvijek se mogu provjeriti, to se uče djeca u osnovnoj školi. Logično je pretpostavitida se, budući da se statistike određuju pomoću lanca izračuna, provjeravaju.

Međutim, testiranje statističke značajnosti nije samo matematika. Statistika se bavi velikim brojem varijabli i raznim vjerojatnostima, koje su daleko od uvijek podložne izračunu. Odnosno, vratimo li se primjeru gumenih cipela na početku članka, onda logičnu konstrukciju statističkih podataka na koje će se oslanjati kupci robe za trgovine može poremetiti suho i vruće vrijeme, što nije tipično za jesen.. Kao rezultat ovog fenomena, smanjit će se broj ljudi koji kupuju gumene čizme, a prodajna mjesta će pretrpjeti gubitke. Naravno, matematička formula ne može predvidjeti vremensku anomaliju. Ovaj trenutak se zove "greška".

Alati za vizualizaciju statističkih podataka
Alati za vizualizaciju statističkih podataka

To je samo vjerojatnost takvih pogrešaka i uzima u obzir provjeru razine izračunate važnosti. Uzima u obzir i izračunate pokazatelje i prihvaćene razine značaja, kao i količine koje se konvencionalno nazivaju hipotezama.

Koja je razina važnosti?

Koncept "razine" uključen je u glavne kriterije za statističku značajnost. Koristi se u primijenjenoj i praktičnoj statistici. Ovo je vrsta vrijednosti koja uzima u obzir vjerojatnost mogućih odstupanja ili pogrešaka.

Razina se temelji na identifikaciji razlika u gotovim uzorcima, omogućuje vam da utvrdite njihov značaj ili, obrnuto, slučajnost. Ovaj koncept nema samo digitalna značenja, već i njihova osebujna tumačenja. Oni objašnjavajukako trebate razumjeti vrijednost, a sama razina se određuje usporedbom rezultata s prosječnim indeksom, to otkriva stupanj pouzdanosti razlika.

Rasprava o statistici
Rasprava o statistici

Dakle, koncept razine možemo zamisliti jednostavno - ona je pokazatelj prihvatljive, vjerojatne pogreške ili pogreške u zaključcima iz dobivenih statističkih podataka.

Koje razine značaja se koriste?

Statistička značajnost koeficijenata vjerojatnosti pogreške u praksi temelji se na tri osnovne razine.

Prva razina je prag na kojem je vrijednost 5%. Odnosno, vjerojatnost pogreške ne prelazi razinu značajnosti od 5%. To znači da je povjerenje u besprijekornost i nepogrešivost zaključaka donesenih na temelju podataka statističkih istraživanja 95%.

Druga razina je prag od 1%. Prema tome, ova brojka znači da se može voditi podacima dobivenim tijekom statističkih izračuna s pouzdanošću od 99%.

Treći nivo - 0,1%. Uz ovu vrijednost, vjerojatnost pogreške jednaka je djeliću postotka, odnosno pogreške su praktički eliminirane.

Što je hipoteza u statistici?

Pogreške kao koncept podijeljene su u dva područja, koja se tiču prihvaćanja ili odbijanja nulte hipoteze. Hipoteza je koncept iza kojeg se, prema definiciji, krije skup rezultata ankete, drugih podataka ili tvrdnji. To jest, opis distribucije vjerojatnosti nečega što je povezano s predmetom statističkog računovodstva.

statistička značajnost regresije
statistička značajnost regresije

U jednostavnim izračunima postoje dvije hipoteze - nula i alternativna. Razlika među njima je u tome što se nulta hipoteza temelji na ideji da ne postoje temeljne razlike između uzoraka uključenih u određivanje statističke značajnosti, a alternativna joj je potpuno suprotna. Odnosno, alternativna hipoteza temelji se na prisutnosti značajne razlike u ovim uzorcima.

Koje su pogreške?

Pogreške kao koncept u statistici su u izravnom razmjeru s prihvaćanjem ove ili one hipoteze kao istinite. Mogu se podijeliti u dva smjera ili tipa:

  • prvi tip je zbog prihvaćanja nulte hipoteze, koja se pokazala netočnom;
  • drugi - uzrokovano slijeđenjem alternative.
Pregledavanje statističkih grafikona
Pregledavanje statističkih grafikona

Prva vrsta pogreške naziva se lažno pozitivna i prilično je česta u svim područjima gdje se koristi statistika. Prema tome, greška druge vrste naziva se lažno negativna.

Zašto nam je potrebna regresija u statistici?

Statistički značaj regresije je u tome što je uz njezinu pomoć moguće utvrditi koliko model različitih ovisnosti izračunat na temelju podataka odgovara stvarnosti; omogućuje vam da identificirate dovoljnost ili nedostatak čimbenika za računovodstvo i zaključke.

Vrijednost regresije utvrđuje se uspoređivanjem rezultata s podacima navedenim u Fisherovim tablicama. Ili pomoću analize varijance. Pokazatelji regresije su važni kadasložene statističke studije i izračuni koji uključuju veliki broj varijabli, slučajnih podataka i vjerojatnih promjena.

Preporučeni: