电子竞技入亚运会 或改变电子游戏的大众形象
A leíró statisztika a statisztikának azon területe, ami egy információhalmaznak a f? jellemz?it kvantitatív módon írja le.[1] A leíró statisztika elkül?nül a k?vetkeztetési (vagy más néven induktív) statisztikától: a k?vetkeztetési statisztika (mint például a hipotézisvizsgálatok) során a populáció valamely tulajdonságára k?vetkeztetünk. R?viden ?sszefoglalva: a leíró statisztika a mintát, a k?vetkeztetési statisztika a populációt igyekszik megragadni.
Ez általánosságban annyit jelent, hogy a leíró statisztika, a k?vetkeztetési statisztikákkal ellentétben, nem valószín?ségszámításon[2] alapul. Annak ellenére, hogy az adatelemzés során használt k?vetkeztetési statisztikákkal a f? k?vetkeztetéseinket le tudjuk vonni a populációról, szükség van egy általános jellemzést is megadni, amihez leíró statisztikákat alkalmazunk. Például pszichológiai kísérletek esetében tipikusan szerepelnie kell, leggyakrabban táblázat formájában, a teljes minta nagyságának, az egyes alcsoportokban (például kísérleti csoport vagy kontrollcsoport) szerepl? résztvev?k számának illetve, egyéb demográfiai jellemz?knek, mint például a minta átlagéletkora, nemi arány, iskolai végzettségek aránya, stb.
Legfontosabb leíró statisztikai mutatók
[szerkesztés]A leggyakrabban alkalmazott leíró statisztikáknak három f? csoportját kül?níthetjük el:[3]
Elhelyezkedési mutatók
[szerkesztés]- átlag: az eloszlás centruma.
- Medián: az adatok n?vekv? sorában a k?zéps?.
- Módusz: a legtipikusabb (leggyakoribb) érték.
- Percentilis: n-edik percentilis a változó azon kategóriája, amely az ?sszes érték éppen n százalékánál nagyobb. Például a medián az 50. percentilis.
- Kvantilisek: a mintát adott arányban két részre osztó pontok. Felez?pont a medián, negyedel? pontok a kvartilisek, századolópontok a percentilisek.
Szóródási mutatók
[szerkesztés]- Terjedelem: az adatok legnagyobb és legkisebb elemének a kül?nbsége. Minél kisebb, annál jobban jellemzi a mintát.
- Szórás: a változó (vagy akár egy egész csoport) átlagtól (k?zépértékt?l) való eltérését mutatja meg. Alacsony szórás esetén az értékek er?sen k?zelítenek az átlaghoz, míg magas szórás estén az értékek távol esnek az átlagtól.
- Variancia (szórásnégyzet): azt mutatja meg, hogy egy valószín?ségi változó milyen mértékben szóródik a várható (k?zép) értékt?l.Tulajdonképpen ugyanaz a mutató mint a szórás, csak itt négyzetre van emelve.
- Interkvartilis terjedelem: az interkvartilis terjedelem azt az intervallumot jel?li, ahol az ?sszes érték k?zéps? 50%-a helyezkedik el.
Eloszlás alakja
[szerkesztés]- Ferdeség: azt mutatja meg, hogy mennyire szimmetrikus a valószín?ségi változó eloszlása.
- Csúcsosság: azt mutatja meg, hogy a valószín?ségi változó ?lapossága”/”csúcsossága” hogyan viszonyul a normál eloszlásáéhoz.
Fontos kiemelni, hogy a fent szerepl? leíró statisztikai mutatók folytonos változók esetében használandók (kivéve a móduszt és a mediánt). Diszkrét változók esetében gyakran alkalmazott leíró statisztika a gyakorisági eloszlás vizsgálata, amely megmutatja, hogy a minta elemei hogyan oszlanak meg a csoportok k?z?tt.
ábrázolási módok
[szerkesztés]A leíró statisztikai módszereket a leíró szerepb?l fakadóan leginkább a mintáról és a megfigyelésekr?l alkotott ?sszefoglalásként vagy adatrendszerezésként használják. Az ?sszegzések lehetnek kvantitatívak, azaz ?sszefoglaló statisztikák, vagy vizuálisak, azaz az értelmezést segít? grafikonok. íme, néhány példa a leíró statisztikában alkalmazott grafikonokra:
Oszlopdiagram
[szerkesztés]Az oszlopdiagram egy olyan típusú diagram, ami a kül?nb?z? diszkrét (kategorikus) változók egyes kategóriáihoz tartozó gyakoriságokat mutatja.
Hisztogram
[szerkesztés]A hisztogram egy olyan oszlopdiagram, ami a folytonos szint? változók értékeinek eloszlását mutatja meg. A hisztogramot el?sz?r Karl Pearson alkalmazta (az elnevezése is t?le ered, amely eredetileg ?historical diagram” volt).[4]
Dobozdiagram
[szerkesztés]A dobozdiagram (angolul ?box plot”) egy, a kvartilisek mentén t?rtén? grafikus ábrázolási módja a változóknak. A dobozdiagramokat gyakran ábrázolják úgy, hogy a ?dobozokból kinyúlnak” vertikálisan kiterjed? vonalak jelezve a variabilitás fels? és alsó kvartiliseit. A kiugró (outlier) értékek id?nként kül?n pontokként ábrázolódnak. A dobozdiagramok nem-parametrikusak: egy populációból származó minták eltéréseit ábrázolják, anélkül, hogy bármilyen feltételezést tennének a m?g?ttes valószín?ség-eloszlásról. A dobozok kül?nb?z? részei k?z?tti távolságok az adatok szóródási fokát és a ferdeséget, valamint a kilógó értékeket jelzik. A dobozdiagramok lehetnek horizontális vagy vertikális irányúak is.
Alkalmazása a statisztikai elemzésekben
[szerkesztés]A leíró statisztikán alapuló ?sszegzések képezhetik a k?vetkeztetési statisztikákon alapuló, bonyolultabb statisztikai elemzések alapját, vagy ?nmagukban is elegend?ek lehetnek egy adott vizsgálathoz. Utóbbira példa kosárlabdában a kosárra dobások százaléka, ami ?sszefoglalja egy játékos vagy a csapat teljesítményét. Ez a szám a találatok száma elosztva a dobások számával. Például, ha egy játékos, aki 33%-os aránnyal dob, annak k?rülbelül minden harmadik dobása kosár. A százalék itt ?sszefoglal vagy leír t?bb diszkrét eseményt. Vagy vehetjük példaként a tanulmányi átlagot. Ez az egyetlen szám leírja egy tanuló általános teljesítményét az adott id?periódusban az ?sszes tantárgyára kapott jegyei alapján.[5]
A leíró és ?sszegz? statisztikák használatának vaskos t?rténete van, valójában a kül?nb?z? populációkról szóló kimutatások és gazdasági adatok igénye révén vált ismertté (f?leg leíró statisztikai eszk?z?ket alkalmaztak). Az utóbbi id?ben egy, az ?sszefoglaló technikákról szóló gy?jtemény is ?sszeállt feltáró adatelemzés címszóval. Az üzleti szférában a leíró statisztikák hasznos ?sszefoglaló jellemzéseket biztosítanak a legkül?nfélébb adatokról. A befektet?k, brókerek gyakran használnak áttekintéseket a hozamok alakulásáról, empirikus és analitikai elemzéseket alkalmaznak a befektetésekre annak érdekében, hogy jobb befektetési d?ntéseket hozzanak a j?v?ben.
Egyváltozós elemzés
[szerkesztés]Az egyváltozós elemzés egyetlen változó eloszlásának leírását jelenti, beleértve az elhelyezkedési mutatókat (átlag, medián, módusz), az eloszlási mutatókat (adathalmaz eloszlása és kvantilisei) és a szóródási mutatókat (variancia, szórás). Az eloszlás alakja is jellemezhet? a ferdeségi és csúcsossági mutatókkal. Egy változó eloszlásának jellegzetességeit ábrázolhatjuk grafikon vagy táblázat formájában, például hisztogrammal vagy stem-and-leaf display-jel.
T?bbváltozós elemzés
[szerkesztés]Amikor a minta egynél t?bb változóból áll, a leíró statisztikákkal ábrázolhatjuk a változók k?z?tti kapcsolatot. Ebben az esetben olyan leíró statisztikákat használunk, mint kereszttáblázat (cross-tab) és kontingencia táblázatok pontdiagramok a függ?ség kvantitatív vizsgálata feltételezett eloszlás leírása. Az egyváltozós és t?bbváltozós elemzések k?z?tti kül?nbségtétel f? oka az, hogy a t?bbváltozós elemzés nem egyszer?en leíró elemzés, hanem kett?nél t?bb változó k?z?tti kapcsolatok leírása.[6] A függ?séget mér? kvantitatív módszerek k?zé tartozik a korreláció (mint például a Person-féle, melyet két folytonos változó esetén használunk, vagy a Spearman-féle, ha az egyik vagy egyik változónk sem folytonos eloszlású) és a kovariancia (ami annak a skálának jellemzése, melyen a változóinkat mérjük).
Jegyzetek
[szerkesztés]- ↑ Mann, Prem S. (1995). Introductory Statistics (2nd ed.). Wiley. ISBN 0-471-31009-3.
- ↑ Dodge, Y. (2003). The Oxford Dictionary of Statistical Terms. OUP. ISBN 0-19-850994-4.
- ↑ Investopedia, Descriptive Statistics Terms
- ↑ M. Eileen Magnello (December 2006). "Karl Pearson and the Origins of Modern Statistics: An Elastician becomes a Statistician". The New Zealand Journal for the History and Philosophy of Science and Technology. 1 volume. OCLC 682200824.Trochim, William M. K. (2006). "Descriptive statistics". Research Methods Knowledge Base. Retrieved 14 March 2011.
- ↑ Trochim, William M. K. (2006). "Descriptive statistics". Research Methods Knowledge Base. Retrieved 14 March 2011.
- ↑ Babbie, Earl R. (2009). The Practice of Social Research (12th ed.). Wadsworth. pp. 436–440. ISBN 0-495-59841-0.