Datele sunt un set de fapte sau valori, cum ar fi numerele cuvintelor, masuratorile si descrierile variabilelor. Termenul „date” este in general considerat plural. Forma sa singulara este „datum”, care reprezinta o singura valoare a unei singure variabile.
Datele sunt utilizate in aproape toate domeniile, inclusiv:
- Finante (datorii, rate ale dobanzii),
- Managementul afacerii (venituri, marje de profit),
- Guvernanta (rate de alfabetizare, rate ale somajului),
- Organizatii non-profit (numarul persoanelor fara adapost) si
- Cercetare stiintifica (date observationale, experimentale, derivate).
Exista literalmente nenumarate forme de date. Ceea ce este interesant este ca toate aceste date pot fi impartite in doua categorii: cantitativa si calitativa.
Date cantitative
Datele cantitative sunt informatii care pot fi masurate folosind cifre si valori. Acest tip de date este utilizat in principal pentru calcule matematice si analize statistice. Un esantion poate fi usor evaluat si verificat folosind diverse tehnici matematice.
Datele cantitative sunt in general concise si inchise. Sunt adesea folosite pentru a pune intrebari precum „cate” sau „cat”, urmate de informatii concludente.
Exemple simple de date cantitative includ numarul de tigri dintr-o gradina zoologica, greutatea unei persoane, pretul unui produs si temperatura interioara.
Date calitative
Datele calitative nu sunt statistice, ceea ce inseamna ca nu pot fi exprimate in cifre. Ele pot fi semi-structurate sau nestructurate.
Spre deosebire de datele cantitative, datele calitative sunt deschise pentru explorare. Ele pot fi folosite pentru a pune intrebari precum „de ce” sau „cum”. Datele obtinute din cercetarea calitativa sunt utilizate pentru interpretari, teoretizari si construirea de ipoteze si intelegeri initiale.
Exemple simple de date calitative includ culoarea cerului, numele, mirosul si etnia, cum ar fi asiaticul, afro-americanul.
Datele cantitative si calitative pot fi subdivizate in patru grupuri. Pentru a explica mai bine aceste unitati de informatii, am enumerat toate cele patru tipuri majore de date in statistici.
4. Date ordinale
Datele calitative si cantitative pot fi impartite si ele in 4 categorii, conform graficului de mai sus.
Datele ordinale sunt date categorice in care valorile urmeaza o ordine naturala. Diferenta dintre valorile datelor este oarecum lipsita de sens sau nu poate fi determinata.
In scale ordinale, ordinea conteaza, dar nu diferenta dintre valori.
Sa luam in considerare un sondaj in care 100 de persoane care castiga intre 30.000 si 150.000 USD pe an au fost rugati sa isi evalueze nivelul de fericire financiara.
Un tip de la livrari care castiga 60.000 de dolari pe an poate fi pe o scara de 9/10, in timp ce un fizician senior castiga rate de 100.000 de dolari cu 5/10. Acest lucru arata ca scala este influentata de alegerile personale si nu datorita vreunui standard predefinit.
Caracteristici cheie ale datelor ordinale
- Valorile ordinale arata doar secventa
- Numerele pot fi atribuite datelor ordinale
- Calculele matematice nu pot fi facute cu valori ordinale
- Diferentele dintre numerele ordinale pot fi sau nu egale
In general, valorile ordinale sunt evaluate prin intrebari cu sondaje inchise care ofera participantilor mai multe raspunsuri posibile din care sa aleaga. In stiintele sociale, acest tip de date sunt colectate folosind scara Likert, care este alcatuita din 3 sau mai multe intrebari de tip Likert.
Exemple de valori ordinale includ
- Nivel de studii (liceu, absolvent, postuniversitar, doctorat)
- Stare economica sociala (venituri mici, venituri medii, venituri mari)
- Evaluarea satisfactiei (extrem de nefericit, nefericit, neutru, fericit, extrem de fericit)
Majoritatea companiilor utilizeaza instrumente de vizualizare pentru a analiza datele ordinale colectate de la clientii si angajatii lor. Aceste instrumente reprezinta date in tabele in care fiecare rand indica o categorie distincta. Unele prezinta date in diagrame si bare usor de inteles.
3. Date nominale
Datele nominale sunt un grup de variabile non-parametrice care sunt utilizate pentru denumirea sau etichetarea lucrurilor.
O scara nominala consta dintr-o variabila cu categorii care nu au nicio ordine sau clasare. Desi puteti atribui numere variabilelor nominale daca doriti, ordinea va ramane arbitrara, iar calculele matematice (cum ar fi media, mediana si deviatia standard) nu ar avea sens.
De exemplu, foarte mare, inalt, foarte scazut, scazut, mediu sunt toate datele nominale atunci cand sunt luate in considerare individual. Cu toate acestea, atunci cand le puneti pe o scala si le aranjati intr-o ordine specifica (foarte mare, inalt, mediu, scazut, foarte scazut), acestea devin date ordinale.
De obicei, datele nominale sunt colectate prin intrebari cu raspuns multiplu, intrebari deschise si inchise. De exemplu,
- Din ce oras esti? (urmat de o lista derulanta a oraselor din tara)
- Care este domeniul dvs. de studiu? (urmat de o caseta de text necompletata)
Caracteristici cheie ale datelor nominale
- Datele nominale nu pot fi cuantificate
- Nu li se poate atribui un ordin definit
- Colectarea nominala a datelor nu include scale de evaluare
- Media si abaterea standard nu pot fi stabilite chiar daca datele sunt aranjate in ordine
Cel mai eficient mod de a analiza datele nominale este tehnica de grupare, in care variabilele sunt grupate in grupuri, iar pentru fiecare grup se poate calcula procentul sau frecventa. De asemenea, poate fi prezentat in diferite forme vizuale, cum ar fi prin utilizarea unei bare sau a unui grafic cu bule.
Datele nominale nu pot fi procesate prin operatii matematice, dar puteti utiliza metode statistice avansate pentru a le analiza in detaliu. Testul chi patrat, de exemplu, determina daca exista o diferenta substantiala intre frecventa estimata si frecventa observata a valorilor date.
2. Date discrete
2. Date discrete
Datele discrete pot lua doar anumite valori. Aceste valori sunt in mare parte numere intregi pozitive si nu pot fi impartite in parti mai mici. De exemplu, numarul angajatilor care lucreaza intr-o companie sunt date discrete. Nu puteti numara 21,5 sau -21 angajati.
Datele discrete pot contine un numar infinit de valori, dar fiecare este distincta si nu exista nicio alta valoare intre ele. Valoarea poate fi numerica (cum ar fi numarul de dispozitive) sau categorica (cum ar fi masculin sau feminin, rosu sau albastru sau adevarat sau fals).
Caracteristicile datelor discrete
- Datele discrete pot lua doar valori specifice
- Valorile pot fi numarate
- Valorile nu pot fi impartite in bucati mai mici
- Datele pot fi vizualizate si demonstrate cu usurinta
Valorile discrete nu trebuie neaparat sa fie numere intregi. De exemplu, este posibil sa aveti o dimensiune de pantof de 8,5, care este o valoare fixa. Nu puteti cumpara un pantof de marimea 8.23.
Un exemplu industrial de date discrete
Datele dintr-un test al masinii de spalat (trecere sau esec) pot fi colectate pentru a vedea daca masina este pregatita pentru expediere. Inginerii pot analiza o anumita masina prin
- verificarea de cate ori a trecut sau a esuat testul masinii
- efectuarea a 20 de teste suplimentare pe parcursul a doua zile
Pe baza rezultatelor, inginerii pot clasifica fiecare unitate ca trecere (operabila intr-un anumit interval de volti) sau esec.
Datele discrete pot fi prezentate in diferite grafice. Graficul cu bare este cel mai eficient mod de a afisa date discrete, deoarece valorile finite pot fi afisate clar prin bare orizontale sau verticale. Tabelul de frecvente poate reprezenta, de asemenea, in mod clar valori discrete prin semne de cont si frecventa fiecarei variabile.
1. Date continue
Datele continue pot fi masurate pe o scara infinita. Pot lua orice valoare intre doua variabile, oricat de mici ar fi. De exemplu, greutatea unei persoane ar putea fi orice valoare (in limitele greutatilor umane), nu doar o cifra fixa. Poate fi un numar intreg (75) sau un numar zecimal (74,92).
Caracteristici cheie ale datelor continue
- Datele continue contin variabile aleatorii, care pot fi sau nu intregi.
- Se pot schimba in timp si pot avea valori diferite la intervale de timp diferite.
- Pot fi masurate prin tehnici de analiza a datelor, cum ar fi curbe si grafice liniare.
- Puteti calcula abaterea standard (spread), media (centru) si masura claritatea varfului unei curbe de distributie a frecventei (numita kurtosis). In general, puteti rezuma datele cu statistici descriptive.
- Acest nivel de detaliu este esential pentru ingineri, cercetatori, producatori, pentru a numi doar cateva. Diferite industrii si entitati comerciale folosesc acest tip de date datorita aplicatiilor lor vaste.
- Datele continue fac mai usor pentru intreprinderi sa-si analizeze cu precizie numarul folosind doar esantioane mici sau restranse. Aceste informatii nu numai ca ofera informatii detaliate despre sursele multiple de variatie, ci ajuta si companiile sa inteleaga de ce cifrele cheie si statisticile se schimba.
Pentru a analiza eficient datele continue, majoritatea companiilor utilizeaza o metoda numita analiza de regresie. Este un mod fiabil de a identifica ce variabile au cel mai mare impact asupra unui subiect de interes, modul in care aceste variabile se influenteaza reciproc si ce variabile pot fi ignorate.