Video: Ruby on Rails by Leila Hofer 2024
På statistikområdet kan man skilja mellan variabler av olika typer är mycket viktiga. Typ av data bestämmer ofta vilken typ av analys som kan utföras. Som ett resultat ger R möjlighet att explicit klassificera data enligt följande:
-
Nominella data: Denna typ av data, som du representerar i R med hjälp av faktorer, skiljer mellan olika kategorier, men det finns ingen implicit ordning mellan kategorier. Exempel på nominella data är färger (röd, grön, blå), kön (man, kvinna) och nationalitet (brittiska, franska, japanska).
-
Ordinaldata: Ordinaldata särskiljs av det faktum att det finns någon form av naturlig ordning mellan element men ingen indikation på den relativa storleksskillnaden. Alla typer av data som är möjliga att rangordna i ordning men inte ge exakta värden till är ordinära. Exempelvis beskriver låg << medium << högt data som beställs med tre nivåer. I marknadsundersökningar är det mycket vanligt att använda en fempunktskala för att mäta perceptioner: håller kraftigt motsäger
rödDetta är också ett exempel på ordinaldata.
för att ange projektstatus. I R använder du beställda faktorer för att beskriva ordinära data. Numeriska data: Du har numeriska data när du kan beskriva dina data med siffror (till exempel längd, vikt eller räkning). Numeriska data har två underkategorier.
-
Intervallskalad data: Du har intervallskalad data när intervallet mellan intilliggande måttenheter är detsamma, men nollpunkten är godtycklig. Ett vardagligt exempel på intervallskalad data är vårt kalendersystem. Varje år har samma längd, men nollpunkten är godtycklig. Med andra ord, tid började inte på året noll - använd bara ett bekvämt år för att börja räkna. Det betyder att du kan lägga till och subtrahera datum (och alla andra typer av intervallskalad data), men du kan inte meningsfullt dela upp datum. Andra exempel är longitud, liksom allt annat där det kan vara meningslöst om var utgångspunkten är.
-
I R kan du använda heltal
eller numeriska objekt för att representera intervallskalad data. Fördelad data: Det här är data där alla typer av matematiska operationer är tillåtna, i synnerhet förmågan att multiplicera och dela (med andra ord ta förhållanden).De flesta data i fysik är förhållandevis skalade - till exempel längd, massa och hastighet. I R använder du
-
numeriska objekt för att representera förhållandeskalad data.
-