Video: R tutorial - Learn How to Subset, Extend & Sort Data Frames in R 2024
Vektorer, listor och dataramar spelar en viktig roll när det gäller att representera data i R, så det är viktigt att du kortfattat och korrekt anger en delmängd av dina data.
Det finns tre huvudoperatörer som du kan använda för att dela upp dina data:
-
$: Extraherar ett enskilt element med namn från en lista eller dataram. Till exempel iris $ Sepal. Längd extraherar kolumnen Sepal. Längd från datarammen iris.
-
[[: Extraherar ett enda element med namn eller position från en lista eller dataram. Till exempel iris [["Sepal. Längd "]] extraherar kolumnen Sepal. Längd från datarammen; iris; iris [[2]] extraherar det andra elementet från iris.
-
[: Extraherar flera element från en vektor, array, lista eller dataram. Till exempel extraherar iris [c ("Sepal. Length", "Species") kolonnerna Sepal. Längd och art från iris; iris [1: 10,] extraherar de första tio raderna från iris; och iris [1: 10, "Species"] extraherar de första tio elementen i kolonnen Arter från iris.
Fäste för subset, [kan du returnera flera element. Du anger delmängden på ett av fem sätt:
-
Blank: Returnerar allt. Till exempel returnerar iris [] alla iris.
-
Positiv tal: Inkluderar endast dessa element. Till exempel extraherar iris [1: 100, 5] de första hundra elementen i den femte kolonnen av iris.
-
Negativ tal: Exkluderar dessa element. Till exempel utesluter iris [- (1: 100)] de första hundra raderna från iris, medan iris [-5] utesluter den femte kolonnen från iris.
-
Logiskt: Inkluderar om TRUE; utesluter om felaktig. Till exempel extraherar iris [iris $ Species == "setosa"] bara de raderna från iris där art-värdet är "setosa".
-
Namn: Inkluderar alla namn som matchar. Till exempel extraherar iris [c ("Species", "Petal. Width")] kolonnerna Species and Petal. Bredd från iris.