Video: My Poetry Teacher 2024
En annan användbar applikation av att sätta in datarammer är att hitta och ta bort rader med saknade data. R-funktionen för att kontrollera att detta är klart. fall (). Du kan prova detta på den inbyggda datasetets luftkvalitet, en dataram med en hel del saknade data: >> str (luftkvalitet)> komplett. fall (luftkvalitet)
Resultaten av komplett. fall () är en logisk vektor med värdet SANT för rader som är fullständiga och FALSE för rader som har några NA-värden. För att ta bort raderna med saknade data från luftkvalitet, försök följande:
Som alltid med R finns det mer än ett sätt att uppnå ditt mål. I det här fallet kan du använda sig av na. omit () för att utelämna alla rader som innehåller NA-värden: >> x <- na. omit (luftkvalitet)
När du är säker på att dina data är rena kan du börja analysera den genom att lägga till beräknade fält.
Om du använder någon av dessa metoder för att dela upp dina data eller rensa bort saknade värden, kom ihåg att lagra resultatet i ett nytt objekt. R ändrar ingenting i den ursprungliga dataramen om du inte uttryckligen skriver över den. Det är en bra sak, för att du inte oavsiktligt kan rensa dina data.