Video: A stream of strong supporters!! 2024
När du arbetar med text i R kan du behöva hitta ord eller mönster i text. Föreställ dig att du har en lista över staterna i USA, och du vill ta reda på vilka statliga namn består av två ord.
För att hitta substrängar kan du använda grep () -funktionen, som tar två viktiga argument:
-
mönster : Mönstret du vill hitta.
-
x : Teckenvektorn du vill söka.
Så, hur hittar du namnen på alla stater med mer än ett ord? Det här är lätt när du inser att du kan ställa in frågan genom att hitta alla de stater som innehåller ett mellanslag: >> state. namn "grep" "New Hampshire" "New Jersey" [3] "New Mexico" "New York" [5] "North Carolina" "North Dakota" [7] "Rhode Resultatet inkluderar alla stater som har två ord namn, till exempel New Jersey, New York, North Carolina, South Dakota och West Virginia..
Du kan se från den här listan att det inte finns några statnamn som innehåller
öst.Du kan bekräfta detta genom att göra en annan sökning: >> state. namn [grep ("öst", stat. namn)] tecken (0) när resultatet av en teckenoperation är en tom vektor (det finns ingenting i det), representerar R det som tecken (0). På samma sätt representeras en tom eller noll längd, numerisk vektor med heltal (0) eller numeriskt (0).
R skiljer mellan NULL och en tom vektor. NULL betyder vanligtvis att något är odefinierat. Detta skiljer sig subtilt från något som är tomt. Till exempel är en teckenvektor som råkar ha inga element fortfarande en teckenvektor representerad av tecken (0).