Video: What is a Chromosome? 2024
En samling av kombinerade bokstäver och ord kallas en -sträng. När du arbetar med text måste du kunna sammanfatta ord (stränga dem tillsammans) och dela dem ihop. I R använder du funktionen pasta () för att sammanfatta och funktionen strsplit () delas upp. I det här avsnittet visar vi dig hur du använder båda funktionerna.
Skapa först en teckenvektor som heter pangram och tilldela värdet "Snabbbrunträven hoppar över den lata hunden" enligt följande:
För att dela upp texten i
ordgränserna (mellanslag), kan du använda strsplit () enligt följande: >> strsplit (pangram, "" [[1]] [1] "" "" snabbt "" brunt " hund " Observera att den ovanliga första raden av strsplit () s utdata består av [[1]]. På liknande sätt som R visar vektorer, betyder [[1]] att R visar det första elementet i en lista. Listor är extremt viktiga begrepp i R; De låter dig kombinera alla typer av variabler.
I föregående exempel har denna lista endast ett enda element. Ja, det är rätt: Listan har ett element, men det här elementet är en vektor.
För att extrahera ett element från en lista måste du använda dubbla hakparenteser. Dela din pangram i ord och tilldela det första elementet till en ny variabel som kallas ord, med dubbla kvadrat-parenteser ([[]]), som följer:ordord [1] "" brun "" fox "" hoppar "" över "" "" lat "" hund "
För att hitta de unika elementen i en vektor, inklusive en vektor med text, använder du den unika () -funktionen. I de variabla orden visas "the" två gånger: en gång i små bokstäver och en gång med den första bokstaven aktiverad. För att få en lista över de unika orden, konvertera du först ord till små bokstäver och använd sedan unik:
>> unikt (tolower (ord)) [1] "" "snabb" "brun" "räv" "hoppar" "över" "lat" [8] "hund"