Innehållsförteckning:
- Virtualisering av stor dataserver
- Virtuell virtualisering av dataapplikationer
- Virtuell virtualisering av datanätverk
- Stor dataprocessor och minnesvirtualisering
- Stor data- och lagringsvirtualisering
Video: Contain Yourself: An Intro to Docker and Containers by Nicola Kabar and Mano Marks 2024
Att lösa stora datautmaningar kräver hantering av stora volymer av mycket distribuerade datalager tillsammans med användningen av dator- och datintensiva applikationer. Virtualisering ger den ökade effektiviteten för att göra stora dataplattformar verklighet. Även om virtualisering inte är tekniskt ett krav för stor dataanalys, är programvarukramar effektivare i en virtualiserad miljö.
Virtualisering har tre egenskaper som stöder skalbarheten och driftseffektiviteten som krävs för stora datamiljöer:
-
Partitionering: I virtualisering stöds många applikationer och operativsystem i ett enda fysiskt system av partitionering av tillgängliga resurser.
-
Isolering: Varje virtuell maskin är isolerad från värdens fysiska system och andra virtualiserade maskiner. På grund av denna isolering, om en virtuell förekomst kraschar, påverkas inte de andra virtuella maskinerna och värdsystemet. Dessutom delas data inte mellan en virtuell förekomst och en annan.
-
Inkapsling: En virtuell maskin kan representeras som en enda fil, så att du enkelt kan identifiera den baserat på de tjänster som den tillhandahåller.
Virtualisering av stor dataserver
I servervirtualisering delas en fysisk server upp i flera virtuella servrar. Hårdvaran och resurserna hos en maskin - inklusive RAM, CPU, hårddisk och nätverksstyrning - kan virtualiseras i en serie virtuella maskiner som vart och ett driver sina egna applikationer och operativsystem.
En virtuell maskin (VM) är en mjukvarurepresentation av en fysisk maskin som kan utföra eller utföra samma funktioner som den fysiska maskinen. Ett tunt lager av programvara införs faktiskt i hårdvaran som innehåller en virtuell maskinskärm eller hypervisor .
Server virtualisering använder hypervisorn för att ge effektivitet i användningen av fysiska resurser. Naturligtvis är installation, konfiguration och administrativa uppgifter förknippade med att konfigurera dessa virtuella maskiner.
Server virtualisering hjälper till att säkerställa att din plattform kan skala efter behov för att hantera stora volymer och olika typer av data som ingår i din stora dataanalys. Du kanske inte vet omfattningen av volymen som behövs innan du börjar analysen. Denna osäkerhet gör behovet av serverns virtualisering ännu större, vilket ger din miljö möjligheten att möta den obesvarade efterfrågan på att bearbeta mycket stora dataset.
Dessutom tillhandahåller server virtualisering grunden som möjliggör att många av de molntjänster som används som datakällor i en stor dataanalys. Virtualisering ökar effektiviteten i molnet som gör att många komplexa system lättare optimeras.
Virtuell virtualisering av dataapplikationer
Virtualisering av applikationsinfrastruktur ger ett effektivt sätt att hantera applikationer i takt med kundernas efterfrågan. Applikationen är inkapslad på ett sätt som tar bort dess beroenden från det underliggande fysiska datorsystemet. Detta bidrar till att förbättra applikationens övergripande hanterbarhet och portabilitet.
Dessutom tillåter applikationsinfrastruktur virtualiseringsprogrammet typiskt kodifiering av affärs- och teknisk användningspolicy för att se till att alla dina applikationer utnyttjar virtuella och fysiska resurser på ett förutsägbart sätt. Effektivitet uppnås eftersom du lättare kan distribuera IT-resurser enligt det relativa affärsvärdet för dina applikationer.
Virtualisering av applikationsinfrastruktur som används i kombination med servervirtualisering kan bidra till att affärsavtal på affärsnivå uppfylls. Servervirtualisering övervakar CPU och minnesanvändning, men tar inte hänsyn till variationer i företagsprioritet när resurser tilldelas.
Virtuell virtualisering av datanätverk
Nätverksvirtualisering ger ett effektivt sätt att använda nätverk som en pool av anslutningsresurser. I stället för att förlita sig på det fysiska nätverket för hantering av trafik kan du skapa flera virtuella nätverk som alla använder samma fysiska implementering. Detta kan vara användbart om du behöver definiera ett nätverk för datainsamling med en viss uppsättning prestandaegenskaper och kapacitet och ett annat nätverk för applikationer med olika prestanda och kapacitet.
Virtualisering av nätverket hjälper till att minska dessa flaskhalsar och förbättra möjligheten att hantera den stora distribuerade data som krävs för stor dataanalys.
Stor dataprocessor och minnesvirtualisering
Processorvirtualisering hjälper till att optimera processorn och maximera prestanda. Minnesvirtualisering avvecklar minne från servrarna.
I stor dataanalys kan du ha upprepade frågor om stora dataset och skapandet av avancerade analytiska algoritmer, alla avsedda att söka efter mönster och trender som ännu inte förstås. Dessa avancerade analyser kan kräva mycket processorkraft (CPU) och minne (RAM). För vissa av dessa beräkningar kan det ta lång tid utan tillräckliga CPU- och minnesresurser.
Stor data- och lagringsvirtualisering
Datervirtualisering kan användas för att skapa en plattform för dynamiska länkade datatjänster. Detta gör att data enkelt kan sökas och länkas via en enhetlig referenskälla. Som ett resultat ger datervirtualisering en abstrakt tjänst som levererar data i en konsekvent form oavsett den underliggande fysiska databasen. Dessutom exponerar datervirtualisering cachad data till alla applikationer för att förbättra prestanda.
Lagringsvirtualisering kombinerar fysisk lagringsresurser så att de delas mer effektivt. Detta minskar lagringskostnaden och gör det enklare att hantera datalaggar som krävs för stor dataanalys.