Hem Personliga finanser Företagsarkitektur för stora data - dummies

Företagsarkitektur för stora data - dummies

Video: Per och Sten Sundblad, del 1 2024

Video: Per och Sten Sundblad, del 1 2024
Anonim

I perspektivet kommer målet att utforma en arkitektur för dataanalys ner till att bygga en ram för att fånga, sortera och analysera stora data för ändamålet att upptäcka effektiva resultat.

Tänk på arkitekturen som omvandlar stora data till genomförbara resultat.

Det finns inget korrekt sätt att utforma den arkitektoniska miljön för stor dataanalys. De flesta mönster måste emellertid uppfylla följande krav för att stödja de utmaningar som stora data kan ge. Dessa kriterier kan fördelas huvudsakligen över sex lager och kan sammanfattas enligt följande:

  • Din arkitektur ska innehålla en stor dataplatform för lagring och beräkning, som Hadoop eller Spark, som kan skala ut.
  • Din arkitektur ska innehålla storskalig programvara och stora datainställningar som kan analysera, lagra och hämta stora data. Dessa kan bestå av komponenterna i Spark, eller komponenterna i Hadoop ekosystem (som Mahout och Apache Storm). Du kanske också vill anta ett stort data storskaligt verktyg som ska användas av datavetenskapare i din verksamhet. Dessa inkluderar Radoop från RapidMiner, IBM Watson och många andra.
  • Din arkitektur ska stödja virtualisering. Virtualisering är ett viktigt element i cloud computing eftersom det tillåter att flera operativsystem och applikationer körs samtidigt på samma server. På grund av denna förmåga går virtualisering och cloud computing ofta hand i hand. Du kan också anta ett privat moln i din arkitektur. Ett privat moln erbjuder samma arkitektur som ett offentligt moln, förutom att tjänsterna i ett privat moln är begränsade till ett visst antal användare via en brandvägg. Amazon Elastic Computer Cloud är en av de största leverantörerna av privata molnlösningar och lagringsutrymme för företag, och kan skala när de växer.
  • Din arkitektur kan behöva erbjuda analys i realtid om ditt företag arbetar med snabb data (data som strömmar i strömmar med snabb hastighet). I ett scenario där du skulle behöva överväga en infrastruktur som kan stödja avledning av insikter från data i nära realtid utan att vänta på att data ska skrivas till disken. Till exempel kan Apache Sparks strömmande bibliotek limmas med andra komponenter för att stödja analyser på snabba dataströmmar.
  • Din arkitektur ska redogöra för Big Data-säkerhet genom att skapa ett styrsystem om tillgången till data och resultaten. Den stora datasäkerhetsarkitekturen ska överensstämma med de vanliga säkerhetsmetoderna och principerna i din organisation som styr tillgången till datakällor.

Skikten i företagsdatarkarchitecturen.

Om du letar efter ett robust verktyg för att hjälpa dig att komma igång med dataanalys utan att behöva ha expertis i algoritmerna och komplexiteten bakom att bygga prediktiva modeller, bör du bland annat prova KNIME, RapidMiner eller IBM Watson.

De flesta av de föregående verktygen erbjuder en omfattande, färdig verktygslåda som består av funktioner som kan komma igång. Till exempel har RapidMiner ett stort antal algoritmer från olika tillstånd i den predictive analytics livscykeln, så det ger en enkel väg att snabbt kombinera och distribuera analysmodeller.

Med RapidMiner kan du snabbt ladda och förbereda dina data, skapa och utvärdera prediktiva modeller, använda dataprocesser i dina applikationer och dela dem med dina företagsanvändare. Med mycket få klick kan du enkelt bygga en enkel prediktiv analysmodell.

Dra och släpp analys med RapidMiner.

RapidMiner kan användas av både nybörjare och experter. RapidMiner Studio är en programprogramvara med öppen källkod som har ett användarvänligt grafiskt gränssnitt där du kan dra och släppa algoritmer för datalastning, dataförbehandling, prediktiva analysalgoritmer och modellutvärderingar för att bygga upp din dataanalysprocess.

RapidMiner byggdes för att ge datavetenskapare en omfattande verktygslåda som består av mer än tusen olika operationer och algoritmer. Data kan laddas snabbt, oavsett om din datakälla finns i Excel, Access, MS SQL, MySQL, SPSS, Salesforce eller något annat format som stöds av RapidMiner. Förutom datatillförsel, prediktiv modellbyggnad och modellutvärdering ger detta verktyg dig också verktyg för datavisualisering som inkluderar justerbara självorganiserande kartor och 3-D-grafer.

RapidMiner erbjuder ett öppet program för programmeringsgränssnitt (API) som gör att du kan integrera dina egna algoritmer i en pipeline som är inbyggd i RapidMiner. Det är också kompatibelt med många plattformar och kan köras på större operativsystem. Det finns ett framväxande internetgemenskap för datavetenskapare som använder RapidMiner där de kan dela sina processer och fråga och svara på frågor.

Ett annat lättanvänt verktyg som används allmänt i analysvärlden är KNIME. KNIME står för Konstanz Information Miner. Det är en öppen källdataanalys som kan hjälpa dig att bygga prediktiva modeller genom ett datapipeliningskoncept. Verktyget erbjuder drag-och-släpp-komponenter för ETL (extraktion, transformation och laddning) och komponenter för prediktiv modellering samt datavisualisering.

KNIME och RapidMiner är verktyg som du kan få ditt datavetenskapsteam att enkelt komma igång med att bygga prediktiva modeller. För ett utmärkt användarfall på KNIME, kolla in papperet "De sju teknikerna för dimensionalitetsminskning. "

RapidMiner Radoop är en produkt av RapidMiner som utökar predictive analytics verktygslådan på RapidMiner Studio för att köras på Hadoop och Spark-miljöer.Radoop inkapslar MapReduce, Pig, Mahout och Spark. När du har definierat dina arbetsflöden på Radoop, utförs instruktionerna i Hadoop eller Spark-miljön, så du behöver inte programmera prediktiva modeller utan fokusera på modellbedömning och utveckling av nya modeller.

För säkerhet stöder Radoop Kerberos-autentisering och integreras med Apache Ranger och Apache Sentry.

Företagsarkitektur för stora data - dummies

Redaktörens val

Fastighetsprofessionens grunder för fastighetslicensexamen - dummies

Fastighetsprofessionens grunder för fastighetslicensexamen - dummies

Fastighetsexamen kommer att förvänta dig att du har ett grundläggande grepp på fastighetsbranschen. Du tror att det bara är uppenbart att veta vad de viktigaste spelarna gör i en fastighetsaffär, men på grund av den terminologi de delar, blir skillnaderna mellan spelarna lite muddlade. Här är snabba beskrivningar ...

Kostnadsmetoden för fastighetslicensexamen - dummies

Kostnadsmetoden för fastighetslicensexamen - dummies

En metod för att uppskatta Värdet på fastigheter kallas kostnaden. Du måste känna till formeln för fastighetslicensexamen. Kostnadsmetoden baseras på tanken att komponenterna i en fastighet eller marken och byggnaderna kan läggas till för att komma fram till ...

Studie för fastighetslicensexamen - dummies

Studie för fastighetslicensexamen - dummies

När var sista gången du tog en multipelvalsexamen ? Eller, för den delen, någon examen? Det är troligt att det var länge sedan. Kanske överväger du huruvida du ska bli en fastighetsmäklare, men du är lite avskräckt av tanken på att du måste göra ett test. Vad du kan ...

Redaktörens val

Följer ett basketspel på tv - dummies

Följer ett basketspel på tv - dummies

Du kommer bli mycket mer ute av att titta på ett basketspel på TV - eller till och med leva - om du gör mer än att se bollen gå in i rammen. Kolla in dessa insider tips för att fånga den verkliga åtgärden och öka din njutning av sporten. Förutse nästa pass Försök att tänka som ...

Top 5 Fantasy Basketball League Sites - Dummies

Top 5 Fantasy Basketball League Sites - Dummies

Att hitta och gå med på en fantasy basketplats kan ibland vara skrämmande uppgift eftersom så många alternativ är tillgängliga och de flesta webbplatser ser lika ut. Bara för att webbplatser ser ut som det betyder inte nödvändigtvis att de mäter i värde. Vissa webbplatser erbjuder gratis ligor, andra betalade - och vissa webbplatser tillhandahåller bara standard liga ...

Tryck på motståndarna i Basket - Dummies

Tryck på motståndarna i Basket - Dummies

Pressen är kort för tryck. Ofta kallad en fullrättspress, det här är ett anfallande försvar som används på backen, där målet är att tvinga en omsättning. Vanligtvis används efter en gjord korg, svänger pressgruppen över motståndarna i backcourt; Om motståndarna lyckas få bollen förbi halvvägs (kallad brytning ...

Redaktörens val

Hur R beräknar oändliga, odefinierade och saknade värden - dummies

Hur R beräknar oändliga, odefinierade och saknade värden - dummies

Lyckligtvis kan R hantera dataanomalier som förvirrar några andra statistiska plattformar. I vissa fall har du inte reella värden att beräkna med. I de flesta verkliga dataset saknas faktiskt åtminstone några värden. Dessutom har vissa beräkningar oändlighet som ett resultat (som att dividera med noll) eller kan inte ...

Hur man lägger till linjer i en plot i R-dummies

Hur man lägger till linjer i en plot i R-dummies

I R, lägger du till rader i en plott på ett mycket liknande sätt att lägga till poäng, förutom att du använder funktionen linjer () för att uppnå detta. Men använd först lite R magi för att skapa en trendlinje genom data, kallad en regressionsmodell. Du använder lm () -funktionen för att uppskatta en linjär ...

Hur man lägger till en andra dimension i R-dummies

Hur man lägger till en andra dimension i R-dummies

Förutom vektorer kan R representera matriser som ett objekt du arbetar och beräknar med. Faktum är att R verkligen lyser när det gäller matrisberäkningar och -operationer. Vektorer är nära relaterade till en större klass av objekt, arrays. Arrayer har två mycket viktiga egenskaper: De innehåller bara en enda typ av värde. De har ...