Video: Så får du hunden att sluta skälla - Nyhetsmorgon (TV4) 2024
Apache Oozie ingår i varje större Hadoop-distribution, inklusive Apache Bigtop. I ditt Hadoop-kluster ska du installera Oozie-servern på en kantnod, där du också skulle köra andra klientapplikationer mot gruppens data, som visas.
Edge noder är avsedda att vara en gateway för det utvändiga nätverket till Hadoop-klustret. Detta gör dem ideala för dataöverföringsteknik (Flume, till exempel), men även klientapplikationer och annan applikationsinfrastruktur som Oozie. Oozie behöver inte en dedikerad server och kan enkelt samexistera med andra tjänster som är idealiska för kantnoder, som Pig and Hive.
När Oozie har implementerats är du redo att starta Oozie-servern. Oozies infrastruktur är installerad i katalogen $ OOZIE_HOME. Därifrån, kör oozie-start. sh kommandot för att starta servern. (Som du kan förvänta dig, innebär det att du stoppar servern med att skriva oozie-stop. Sh.) Du kan testa statusen för din Oozie-instans genom att köra kommandot
oozie admin-status
När du har installerat Oozie-servern och startat, du kan katalogisera och köra dina olika arbetsflöden, koordinator eller buntjobb. När du arbetar med dina jobb lagrar Oozie katalogdefinitionerna - data som beskriver alla Oozie-objekt (arbetsflöde, koordinator och buntjobb) - liksom deras tillstånd i en dedikerad databas.
Som standard är Oozie konfigurerad att använda den inbäddade Derby-databasen, men du kan använda MySQL, Oracle eller PostgreSQL, om du behöver.
Du har fyra alternativ för att interagera med Oozie-servern:
-
Java API: Det här alternativet är användbart i situationer där du har en egen schemaläggningskod i Java-program och du måste kontrollera exekveringen av din Oozie-arbetsflöden, koordinatorer eller buntar från din ansökan.
-
REST API: Igen fungerar det här alternativet bra i de fall där du vill använda din egen schemaläggningskod som grundval för dina Oozie-arbetsflöden, koordinatorer eller buntar eller om du vill bygga ditt eget gränssnitt eller utöka en befintlig för att administrera Oozie-servern.
-
Kommandoradsgränssnitt (CLI): Det är det traditionella Linux-kommandoradsgränssnittet för Oozie.
-
Oozie webbkonsol: Okej, kanske du inte kan göra mycket interaktion här, men Oozie Web Console ger dig en (skrivskyddad) bild av Oozie-serverns tillstånd, vilket är användbart för att övervaka dina Oozie jobb.
Hue, ett Hadoop administrationsgränssnitt, ger ett annat verktyg för att arbeta med Oozie.Oozies arbetsflöden, koordinatorer och buntar definieras alla med hjälp av XML, vilket kan vara tråkigt att redigera, speciellt för komplexa situationer. Hue ger ett GUI-designverktyg för att grafiskt bygga arbetsflöden och andra Oozie-objekt.
Oozie innehåller en inbäddad Tomcat-webbserver, som hanterar inmatning och utmatning.