Video: Principerna för kontaktböner (salat) svenskt text 2024
När det gäller Sqoop är en bild ofta värd tusen ord, kolla in figuren, som ger dig ett fågelperspektiv av Sqoop-arkitekturen.
Tanken bakom Sqoop är att den utnyttjar map uppgifter - uppgifter som utför parallellimport och export av relationsdatabasen tabeller - direkt från Hadoop MapReduce-ramen. Det här är bra nyheter, eftersom MapReduce-ramverket ger feltolerans för import och export jobb tillsammans med parallell bearbetning!
Du kommer att uppskatta feltoleransen om det uppstår ett misslyckande vid import eller export av ett stort bord, eftersom MapReduce-ramverket kommer att återställas utan att du behöver starta processen om igen.
Sqoop kan importera data till Hive och HBase. Observera dock att pilarna till Hive och HBase pekar i endast en riktning. Data som lagras i en relationsdatabas med JDBC-stöd kan direkt importeras till Hive eller HBase-systemen med Sqoop. Export utförs emellertid från data lagrade i HDFS.
Därför, om du behöver exportera dina Hive-tabeller, pekar du på Sqoop till HDFS-kataloger som lagrar dina Hive-tabeller. Om du behöver exportera HBase-tabeller måste du först exportera dem till HDFS och sedan utföra Sqoop-exportkommandot.