Arbetar med grafdata i Python for Data Science - dummies

Video: Vad jag arbetar med! 2025

De flesta datavetenskapare måste arbeta med grafdata vid någon tidpunkt. Python ger dig den funktionen. Föreställ dig datapunkter som är kopplade till andra datapunkter, till exempel hur en webbsida är ansluten till en annan webbsida via hyperlänkar. Var och en av dessa datapunkter är en nod . Noderna ansluter till varandra med länkar .

Inte alla knutpunkter länkar till varje annan nod, så knutpunkterna blir viktiga. Genom att analysera noderna och deras länkar kan du utföra alla möjliga intressanta uppgifter inom datavetenskap, som att definiera det bästa sättet att komma från jobbet till ditt hem med hjälp av gator och motorvägar.

Förstå närliggande matrisen

En adjacencymatris representerar förbindelserna mellan noder i ett diagram. När det finns en anslutning mellan en nod och en annan, indikerar matrisen det som ett värde större än 0. Den exakta representationen av anslutningar i matrisen beror på huruvida grafen är riktad (var anslutningens riktning betyder) eller omriktad.

Ett problem med många onlineexempel är att författarna håller dem enkla för förklaringsändamål. Imidlertid är grafiker i verkligheten ofta enorma och trotsar enkel analys helt enkelt genom visualisering. Tänk bara på antalet noder som även en liten stad skulle ha när man överväger gatu korsningar. Många andra grafer är mycket större, och helt enkelt titta på dem kommer aldrig att avslöja några intressanta mönster. Datavetenskapare ringer problemet med att presentera ett komplext diagram med en närliggande matris a hårboll .

En nyckel för att analysera adjacency matriser är att sortera dem på specifika sätt. Du kan till exempel välja att sortera data enligt andra egenskaper än de faktiska anslutningarna. En graf av gatukopplingar kan innefatta det datum som gatan var senast belagt med data, vilket gör det möjligt för dig att leta efter mönster som leder någon baserat på gatorna som är bäst reparerade. Kort sagt, att göra grafdatan användbar blir en fråga om att manipulera organisationen av den data på specifika sätt.

Använda NetworkX-basics

Att arbeta med diagram kan bli svårt om du måste skriva hela koden från början. Lyckligtvis gör NetworkX-paketet för Python det enkelt att skapa, manipulera och studera komplexa nätverk (eller grafer) struktur, dynamik och funktioner. Du kan också använda paketet för att arbeta med digrafer och multigrafer också.

NetworkX är viktiga för att undvika hela frågan om hårbollar.Användningen av enkla samtal döljer mycket av komplexiteten i att arbeta med grafer och adjacency matriser från vy. Följande exempel visar hur man skapar en grundläggande adjacencymatris från en av de medföljande graderna NetworkX:

import networkx som nx G = nx. cycle_graph (10) A = nx. adjacency_matrix (G) print (A. todense ())

Exemplet börjar genom att importera den nödvändiga paketet. Det skapar sedan ett diagram med hjälp av cycle_graph () mallen. Diagrammet innehåller tio noder. Ringa adjacency_matrix () skapar adjacencymatrisen från grafen. Det sista steget är att skriva ut utgången som en matris, som visas här:

[[0 1 0 0 0 0 0 0 0 1] [1 0 1 0 0 0 0 0 0 0] [0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 [0 0 0 1 0 1 0 0 0 0] [0 0 0 0 1 0 1 0 0 0] [0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 1 0] [0 0 0 0 0 0 0 1 0 1] [1 0 0 0 0 0 0 0 1 0]]

Du behöver inte bygga din egen graf från början för teständamål. NetworkX-webbplatsen dokumenterar ett antal standardgraftyper som du kan använda, vilka alla är tillgängliga inom IPython.

Det är intressant att se hur grafen ser ut när du genererar den. Följande kod visar grafen för dig.

Plottar den ursprungliga grafen.

import matplotlib. pyplot som plt nx. draw_networkx (G) plt. visa ()

Plot visar att du kan lägga till en kant mellan noderna 1 och 5. Här är koden som behövs för att utföra den här uppgiften med funktionen add_edge ().

Plottar grafillägget.

G. add_edge (1, 5) nx. draw_networkx (G) plt. visa ()

Arbetar med grafdata i Python for Data Science - dummies

Innehållsförteckning:

Video: Vad jag arbetar med! 2025

Förstå närliggande matrisen

Använda NetworkX-basics

Redaktörens val

Hur man korrigerar vanliga försäljningsfel i QuickBooks 2015 - dummies

Hur man skapar en revisors kopia av din QuickBooks 2010 datafil - dummies

Hur man skapar en ny budget i QuickBooks - dummies

Redaktörens val

ÖVersätt Twitter Slang och Jargon - dummies

Vad är Letgo? - dummies

Vad är Bebo? - dummies

Redaktörens val

Ser ut för makrovirus i Office 2003 - dummies

Tio Office 2013 Snabbkommandon - dummies

Vad är kontorsmallar? - dummies

Redaktörens val

Elektronik Säkerhetslektion: Spänningsskyddar i oväntade platser - dummies

Elektronik Schematics: Blueprint of a Electronic Circuit dummies

Underhållande dig själv på vägen - dummies

Förbättra och hantera digitala foton med Roxio PhotoSuite 8 - dummies

Redaktörens val

Förstå Drupal-moduler - dummies

Hitta teckensnitt för webbdesign online - dummies

Kantband och ansiktsloppar i Blender - dummies

Skapa föräldra-barnrelationer mellan objekt i blender - dummies

Populära kategorier