Innehållsförteckning:
- Åtkomst till vetenskapliga verktyg med SciPy
- Utföra grundläggande vetenskaplig databehandling med NumPy
- Utföra dataanalys med pandor
- Implementerande maskinlärning med Scikit-learn
- Plottar data med matplotlib
- Parsing HTML-dokument med Beautiful Soup
Video: Leap Motion SDK 2024
Du måste ladda bibliotek för att kunna utföra datavetenskapliga uppgifter i Python. Här är en översikt över de bibliotek du kan använda för datavetenskap. Dessa bibliotek kan utföra flera funktioner för datavetenskaparen.
Åtkomst till vetenskapliga verktyg med SciPy
SciPy-stacken innehåller en mängd andra bibliotek som du också kan hämta separat. Dessa bibliotek ger stöd för matematik, vetenskap och teknik. När du får SciPy får du en uppsättning bibliotek som är utformade för att arbeta tillsammans för att skapa applikationer av olika slag. Dessa bibliotek är
-
NumPy
-
SciPy
-
matplotlib
-
IPython
-
Sympy
-
pandas
SciPy-biblioteket fokuserar själv på numeriska rutiner, som rutiner för numerisk integration och optimering. SciPy är ett bibliotek med allmänt ändamål som ger funktionalitet för flera problemområden. Det ger också stöd för domänspecifika bibliotek, till exempel Scikit-learn, Scikit-image och statistikmodeller.
Utföra grundläggande vetenskaplig databehandling med NumPy
NumPy-biblioteket ger medel för att utföra n-dimensionell array manipulation, vilket är avgörande för datavetenskapliga arbeten. Du kunde inte enkelt få tillgång till n-dimensionella arrayer utan NumPy-funktioner som inkluderar stöd för linjär algebra, Fourier-transform och slumptalsgenerering.
Utföra dataanalys med pandor
Pandas bibliotek ger stöd för datastrukturer och dataanalysverktyg. Biblioteket är optimerat för att utföra datavetenskapliga uppgifter särskilt snabbt och effektivt. Grundprincipen bakom pandor är att tillhandahålla dataanalys och modelleringsstöd för Python som liknar andra språk, såsom R.
Implementerande maskinlärning med Scikit-learn
Biblioteket Scikit-learn är ett av ett antal Scikit-bibliotek som bygger på funktioner som tillhandahålls av NumPy och SciPy för att tillåta Python-utvecklare att utföra domänspecifika uppgifter. I detta fall fokuserar biblioteket på datautvinning och dataanalys. Det ger tillgång till följande typer av funktionalitet:
-
Klassificering
-
Regression
-
Kluster
-
Dimensionalitetsreduktion
-
Modellval
-
Förbehandling
Plottar data med matplotlib
Matplotlib-biblioteket ger dig ett MATLAB-liknande gränssnitt för att skapa datapresentationer av analysen du utför. Biblioteket är för närvarande begränsat till 2D-utdata, men det ger dig fortfarande möjligheterna att uttrycka grafiskt de datamönster du ser i de data du analyserar.Utan det här biblioteket kunde du inte skapa produktioner som människor utanför datavetenskapssamfundet lätt kunde förstå.
Parsing HTML-dokument med Beautiful Soup
Nedladdning av Beautiful Soup-biblioteket finns faktiskt på Pythons webbplats. Detta bibliotek ger sätt att analysera HTML- eller XML-data på ett sätt som Python förstår. Det låter dig arbeta med trädbaserade data.
Förutom att tillhandahålla ett sätt att arbeta med trädbaserade data, tar Beautiful Soup mycket av arbetet med att arbeta med HTML-dokument. Exempelvis omvandlar den automatiskt -kodningen (det sätt på vilket tecken lagras i ett dokument) av HTML-dokument från UTF-8 till Unicode. En Python-utvecklare skulle normalt behöva oroa sig för saker som kodning, men med Beautiful Soup kan du istället fokusera på din kod.