Articles

Apache Spark & Scala Tutorial

Vad är Apache Spark?

Apache Spark är en öppen källkod klusterberäkningsram som ursprungligen utvecklades vid UC Berkeley i AMPLab.

jämfört med den diskbaserade, tvåstegs MapReduce av Hadoop, Spark ger upp till 100 gånger snabbare prestanda för några program med i minnet primitiva.

detta gör den lämplig för maskininlärningsalgoritmer, eftersom det tillåter program att ladda data i minnet i ett kluster och ständigt fråga data.

ett Spark-projekt innehåller olika komponenter som Spark Core och Resilient Distributed dataset eller rdd, Spark SQL, Spark Streaming, Machine Learning Library eller Mllib och GraphX.

i nästa avsnitt av Apache Spark och Scala handledning, låt oss tala om vad Apache Spark är.

Vad är Apache Scala?

Scala är ett modernt programmeringsspråk med flera paradigmer. Den har utformats för att uttrycka allmänna programmeringsmönster på ett elegant, exakt och typsäkert sätt. En av de främsta funktionerna är att den integrerar funktionerna i både objektorienterade och funktionella språk smidigt.

det är ett rent objektorienterat språk, eftersom varje värde i det är ett objekt. Objektens beteende och typer förklaras genom egenskaper och klasser.

det är också ett funktionellt språk, eftersom varje funktion i det är ett värde. Genom att tillhandahålla en lätt syntax för att definiera anonyma funktioner ger den stöd för funktioner med högre ordning.

dessutom tillåter språket också funktioner att kapslas och ger stöd för bärning. Det har också funktioner som fallklasser och mönstermatchning modell algebraiska typer stöd.

Scala skrivs statiskt och har befogenhet med ett uttrycksfullt typsystem. Systemet verkställer användningen av abstraktioner på ett sammanhängande och säkert sätt. För att vara särskilt stöder detta system olika funktioner som anteckningar, klasser, vyer, polymorfa metoder, sammansatta typer, uttryckligen skrivna självreferenser och övre och nedre typgränser.

när det gäller att utveckla domänspecifika applikationer behöver den i allmänhet domänspecifika språktillägg. Scala, som är utdragbar, ger en exceptionell kombination av språkmekanismer. På grund av detta blir det enkelt att lägga till nya språkkonstruktioner som bibliotek

i nästa avsnitt i Apache Spark och Scala tutorial diskuterar vi fördelarna med Apache Spark och Scala yo proffs och organisationer.

fördelar med Apache Spark och Scala till proffs och organisationer

Följande är fördelarna med Apache Spark och Scala

  • ger mycket tillförlitlig snabb minnesberäkning.

  • effektiv i interaktiva frågor och iterativ algoritm.

  • Feltoleransfunktioner på grund av oföränderlig primär abstraktion som heter RDD.

  • inbyggda bibliotek för maskininlärning.

  • tillhandahåller bearbetningsplattform för strömmande data med spark streaming.

  • mycket effektiv i realtidsanalys med spark streaming och spark sql.

  • Graphx-bibliotek ovanpå spark core för grafiska observationer.

  • kompatibilitet med alla api JAVA, SCALA, PYTHON, R gör programmeringen enkel.

i nästa avsnitt av Apache Spark och Scala handledning diskuterar vi förutsättningarna för apache spark och scala.

Apache Spark och Scala Tutorial förutsättningar

den grundläggande förutsättningen för Apache Spark och Scala Tutorial är en grundläggande kunskap om alla programmeringsspråk är en förutsättning för handledningen. Deltagarna förväntas ha grundläggande förståelse för alla databaser, SQL och frågespråk för databaser. Arbetskunskap om Linux-eller Unix-baserade system, även om det inte är obligatoriskt, är en extra fördel för denna handledning.

Låt oss utforska målgruppen för Apache Spark och Scala handledning i nästa avsnitt.

intresserad av att lära dig mer om Apache Spark & Scala? Anmäl dig till vår Apache kurs idag!

målgrupp för Apache Spark och Scala Tutorial

handledningen riktar sig till yrkesverksamma som strävar efter en karriär inom växande och krävande områden i realtid big data analytics. Analyspersonal, forskare, IT-utvecklare, testare, dataanalytiker, datavetare, BI-och rapporteringspersonal och projektledare är de viktigaste mottagarna av denna handledning. Andra aspiranter och studenter, som vill få en grundlig förståelse av Apache Spark kan också dra nytta av denna handledning.

Låt oss utforska Apache Spark och Scala handledning Översikt i nästa avsnitt.

Apache Spark och Scala handledning Översikt

Apache Spark och Scala utbildning handledning som erbjuds av Simplilearn ger information om grunderna i realtidsanalys och behovet av distribuerad datorplattform.

denna handledning kommer:

  • förklara Scala och dess funktioner.

  • förbättra din kunskap om Apache Sparks arkitektur.

  • förklara processen för installation och körning av applikationer med Apache Spark.

  • förbättra din kunskap om att utföra SQL, streaming och batchbehandling.

  • förklara maskininlärning och grafanalys på Hadoop-data.

i nästa avsnitt kommer vi att diskutera målen för Apache Spark och Scala-handledningen.

mål

När du har slutfört denna handledning kommer du att kunna:

  • förklara processen för att installera Spark

  • beskriv funktionerna i Scala

  • diskutera hur man använder RDD för att skapa applikationer i Spark

  • förklara hur man kör SQL-frågor med SparkSQL

  • diskutera funktionerna i Spark Streaming

  • förklara funktionerna i Spark Streaming

  • spark ml programmering

  • beskriv funktionerna i GraphX programmering

låt oss utforska lektionerna som behandlas i Apache Spark och Scala handledning i nästa avsnitt.

lektioner som omfattas av denna Apache Spark och Scala handledning

det finns sju lektioner som omfattas av denna handledning. Ta en titt på lektionsnamnen som listas nedan

Lektion 5

lektion nr

kapitelnamn

vad du lär dig

lektion 1

introduktion till Spark tutorial

i det här kapitlet kommer du att kunna:

  • beskriv begränsningarna av MapReduce i Hadoop

  • jämför batch vs. realtidsanalys

  • beskriv tillämpningen av strömbehandling och minnesbehandling.

  • förklara funktionerna och fördelarna med Spark.

  • förklara hur du installerar Spark som en fristående användare,

  • jämför Spark vs. Hadoop Eco-system.

Lektion 2

introduktion till programmering i Scala Tutorial

i det här kapitlet kan du:

  • förklara funktionerna i Scala.

  • lista de grundläggande datatyperna och bokstäverna som används i Scala.

  • lista de operatörer och metoder som används i Scala.

  • diskutera några begrepp av Scala.

Lektion 3

använda RDD för att skapa applikationer i Spark Tutorial

i det här kapitlet kan du:

  • förklara funktionerna i rdd: er

  • förklara hur man skapar rdd: er

  • beskriv rdd-operationer och metoder

  • diskutera hur man kör ett Spark-projekt med SBT

  • förklara rdd-funktioner och

  • Beskriv hur man skriver olika koder i Scala

Lektion 4

kör SQL-frågor med hjälp av Spark SQL Tutorial

i det här kapitlet kan du:

  • förklara betydelsen och funktionerna i SparkSQL

  • beskriv metoderna för att konvertera rdd till dataramar

  • förklara några begrepp av SparkSQL och

  • beskriv begreppet hive integration

spark Streaming tutorial

i det här kapitlet kan du:

  • förklara några begrepp för Gnistströmning

  • beskriv grundläggande och avancerade källor

  • förklara hur statliga operationer fungerar

  • förklara fönster och gå med i operationer

Lektion 6

spark ml programmeringshandledning

i det här kapitlet kan du:

  • förklara användningsfall och tekniker för maskininlärning.

  • beskriv nyckelbegreppen för Gnistmaskininlärning.

  • förklara begreppet Maskininlärningsdataset.

  • diskutera maskininlärningsalgoritm, modellval via korsvalidering.

Lektion 7

Spark GraphX Programmeringshandledning

i det här kapitlet kan du:

  • förklara de grundläggande begreppen Spark GraphX programmering

  • diskutera begränsningarna i Grafparallalsystemet

  • beskriv operationerna med en graf och

  • diskutera grafsystemets optimeringar

slutsats

med detta kommer vi till ett slut om vad denna Apache Spark och Scala handledning inkluderar. I nästa kapitel kommer vi att diskutera en introduktion till Spark Tutorial.

{{lectureCoursePreviewTitle}} Visa transkript titta på Video

om du vill veta mer, ta kursen

Apache Spark och Scala Certifieringsutbildning

6160 elever

gå till kurs

för att lära dig mer, ta kursen

Apache Spark och Scala Certifieringsutbildning gå till kurs