Articles

Apache Spark & Scala Tutorial

Wat is Apache Spark?

Apache Spark is een open-source cluster computing framework dat oorspronkelijk werd ontwikkeld op UC Berkeley in het AMPLab.

in vergelijking met de schijfgebaseerde, tweetraps MapReduce van Hadoop, levert Spark tot 100 keer snellere prestaties voor een paar toepassingen met in-memory primitieven.

Dit maakt het geschikt voor machine learning algoritmen, omdat het programma ‘ s in staat stelt om gegevens in het geheugen van een cluster te laden en de gegevens voortdurend te bevragen.

een Spark-project bevat verschillende componenten zoals Spark Core en veerkrachtige gedistribueerde Datasets of RDDs, Spark SQL, Spark Streaming, Machine Learning Library of Mllib, en GraphX.

in de volgende sectie van de Apache Spark en Scala tutorial, laten we het hebben over wat Apache Spark is.

Wat is Apache Scala?

Scala is een moderne en multi-paradigma programmeertaal. Het is ontworpen voor het uitdrukken van algemene programmeerpatronen op een elegante, nauwkeurige en type-veilige manier. Een van de belangrijkste kenmerken is dat het integreert de kenmerken van zowel object-georiënteerde en functionele talen soepel.

het is een pure objectgeoriënteerde taal, aangezien elke waarde in het een object is. Het gedrag en de typen van de objecten worden uitgelegd door middel van eigenschappen en klassen.

het is ook een functionele taal, omdat elke functie een waarde is. Door het verstrekken van een lichtgewicht syntaxis voor het definiëren van anonieme functies, biedt het ondersteuning voor hogere-orde functies.

bovendien maakt de taal het ook mogelijk om functies te genesten en biedt ondersteuning voor het dragen. Het heeft ook functies zoals case klassen en patroon matching model algebraïsche types Ondersteuning.

Scala wordt statisch getypt, met een expressief typesysteem. Het systeem dwingt het gebruik van abstracties op een coherente en veilige manier af. Om bijzonder te zijn, dit systeem ondersteunt verschillende functies zoals annotaties, klassen, weergaven, polymorfe methoden, samengestelde types, expliciet getypte zelf-referenties en bovenste en onderste type grenzen.

als het gaat om het ontwikkelen van domeinspecifieke toepassingen, heeft het over het algemeen domeinspecifieke taalextensies nodig. Scala, uitbreidbaar, biedt een uitzonderlijke combinatie van taalmechanismen. Hierdoor wordt het eenvoudig om nieuwe taalconstructies toe te voegen als bibliotheken

In de volgende sectie van de Apache Spark en Scala tutorial zullen we de voordelen van Apache Spark en Scala bespreken voor professionals en organisaties.

voordelen van Apache Spark en Scala voor Professionals en organisaties

Hieronder volgen de voordelen van Apache Spark en Scala

  • biedt zeer betrouwbare fast in memory computation.

  • efficiënt in interactieve queries en iteratief algoritme.

  • Fouttolerantiemogelijkheden vanwege onveranderlijke primaire abstractie met de naam RDD.

  • ingebouwde bibliotheken voor machine learning.

  • biedt een verwerkingsplatform voor het streamen van gegevens met spark-streaming.

  • zeer efficiënt in real time analytics met behulp van spark streaming en spark sql.

  • Graphxbibliotheken bovenop spark core voor grafische waarnemingen.

  • compatibiliteit met elke api JAVA, SCALA, PYTHON, R maakt programmeren eenvoudig.

in de volgende sectie van de Apache Spark en Scala tutorial zullen we de vereisten van apache spark en scala bespreken.

Apache Spark en Scala Tutorial Prerequisites

de basisvoorwaarde van de Apache Spark en Scala Tutorial is een fundamentele kennis van elke programmeertaal is een voorwaarde voor de tutorial. Van deelnemers wordt verwacht dat ze basiskennis hebben van elke database, SQL en query taal voor databases. Praktische kennis van Linux of Unix gebaseerde systemen, hoewel niet verplicht, is een extra voordeel voor deze tutorial.

laten we de doelgroep van Apache Spark en Scala Tutorial verkennen in de volgende sectie.

geïnteresseerd in meer informatie over Apache Spark & Scala? Schrijf je vandaag nog in voor onze Apache cursus!

doelgroep van Apache Spark en Scala Tutorial

de tutorial is gericht op professionals die een carrière willen in groeiende en veeleisende gebieden van real-time big data analytics. Analytics professionals, onderzoek professionals, IT-ontwikkelaars, testers, data analisten, data scientists, BI en rapportage professionals, en project managers zijn de belangrijkste begunstigden van deze tutorial. Andere aspiranten en studenten, die een grondig begrip van Apache Spark willen krijgen, kunnen ook profiteren van deze tutorial.

laten we het Apache Spark en Scala Tutorial overzicht in de volgende sectie verkennen.

Apache Spark en Scala Tutorial Overview

De Apache Spark en Scala training tutorial aangeboden door Simplilearn geeft details over de fundamenten van real-time analytics en de behoefte aan gedistribueerd computerplatform.

Deze tutorial zal:

  • Scala en zijn functies uitleggen.

  • Verbeter uw kennis van de architectuur van Apache Spark.

  • verklaar het proces van installatie en draaien van applicaties met Apache Spark.

  • Verbeter uw kennis van het uitvoeren van SQL, streaming en batchverwerking.

  • verklaar Machine Learning en grafiekanalyse op de Hadoop-gegevens.

in de volgende sectie zullen we de doelstellingen van de Apache Spark en Scala tutorial bespreken.

Objectives

na het voltooien van deze tutorial zult u in staat zijn om:

  • Verklaren het proces te installeren Spark

  • het Omschrijven van de eigenschappen van de Scala

  • Bespreek hoe te gebruiken RDD voor het maken van toepassingen in de Spark

  • Leg het uitvoeren van SQL-query ‘ s met behulp van SparkSQL

  • Het bespreken van de kenmerken van de Spark Streaming

  • Verklaren de kenmerken van Spark ML Programmering

  • het Omschrijven van de eigenschappen van GraphX Programmering

Laten we verkennen de lessen behandeld in Apache Vonk en Scala Tutorial in de volgende paragraaf.

lessen behandeld in deze Apache Spark en Scala Tutorial

Er zijn zeven lessen behandeld in deze tutorial. Bekijk de lesnamen die hieronder staan

Les No

inleiding tot Spark tutorial

hoofdstuk Naam

wat u zult leren

Les 1

in dit hoofdstuk kunt u:

  • beschrijf de beperkingen van MapReduce in Hadoop

  • vergelijken Batch vs. real-time analytics

  • beschrijft de toepassing van stream processing en in-memory processing.

  • leg de kenmerken en voordelen van Spark uit.

  • leg uit hoe Spark als een zelfstandige gebruiker te installeren,

  • vergelijk Spark vs.Hadoop Eco-system.

Les 2

Inleiding tot programmeren in Scala Tutorial

In dit hoofdstuk kunt u:

  • De kenmerken van Scala uitleggen.

  • Geef een lijst van de basistypen en literalen die in Scala worden gebruikt.

  • Geef een lijst van de operators en methoden die in Scala worden gebruikt.

  • bespreek enkele concepten van Scala.

Les 3

met behulp van RDD voor het maken van toepassingen in Spark Tutorial

In dit hoofdstuk kunt u:

  • leg de eigenschappen van RDD ’s uit

  • leg uit hoe RDD’ s te maken

  • Beschrijf RDD-operaties en-methoden

  • bespreek hoe een Spark-project met SBT

  • leg RDD-functies uit, en

  • beschrijf hoe verschillende codes in te schrijven scala

Les 4

het uitvoeren van SQL-query ‘ s met behulp van Spark SQL Tutorial

in dit hoofdstuk kunt u:

  • verklaar het belang en de kenmerken van SparkSQL

  • Beschrijf de methoden om RDDs om te zetten naar DataFrames

  • leg enkele concepten van SparkSQL uit, en

  • beschrijf het concept van korfintegratie

Les 5

Spark Streaming tutorial

in dit hoofdstuk kunt u:

  • leg een paar concepten van Spark streaming uit

  • Beschrijf basis-en geavanceerde bronnen

  • leg uit hoe stateful operaties werken

  • Explain window and join operaties

Les 6

Spark ml programmeerhandleiding

in dit hoofdstuk kunt u:

  • De use cases en technieken van machine learning uitleggen.

  • Beschrijf de belangrijkste concepten van Spark Machine Learning.

  • leg het concept van een Dataset voor Machine Learning uit.

  • bespreek machine Learning algoritme, model selectie via cross-validatie.

Les 7

Spark GraphX programmeerhandleiding

In dit hoofdstuk kunt u:

  • Leg de fundamentele concepten van Spark GraphX programmering

  • Bespreek de beperkingen van de Grafiek Parallel systeem

  • het Beschrijven van de activiteiten met een grafiek, en

  • het Bespreken van de Grafiek optimalisaties

Conclusie

Met deze, we komen een eind over wat dit Apache Vonk en Scala tutorial zijn. In het volgende hoofdstuk, zullen we een inleiding tot Spark Tutorial bespreken.

{{lectureCoursePreviewTitle}} Bekijken Transcript Bekijk Video

om meer Te leren, de Cursus

Apache Vonk en Scala Certification Training

6160 Leerlingen

Ga naar de Cursus

om meer Te leren, de Cursus

Apache Vonk en Scala Certification Training Gaat u naar de Cursus