Articles

Apache Spark & Scala Tutorial

co je Apache Spark?

Apache Spark je open-source cluster computing framework, který byl původně vyvinut v UC Berkeley v Amplabu.

ve srovnání s diskovým dvoustupňovým MapReduce Hadoop poskytuje Spark až 100krát rychlejší výkon pro několik aplikací s primitivy v paměti.

díky tomu je vhodný pro algoritmy strojového učení, protože umožňuje programům načítat data do paměti clusteru a neustále je dotazovat.

Jiskra projekt obsahuje různé komponenty, jako jsou Spark Core a Odolné Distribuované datové sady nebo RDDs, Spark SQL, Spark Streaming, Machine Learning Library nebo Mllib, a GraphX.

v další části tutoriálu Apache Spark a Scala hovoříme o tom, co je Apache Spark.

co je Apache Scala?

Scala je moderní programovací jazyk s více paradigmaty. Byl navržen pro vyjádření obecných programovacích vzorů elegantním, přesným a typově bezpečným způsobem. Jednou z hlavních funkcí je, že hladce integruje funkce objektově orientovaných i funkčních jazyků.

je to čistě objektově orientovaný jazyk, protože každá hodnota v něm je objekt. Chování a typy objektů jsou vysvětleny pomocí vlastností a tříd.

je to také funkční jazyk, protože každá funkce v něm je hodnota. Tím, že poskytuje lehkou syntaxi pro definování anonymních funkcí, poskytuje podporu pro funkce vyššího řádu.

kromě toho jazyk také umožňuje vnoření funkcí a poskytuje podporu pro přenášení. Má také funkce, jako jsou třídy případů a podpora modelů algebraických typů.

Scala je staticky zadávána a je vybavena expresivní typovou soustavou. Systém prosazuje použití abstrakcí koherentním a bezpečným způsobem. Konkrétně tento systém podporuje různé funkce, jako jsou anotace, třídy, pohledy, polymorfní metody, složené typy, explicitně zadané vlastní odkazy a horní a dolní meze typu.

Pokud jde o vývoj aplikací specifických pro doménu, obvykle potřebuje jazyková rozšíření specifická pro doménu. Scala, rozšiřitelná, poskytuje výjimečnou kombinaci jazykových mechanismů. Díky tomu je snadné přidávat nové jazykové konstrukce jako knihovny

v další části tutoriálu Apache Spark a Scala budeme diskutovat o výhodách profesionálů a organizací Apache Spark a Scala yo.

Výhody Apache Spark a Scale na Odborníky a Organizace

Následující jsou výhody Apache Spark a Scale

  • Poskytuje vysoce spolehlivé, rychle v paměti výpočtu.

  • efektivní v interaktivních dotazů a iterativní algoritmus.

  • schopnosti tolerance chyb z důvodu neměnné primární abstrakce s názvem RDD.

  • vestavěné knihovny strojového učení.

  • poskytuje platformu pro zpracování dat pomocí Spark streaming.

  • vysoce efektivní v reálném čase analytiky pomocí Spark streaming a spark sql.

  • Graphx knihovny na vrcholu spark core pro grafické pozorování.

  • kompatibilita s jakýmkoli api JAVA, SCALA, PYTHON, R usnadňuje programování.

v další části tutoriálu Apache Spark a Scala probereme předpoklady Apache spark a scala.

Apache Spark a Scale Návod Předpoklady

základním předpokladem Apache Spark a Scale kurzu je základní znalost libovolného programovacího jazyka je předpokladem pro tutorial. Očekává se, že účastníci budou mít základní znalosti o jakékoli databázi, SQL a dotazovacím jazyce pro databáze. Pracovní znalost systémů založených na Linuxu nebo Unixu, i když není povinná, je další výhodou tohoto tutoriálu.

pojďme prozkoumat cílové publikum Apache Spark a Scala Tutorial v další části.

máte zájem dozvědět se více o Apache Spark & Scala? Přihlaste se do našeho kurzu Apache ještě dnes!

Cílové Publikum Apache Spark a Scale Tutoriálu

kurz je zaměřen na profesionály, usilující o kariéru v rostoucím a náročné oblasti real-time big dat analytics. Odborníci na analytiku, odborníci na výzkum, vývojáři IT, testeři, analytici dat, vědci v oblasti dat, odborníci na BI a reporting a projektoví manažeři jsou klíčovými příjemci tohoto tutoriálu. Z tohoto tutoriálu mohou těžit i další uchazeči a studenti, kteří chtějí důkladně porozumět Apache Spark.

Pojďme prozkoumat přehled tutoriálu Apache Spark a Scala v další části.

Apache Spark a Scale Tutorial Přehled

Apache Spark a Scale výukový program nabízených Simplilearn nabízí údaje na základy analýzy v reálném čase a je třeba distribuované výpočetní platformy.

Tento výukový program bude:

  • vysvětlit Scala a jeho vlastnosti.

  • Vylepšete své znalosti o architektuře Apache Spark.

  • vysvětlete proces instalace a spouštění aplikací pomocí Apache Spark.

  • Vylepšete své znalosti o provádění SQL, streamování a dávkového zpracování.

  • vysvětlete strojové učení a analýzu grafů na datech Hadoop.

v další části budeme diskutovat o cílech tutoriálu Apache Spark a Scala.

cíle

po dokončení tohoto tutoriálu budete moci:

  • Vysvětlete proces instalace Jiskra

  • Popište vlastnosti Scala

  • Diskutovat o tom, jak použít RDD pro vytváření aplikací v Zapalovací

  • Vysvětlit, jak spustit SQL dotazy pomocí SparkSQL

  • Diskutovat vlastnosti Spark Streaming

  • Vysvětlit funkce Jiskra ML Programování

  • Popište vlastnosti GraphX Programování

Pojďme prozkoumat lekce se vztahuje v Apache Spark a Scale Návod v další části.

lekce zahrnuté v tomto tutoriálu Apache Spark a Scala

v tomto tutoriálu je zahrnuto sedm lekcí. Podívejte se na lekci názvy, které jsou uvedeny níže,

Lekce Č.

Název Kapitoly

to, Co se naučíte

Lekce 1

Úvod do Zapalovací Tutorial

V této kapitole, budete moci:

  • Popište omezení v Hadoop MapReduce

  • Porovnat dávkové vs. analýza v reálném čase

  • popisuje použití zpracování streamu a zpracování v paměti.

  • vysvětlete vlastnosti a výhody Spark.

  • vysvětlete, jak nainstalovat Spark jako samostatný uživatel,

  • Porovnejte Spark vs. Hadoop Eco-system.

Lekce 2

Úvod do Programování v Scala Tutorial

V této kapitole, budete moci:

  • Vysvětlit funkce Scala.

  • seznam základních datových typů a literálů používaných ve Scale.

  • seznam operátorů a metod používaných ve Scala.

  • diskutujte několik konceptů Scaly.

Lekce 3

Pomocí RDD pro Vytváření Aplikací v Zapalovací Tutorial

V této kapitole, budete moci:

  • Vysvětlit funkce RDDs

  • Vysvětlit, jak vytvořit RDDs

  • Popište RDD operace a metody,

  • Diskutovat o tom, jak spustit Jiskra projekt s SBT

  • Vysvětlit RDD funkce, a

  • Popište, jak psát různé kódy v Scala

Lekce 4

Spuštění SQL Dotazů pomocí Spark SQL Tutorial

V této kapitole, budete moci:

  • Vysvětlit význam a funkce SparkSQL

  • Popište metody převést RDDs do datové části rámců

  • Vysvětlit několik pojmů SparkSQL, a

  • Popište pojem úl integrace

Lekce 5

Spark Streaming Tutorial

V této kapitole, budete moci:

  • Vysvětlit několik pojmů Spark streaming

  • Popište základní a pokročilé zdrojů

  • Vysvětlete, jak stavové operace, práci

  • Vysvětlit, okno a operace spojení

Lekce 6

Spark ML Programování Tutorial

V této kapitole, budete moci:

  • Vysvětlit případy použití a technik Strojového Učení.

  • popište klíčové pojmy strojového učení Spark.

  • vysvětlete koncept datové sady strojového učení.

  • diskutujte algoritmus strojového učení, výběr modelu pomocí křížové validace.

Lekce 7

Spark GraphX Programování Tutorial

V této kapitole, budete moci:

  • Vysvětlit základní pojmy, Zapalovací GraphX programování

  • Diskutovat o omezení Graf Paralelní soustavy,

  • Popište operace s grafem, a

  • Diskutovat Graf optimalizace systému

Závěr

S tím, že dojdeme na konec o tom, co to Apache Spark a Scale výukový program zahrnuje. V další kapitole, probereme Úvod do tutoriálu Spark.

{{lectureCoursePreviewTitle}} Zobrazit Přepis podívejte se na Video

dozvědět Se více, se Kurz

Apache Spark a Scale Certification Training

6160 Studenty

Chcete-li se dozvědět více, zúčastnit Kurzu

Apache Spark a Scale Certifikace Výcviku Jít na Kurz