Articles

Apache Spark & Scala Tutorial

mikä on Apache Spark?

Apache Spark on avoimen lähdekoodin cluster computing framework, joka kehitettiin alun perin UC Berkeleyssä Amplabissa.

verrattuna Hadoopin levypohjaiseen, kaksivaiheiseen Mapreduceen, Spark tarjoaa jopa 100 kertaa nopeamman suorituskyvyn muutamille sovelluksille, joissa on muistissa olevia primitiivejä.

Tämä tekee siitä sopivan koneoppimisen algoritmeille, sillä sen avulla ohjelmat voivat ladata dataa klusterin muistiin ja kysellä dataa jatkuvasti.

Spark-projekti sisältää erilaisia komponentteja, kuten Spark Core ja Resilient Distributed Datasets tai RDD, Spark SQL, Spark Streaming, Machine Learning Library tai Mllib, ja GraphX.

Apache Spark ja Scala-opetusohjelman seuraavassa osassa puhutaan siitä, mitä Apache Spark on.

mikä on Apache Scala?

Scala on moderni ja moniparadigma-ohjelmointikieli. Se on suunniteltu ilmaisemaan yleisiä ohjelmointikaavioita elegantilla, tarkalla ja tyyppiturvallisella tavalla. Yksi tärkeimmistä ominaisuuksista on, että se integroi sujuvasti sekä oliopainotteisten että funktionaalisten kielten ominaisuudet.

se on puhdas oliokeskeinen kieli, sillä sen jokainen arvo on objekti. Kohteiden käyttäytymistä ja tyyppejä selitetään ominaisuuksien ja luokkien kautta.

se on myös funktionaalinen kieli, sillä jokainen siinä oleva funktio on arvo. Tarjoamalla kevyen syntaksin anonyymien funktioiden määrittelyyn, se tarjoaa tuen korkeamman kertaluvun funktioille.

lisäksi kieli mahdollistaa myös funktioiden sisäkkäisyyden ja tarjoaa tukea kantamiseen. Se on myös ominaisuuksia, kuten tapausluokat ja kuvio matching malli algebraic tyypit tuki.

Scala on staattisesti tyypitetty, sillä on ekspressiivinen tyyppijärjestelmä. Järjestelmä valvoo abstraktioiden käyttöä johdonmukaisella ja turvallisella tavalla. Erityisesti tämä järjestelmä tukee erilaisia ominaisuuksia, kuten merkintöjä, luokkia, näkemyksiä, polymorfisia menetelmiä, yhdistetyyppejä, eksplisiittisesti tyypitettyjä itseviittauksia ja ylemmän ja alemman tyypin rajoja.

verkkoaluekohtaisten sovellusten kehittämisessä tarvitaan yleensä verkkoaluekohtaisia kielilaajennuksia. Koska Scala on laajennettavissa, se tarjoaa poikkeuksellisen yhdistelmän kielimekanismeja. Tästä johtuen uusien kielirakenteiden lisääminen kirjastoiksi

Apache Spark-ja Scala-opetusohjelman seuraavassa osassa käsitellään Apache Spark-ja Scala yo-ammattilaisten ja-organisaatioiden etuja.

Apache Sparkin ja Scalan edut ammattilaisille ja organisaatioille

seuraavat Apache Sparkin edut ja Scalan

  • tarjoaa erittäin luotettavan nopean muistilaskennan.

  • tehokas interaktiivisissa kyselyissä ja iteratiivisessa algoritmissa.

  • Vikasietokyky johtuen muuttumattomasta primäärisestä abstraktiosta nimeltä RDD.

  • sisäänrakennetut koneoppimisen kirjastot.

  • tarjoaa käsittelyalustan datan suoratoistoon spark streamausta käyttäen.

  • erittäin tehokas reaaliaikainen analytiikka käyttäen spark streaming ja spark sql.

  • graphx-kirjastot spark-ytimen päällä graafisia havaintoja varten.

  • yhteensopivuus minkä tahansa api Javan, Scalan, Pythonin, R: n kanssa tekee ohjelmoinnista helppoa.

apassien kipinän ja Scalan opetusohjelman seuraavassa osassa käsitellään apassien kipinän ja Scalan edellytyksiä.

Apache Spark-ja Scala-opetusohjelman perusedellytykset

Apache Spark-ja Scala-opetusohjelman perusedellytys on minkä tahansa ohjelmointikielen perustuntemus. Osallistujilla odotetaan olevan perustiedot tietokannasta, SQL-kielestä ja tietokantojen kyselykielestä. Linux – tai Unix-pohjaisten järjestelmien työskentely, vaikka se ei ole pakollista, on lisäetu tähän opetusohjelmaan.

seuraavassa jaksossa tutustutaan Apache Sparkin ja Scala tutoriaalin kohdeyleisöön.

kiinnostunut oppimaan lisää Apache Sparkista & Scala? Ilmoittaudu Apassikurssille tänään!

Apache Sparkin ja Scala Tutorialin kohderyhmä

opetusohjelma on suunnattu ammattilaisille, jotka tavoittelevat uraa kasvavilla ja vaativilla reaaliaikaisen big data-analytiikan aloilla. Analytiikan ammattilaiset, tutkimusammattilaiset, IT-Kehittäjät, testaajat, data-analyytikot, datatutkijat, BI-ja raportointialan ammattilaiset sekä projektipäälliköt ovat tämän opetusohjelman keskeisiä edunsaajia. Muut kokelaat ja opiskelijat, jotka haluavat saada perusteellisen käsityksen Apache Spark voi myös hyötyä tästä opetusohjelma.

tutkikaamme seuraavassa jaksossa Apache Sparkin ja Scalan tutoriaalin yleiskuvaa.

Apache Spark and Scala Tutorial Overview

Simplilearnin tarjoama Apache Spark and Scala training tutorial tarjoaa yksityiskohtaisia tietoja reaaliaikaisen analytiikan perusteista ja hajautetun tietokonealustan tarpeesta.

Tämä opetusohjelma kertoo:

  • selittää Scalaa ja sen ominaisuuksia.

  • Lisää tietämystäsi apassien kipinän arkkitehtuurista.

  • selitä sovellusten asennus-ja ajoprosessi Apache Sparkilla.

  • Paranna tietämystäsi SQL: n suorittamisesta, suoratoistosta ja eräajoista.

  • selittää koneoppimista ja Graafianalytiikkaa Hadoop-datasta.

seuraavassa jaksossa käsitellään Apache Sparkin ja Scalan ohjaustyön tavoitteita.

tavoitteet

tämän opetusohjelman suoritettuasi voit:

    selitä Spark-ohjelmiston asennusprosessi

    kuvaile Scalan ominaisuuksia

    keskustele siitä, miten RDD: tä käytetään Spark-sovellusten luomiseen

    selitä SQL-kyselyiden suorittaminen SparkSQL: n avulla

    Keskustele Spark-striimauksen ominaisuuksista

    selitä spark ml-ohjelmointi

  • kuvaile Grafx-ohjelmoinnin piirteitä

tutkikaamme seuraavassa jaksossa Apache Spark-ja Scala-opetusohjelman oppeja.

tämän Apache Sparkin ja Scalan opetusohjelman kattamia tunteja

tässä opetuksessa on seitsemän oppituntia. Katso alla olevat oppitunnin nimet

luvun nimi

Mitä opit

tr>

tässä luvussa voi:

  • selittää Scalan ominaisuuksia.

  • listaa Scalassa käytetyt perustietotyypit ja-literaalit.

  • listaa Scalassa käytetyt operaattorit ja menetelmät.

  • Keskustele muutamasta Scalan käsitteestä.

spark ml-ohjelmointiohjelma tutorial

tässä luvussa pääset:

    selitä Spark GraphX-ohjelmoinnin peruskäsitteet

    Keskustele kuvaajan Rinnakkaisjärjestelmän rajoituksista

    kuvaa operaatioita kuvaajalla ja

    Keskustele Kuvaajajärjestelmän optimoinneista

oppitunnin nro

Oppitunti 1

johdatus kipinä-opetukseen

tässä luvussa voit kuvata:

  • kuvaile mapreduken rajoituksia Hadoopissa

  • vertaa erä vs. reaaliaikainen analytiikka
  • kuvaa streaminkäsittelyn ja muistinkäsittelyn soveltamista.

  • selitä Sparkin ominaisuudet ja hyödyt.

  • selitä, miten Spark asennetaan itsenäisenä käyttäjänä,

  • vertaa Spark vs. Hadoop Eco-system.

Oppitunti 2

Johdatus ohjelmointiin Scala-tutoriaalissa

Oppitunti 3

RDD: n käyttäminen sovellusten luomiseen Kipinätutoriaalissa

tässä luvussa voit:

    selitä RDD: n ominaisuudet

    selitä, miten RDD: t luodaan

    kuvaa RDD: n operaatioita ja menetelmiä

    keskustele siitä, miten Spark-projekti hoidetaan SBT: llä

    selitä RDD: n funktiot ja

  • kuvaile, miten Scalassa kirjoitetaan erilaisia koodeja

Oppitunti 4

SQL-kyselyiden suorittaminen Spark SQL TUTORIALILLA

tässä luvussa voit:

    selitä SparkSQL: n merkitys ja ominaisuudet

  • kuvaile menetelmiä RDD: iden muuntamiseksi Dataframeiksi

  • selitä muutama käsite SparkSQL: stä, ja

  • kuvaile pesäintegraation käsitettä

Oppitunti 5

Spark streaming tutorial

tässä luvussa voit:

    selitä muutama käsite Kipinävirtauksesta

    kuvaile perus-ja edistyneitä lähteitä

    selitä, miten valtiolliset operaatiot toimivat

    selitä ikkuna ja liity operaatioihin

Oppitunti 6

tässä luvussa voit:

  • selittää koneoppimisen käyttötapauksia ja tekniikoita.

  • kuvaile Spark-koneoppimisen keskeisiä käsitteitä.

  • selitä koneoppimisen aineiston käsite.

  • keskustelee koneoppimisen algoritmista, mallivalinnasta ristivalinnan kautta.

Oppitunti 7

Spark GraphX-ohjelmointiohjelma

johtopäätös

tämän kanssa tullaan siihen, mitä tämä Apachen kipinä ja Scala-opetusohjelma sisältää. Seuraavassa luvussa, keskustelemme Johdanto kipinä opetusohjelma.

{{lectureCoursePreviewTitle}} View transkripti Watch Video

oppia lisää, ota kurssi

Apache Spark ja Scala Certification Training

6160 oppijaa

mene kurssille

oppiaksesi lisää, ota kurssi

Apache Spark ja Scala certification training mene kurssille