Apache Spark Programming (Spark 105): 3 day Instructor Led Public Class (Paris, FR)

Paris, Île-de-France
Monday, March 11, 2019
Apache Spark Programming (Spark 105): 3 day Instructor Led Public Class (Paris, FR)
Monday, March 11, 2019 9:00 AM -
Wednesday, March 13, 2019 5:00 PM (Central European Time)

Octo Academy
01 70 36 18 67
34 Avenue de l'Opéra
Paris, Île-de-France 75002

Map and Directions

This three-day course will be delivered by Octo Academy, our Databricks Authorized Training Partner, from Monday, March 11 to Friday, March 13  from 9:00am to 5:00pm GMT+1.

Location: Paris, FR

This ​course ​is ​designed ​for ​data ​engineers, ​analysts, ​architects; ​software ​engineers; ​IT ​operations; ​and ​technical ​managers ​interested ​in ​a ​thorough, ​hands-on ​overview ​of ​Apache ​Spark. ​ ​This ​course ​covers ​the ​same ​material ​as ​our ​three-day ​Apache ​Spark ​Programming ​course. 

The ​course ​covers ​the ​core ​APIs ​for ​using ​Spark, ​fundamental ​mechanisms ​and ​basic ​internals ​of ​the ​framework, ​SQL ​and ​other ​high-level ​data ​access ​tools, ​as ​well ​as ​Spark’s ​streaming ​capabilities ​and ​machine ​learning ​APIs. 

Each ​topic ​includes ​slide ​and ​lecture ​content ​along ​with ​hands-on ​use ​of ​Spark ​through ​an ​elegant ​web-based ​notebook ​environment. ​Inspired ​by ​tools ​like ​IPython/Jupyter, ​notebooks ​allow ​attendees ​to ​code ​jobs, ​data ​analysis ​queries, ​and ​visualizations ​using ​their ​own ​Spark ​cluster, ​accessed ​through ​a ​web ​browser. ​All ​class ​code ​is ​directly ​usable ​with ​pure ​open-source ​Spark ​or ​any ​commercial ​Spark ​distribution. 

Objectives ​- ​after ​taking ​this ​class ​you ​will ​be ​able ​to: 

Describe ​Spark’s ​fundamental ​mechanics 
Use ​the ​core ​Spark ​APIs ​to ​operate ​on ​data 
Articulate ​and ​implement ​typical ​use ​cases ​for ​Spark 
Build ​data ​pipelines ​with ​SparkSQL ​and ​DataFrames 
Analyze ​Spark ​jobs ​using ​the ​UIs ​and ​logs 
Create ​Streaming ​and ​Machine ​Learning ​jobs 


Spark ​Overview 
RDD ​Fundamentals 
SparkSQL ​and ​DataFrames 
Spark ​Job ​Execution 
Cluster ​Architectures ​for ​Spark 
Intro ​to ​Spark ​Streaming 
Machine ​Learning ​Basics 

Cost: ​$2500 ​per ​person 


All ​participants ​will ​need ​a ​laptop ​with ​updated ​versions ​of ​Chrome ​or ​Firefox ​(Internet ​Explorer ​and ​Safari ​are ​not ​supported) ​

About ​Databricks: 

Databricks’ ​vision ​is ​to ​empower ​anyone ​to ​easily ​build ​and ​deploy ​advanced ​analytics ​solutions. ​The ​company ​was ​founded ​by ​the ​team ​who ​created ​Apache® ​Spark™, ​a ​powerful ​open ​source ​data ​processing ​engine ​built ​for ​sophisticated ​analytics, ​ease ​of ​use, ​and ​speed. ​Databricks ​is ​the ​largest ​contributor ​to ​the ​open ​source ​Apache ​Spark ​project ​providing ​10x ​more ​code ​than ​any ​other ​company. ​The ​company ​has ​also ​trained ​over ​20,000 ​users ​on ​Apache ​Spark, ​and ​has ​the ​largest ​number ​of ​customers ​deploying ​Spark ​to ​date. ​Databricks ​provides ​a ​just-in-time ​data ​platform, ​to ​simplify ​data ​integration, ​real-time ​experimentation, ​and ​robust ​deployment ​of ​production ​applications. ​Databricks ​is ​venture-backed ​by ​Andreessen ​Horowitz ​and ​NEA. ​For ​more ​information, ​contact ​training-support@databricks.com.

Contact Information

© 2019
Quick, easy and affordable online event registration and event management software for all event sizes.