Apache Spark Programming (Spark 105): 5 half-day Live-Online Public Class (Americas)

San Francisco, California
Monday, February 18, 2019
Apache Spark Programming (Spark 105): 5 half-day Live-Online Public Class (Americas)
Monday, February 18, 2019 7:00 AM -
Friday, February 22, 2019 11:00 AM (Pacific Time)

Databricks Inc.
160 Spear Street, 13th Floor
San Francisco, California 94105
United States

Map and Directions

This five-day online course is led by one of our highly qualified instructors who will answer your questions in real-time.  It will be delivered from Monday, February 18, 2019 to Friday, February 22, 2019, from 7:00am to 11:00am PST.

This ​course ​is ​designed ​for ​data ​engineers, ​analysts, ​architects; ​software ​engineers; ​IT ​operations; ​and ​technical ​managers ​interested ​in ​a ​thorough, ​hands-on ​overview ​of ​Apache ​Spark. ​ ​This ​course ​covers ​the ​same ​material ​as ​our ​three-day ​Apache ​Spark ​Programming ​course. 

The ​course ​covers ​the ​core ​APIs ​for ​using ​Spark, ​fundamental ​mechanisms ​and ​basic ​internals ​of ​the ​framework, ​SQL ​and ​other ​high-level ​data ​access ​tools, ​as ​well ​as ​Spark’s ​streaming ​capabilities ​and ​machine ​learning ​APIs. 

Each ​topic ​includes ​slide ​and ​lecture ​content ​along ​with ​hands-on ​use ​of ​Spark ​through ​an ​elegant ​web-based ​notebook ​environment. ​Inspired ​by ​tools ​like ​IPython/Jupyter, ​notebooks ​allow ​attendees ​to ​code ​jobs, ​data ​analysis ​queries, ​and ​visualizations ​using ​their ​own ​Spark ​cluster, ​accessed ​through ​a ​web ​browser. ​All ​class ​code ​is ​directly ​usable ​with ​pure ​open-source ​Spark ​or ​any ​commercial ​Spark ​distribution. 

Objectives ​- ​after ​taking ​this ​class ​you ​will ​be ​able ​to: 

Describe ​Spark’s ​fundamental ​mechanics 
Use ​the ​core ​Spark ​APIs ​to ​operate ​on ​data 
Articulate ​and ​implement ​typical ​use ​cases ​for ​Spark 
Build ​data ​pipelines ​with ​SparkSQL ​and ​DataFrames 
Analyze ​Spark ​jobs ​using ​the ​UIs ​and ​logs 
Create ​Streaming ​and ​Machine ​Learning ​jobs 


Spark ​Overview 
RDD ​Fundamentals 
SparkSQL ​and ​DataFrames 
Spark ​Job ​Execution 
Cluster ​Architectures ​for ​Spark 
Intro ​to ​Spark ​Streaming 
Machine ​Learning ​Basics 

Cost: ​$2500 ​per ​person 


All ​participants ​will ​need ​a ​laptop ​with ​updated ​versions ​of ​Chrome ​or ​Firefox ​(Internet ​Explorer ​and ​Safari ​are ​not ​supported) ​and ​an ​internet ​connection ​which ​can ​support ​use ​of ​GoToTraining. ​ ​GoToTraining ​will ​be ​the ​platform ​on ​which ​the ​class ​will ​be ​delivered. ​ ​Prior ​to ​class, ​each ​registrant ​will ​receive ​GoToTraining ​log-in ​instructions. 

For more information and to confirm ​​your ​​computer ​​can ​​run ​​GoToTraining, please check here: https://support.logmeininc.com/gotomeeting/get-ready

About ​Databricks: 

Databricks’ ​vision ​is ​to ​empower ​anyone ​to ​easily ​build ​and ​deploy ​advanced ​analytics ​solutions. ​The ​company ​was ​founded ​by ​the ​team ​who ​created ​Apache® ​Spark™, ​a ​powerful ​open ​source ​data ​processing ​engine ​built ​for ​sophisticated ​analytics, ​ease ​of ​use, ​and ​speed. ​Databricks ​is ​the ​largest ​contributor ​to ​the ​open ​source ​Apache ​Spark ​project ​providing ​10x ​more ​code ​than ​any ​other ​company. ​The ​company ​has ​also ​trained ​over ​20,000 ​users ​on ​Apache ​Spark, ​and ​has ​the ​largest ​number ​of ​customers ​deploying ​Spark ​to ​date. ​Databricks ​provides ​a ​just-in-time ​data ​platform, ​to ​simplify ​data ​integration, ​real-time ​experimentation, ​and ​robust ​deployment ​of ​production ​applications. ​Databricks ​is ​venture-backed ​by ​Andreessen ​Horowitz ​and ​NEA. ​For ​more ​information, ​contact ​info@databricks.com.

Contact Information

© 2019
Quick, easy and affordable online event registration and event management software for all event sizes.