Apache Spark Programming (Spark 105): 3 day Instructor Led Public Class (United Kingdom)

London
Wednesday, September 19, 2018
Databricks
Apache Spark Programming (Spark 105): 3 day Instructor Led Public Class (United Kingdom)
Wednesday, September 19, 2018 - Friday, September 21, 2018

Teradata UK
+44 (0)20 7205 2550
Teradata UK Ltd, , 3 London
Bridge Street,
London, SE1 9SG
United Kingdom

Map and Directions
Overview 

This three-day course will be delivered by Teradata UK our Databricks Authorized Training Partner from Wednesday, September 19, 2018 to Friday, September 21, 2019  from 9:00am to 5:00pm BST.

This ​course ​is ​designed ​for ​data ​engineers, ​analysts, ​architects; ​software ​engineers; ​IT ​operations; ​and ​technical ​managers ​interested ​in ​a ​thorough, ​hands-on ​overview ​of ​Apache ​Spark. ​ ​This ​course ​covers ​the ​same ​material ​as ​our ​three-day ​Apache ​Spark ​Programming ​course. 

The ​course ​covers ​the ​core ​APIs ​for ​using ​Spark, ​fundamental ​mechanisms ​and ​basic ​internals ​of ​the ​framework, ​SQL ​and ​other ​high-level ​data ​access ​tools, ​as ​well ​as ​Spark’s ​streaming ​capabilities ​and ​machine ​learning ​APIs. 

Each ​topic ​includes ​slide ​and ​lecture ​content ​along ​with ​hands-on ​use ​of ​Spark ​through ​an ​elegant ​web-based ​notebook ​environment. ​Inspired ​by ​tools ​like ​IPython/Jupyter, ​notebooks ​allow ​attendees ​to ​code ​jobs, ​data ​analysis ​queries, ​and ​visualizations ​using ​their ​own ​Spark ​cluster, ​accessed ​through ​a ​web ​browser. ​All ​class ​code ​is ​directly ​usable ​with ​pure ​open-source ​Spark ​or ​any ​commercial ​Spark ​distribution. 

Objectives ​- ​after ​taking ​this ​class ​you ​will ​be ​able ​to: 

Describe ​Spark’s ​fundamental ​mechanics 
Use ​the ​core ​Spark ​APIs ​to ​operate ​on ​data 
Articulate ​and ​implement ​typical ​use ​cases ​for ​Spark 
Build ​data ​pipelines ​with ​SparkSQL ​and ​DataFrames 
Analyze ​Spark ​jobs ​using ​the ​UIs ​and ​logs 
Create ​Streaming ​and ​Machine ​Learning ​jobs 

Modules 

Spark ​Overview 
RDD ​Fundamentals 
SparkSQL ​and ​DataFrames 
Spark ​Job ​Execution 
Cluster ​Architectures ​for ​Spark 
Intro ​to ​Spark ​Streaming 
Machine ​Learning ​Basics 

Cost: ​GBP 2500 ​per ​person 

Requirements 

All ​participants ​will ​need ​a ​laptop ​with ​updated ​versions ​of ​Chrome ​or ​Firefox ​(Internet ​Explorer ​and ​Safari ​are ​not ​supported) ​

About ​Databricks: 

Databricks’ ​vision ​is ​to ​empower ​anyone ​to ​easily ​build ​and ​deploy ​advanced ​analytics ​solutions. ​The ​company ​was ​founded ​by ​the ​team ​who ​created ​Apache® ​Spark™, ​a ​powerful ​open ​source ​data ​processing ​engine ​built ​for ​sophisticated ​analytics, ​ease ​of ​use, ​and ​speed. ​Databricks ​is ​the ​largest ​contributor ​to ​the ​open ​source ​Apache ​Spark ​project ​providing ​10x ​more ​code ​than ​any ​other ​company. ​The ​company ​has ​also ​trained ​over ​20,000 ​users ​on ​Apache ​Spark, ​and ​has ​the ​largest ​number ​of ​customers ​deploying ​Spark ​to ​date. ​Databricks ​provides ​a ​just-in-time ​data ​platform, ​to ​simplify ​data ​integration, ​real-time ​experimentation, ​and ​robust ​deployment ​of ​production ​applications. ​Databricks ​is ​venture-backed ​by ​Andreessen ​Horowitz ​and ​NEA. ​For ​more ​information, ​contact ​info@databricks.com.
 

Contact Information

© 2018
Quick, easy and affordable online event registration and event management software for all event sizes.