06 Jun 2018 : Data streaming & processing

Lieu : INSA Lyon, Amphi Télécom, 6 Avenue des Arts, Villeurbanne

Il n'est pas possible de s'inscrire pour cet évènement.

19h00 à 19h15 : Accueil

19h15 à 20h15 : Spark, big picture

Spark est un framework pour faire des calculs distribués. Mais encore ? Avec cette présentation, je vous propose de partir à la découverte de ce framework.

Nous ferons cela au travers de l’expérience que j’en ai eu : faire de l’analyse de données (statistiques descriptives, inférentielles, personnalisation) avec l’API Java. Celle-ci n’est pas forcément la plus courante dans le domaine. C’est pourquoi je vous propose de discuter des subtilités que celle-ci comporte et de ce que cela a comme conséquences au quotidien pour un développeur.

Nous traverserons ainsi les concepts de Spark (architecture distribuée, APIs haut niveau, APIS bas niveau, …) au travers de ce prisme.

Nastasia Saby ( Twitter @saby_nastasia) est développeur, passionnée de programmation en général, consultante Zenika, fan de Software Craftsmanship et de Big Data.

20h15 à 21h : Stream processing en mémoire avec Hazelcast Jet

Hazelcast Jet est un nouveau venu sur le marché des solutions de Stream Processing distribué. Appuyé sur la grille de données en mémoire bien connue Hazelcast In-Memory Data Grid, ce produit en cours de maturation (version 0.6 publiée en avril 2018) mérite que l’on s’y intéresse malgré sa jeunesse. Je vais présenter ses fonctionnalités majeures, ses points forts et faibles actuels, et la roadmap annoncée de ce qui sera peut-être un produit incontournable du Stream Processing dans les années à venir.

Claire Villard est développeuse Java depuis 2011, et travaille actuellement chez V3D. Après s’être beaucoup intéressée au monitoring applicatif à travers la stack Elastic (ElasticSearch, LogStash, Kibana), elle travaille désormais sur plusieurs projets ayant pour point commun HazelCast In-Memory Data Grid, et sera peut-être amenée au cours des mois à venir à mettre en place Jet.