DataMass Gdańsk Summit

29 Września 2017, 09:00 (Piątek) - 30 Września 2017, 16:00 (Sobota)

Zobacz na mapie

To wydarzenie już się skończyło. Zapraszamy na inne ciekawe wydarzenia.
  Rodzaj Dostępne do Cena Liczba
  DataMass (conference ticket) - early bird
już niedostępne 150,00 zł -
Plan warsztatu:
1. Narzędzia Microsoft
2. Podstawy języka R
3. Przygotowanie danych (Data Processing) - przy użyciu bibliotek Microsoft
4. Statystyka, uczenia maszynowe przy użyciu bibliotek Microsoft

Użytkownicy powinni mieć zainstalowane:
1. Microsoft R Open
2. Microsoft R Client lub R Server 9.1 lub SQL Server 2016 with R Services lub SQL Server 2017 with ML Services
3. R Tool for VS lub R Studio
DataMass - workshop - L.Grala (Język R z wykorzystaniem bibliotek Microsoft) 30.09 (sobota) godz.10-16

Plan warsztatu:
1. Narzędzia Microsoft
2. Podstawy języka R
3. Przygotowanie danych (Data Processing) - przy użyciu bibliotek Microsoft
4. Statystyka, uczenia maszynowe przy użyciu bibliotek Microsoft

Użytkownicy powinni mieć zainstalowane:
1. Microsoft R Open
2. Microsoft R Client lub R Server 9.1 lub SQL Server 2016 with R Services lub SQL Server 2017 with ML Services
3. R Tool for VS lub R Studio

już niedostępne 270,60 zł -
Opis:

Celem warsztatu jest przedstawienie H2O (architektura oraz dostępne algorytmy). Dodatkowo zaprezentowany zostanie Hadoop jako rozproszona platforma analityczne. Pokażemy poszczególne komponenty oraz sposoby na ich wykorzystanie. Podczas warsztatu dokonamy próby analizy danych udostępnionych przez UM w Gdańsku.

Tematyka:

Przegląd podstawowych funkcji z pakietu H2O
Uruchamianie i zamykanie klastra H2O - Listowanie obiektów na klastrze
Wczytywanie danych do H2O z R i lokalizacji zewnętrznych
Zapisywanie danych z H2O do R i lokalizacji zewnętrznych
Usuwanie obiektów z klastra - Prosta manipulacja danymi
Krótkie przypomnienie teori uogólnionych modeli liniowych (GLM) i regularyzacji Elastic Net
GLM przy użyciu H2O FLOW
GLM na przykładzie wykrywania fraudów
Wczytanie i przegląd danych, funkcje podsumowujące
Podział na zbiór uczący i testowy w H2O
Regresja logistyczna przy użyciu funkcji h2o.glm(), przegląd najważniejszych parametrów, regularyzacja i under/over-sampling
Predykcje i miary dopasowania
Zapisywanie i wczytywanie modelu
DataMass - workshop - M.Liksza (Machine Learning in R using H2O framework) 30.09 (sobota) godz.10-16

Opis:

Celem warsztatu jest przedstawienie H2O (architektura oraz dostępne algorytmy). Dodatkowo zaprezentowany zostanie Hadoop jako rozproszona platforma analityczne. Pokażemy poszczególne komponenty oraz sposoby na ich wykorzystanie. Podczas warsztatu dokonamy próby analizy danych udostępnionych przez UM w Gdańsku.

Tematyka:

Przegląd podstawowych funkcji z pakietu H2O
Uruchamianie i zamykanie klastra H2O - Listowanie obiektów na klastrze
Wczytywanie danych do H2O z R i lokalizacji zewnętrznych
Zapisywanie danych z H2O do R i lokalizacji zewnętrznych
Usuwanie obiektów z klastra - Prosta manipulacja danymi
Krótkie przypomnienie teori uogólnionych modeli liniowych (GLM) i regularyzacji Elastic Net
GLM przy użyciu H2O FLOW
GLM na przykładzie wykrywania fraudów
Wczytanie i przegląd danych, funkcje podsumowujące
Podział na zbiór uczący i testowy w H2O
Regresja logistyczna przy użyciu funkcji h2o.glm(), przegląd najważniejszych parametrów, regularyzacja i under/over-sampling
Predykcje i miary dopasowania
Zapisywanie i wczytywanie modelu

już niedostępne 270,60 zł -

DataMass Gdańsk Summit

We create an event targeted at people who use Big Data in practice in their daily work. We want to share knowledge and exchange experience in shaping scalable and distributed computing solutions. The main idea behind the conference is to promote knowledge and experience in designing and implementing tools for the analysis of big data volumes.

Playing an active role in the BigData world, we can see that a big technical conference focused on the exchange of knowledge and experience in this field is needed in Poland. The aim of the conference is to create a synergy between businesses, focused on the creation and implementation of Enterprise class solutions, and experience and knowledge of academic environment. The Data Science is a great example showing this is currently possible.

Topics:

 • Hadoop Application Development - creation of distributed computing solutions using Hadoop framework. Architecture, implementation and testing of software based on a cluster or a distributed system of files. Creation of ETL processes and reporting systems
 • Hadoop Administration - management and administration of clusters based on BigData technologies. In this subject, we focus on issues related to the installation and maintenance of advance cluster solutions (installation, configuration, decomposition and update of the cluster). This cycle also touches upon the methods of automating maintenance processes within the cluster
 • Data Science, Analytics and Reporting - data analysis systems using machine learning and artificial intelligence. Creation and optimisation of analytically sophisticated solutions. Methods of modelling and verifying developed solutions
 • Real-Time Processing - real-time processing of data going to a cluster. This form of data analysis enables an immediate response to any generated activity. It is not only about the activity generated by users themselves, but also about devices communicating with each other within the IoT standard
 • Hadoop in business - Business application of Big Data tools. Typical using case studies showing why the world of big data wins the market all over the world. Pros and cons of solutions in terms of efforts and costs related to the implementation and maintenance of such environments. Reference to commercial vs. open-source technologies

Speakers

We have the best speakers from biggest IT companies. Lectures will be led by:

 • Łukasz Grala, MVP Microsoft
 • Michał Żyliński, Microsoft
 • Derek Yeung, Nordea
 • Łukasz Cmielewski, IBM
 • Claudio Villar, Airhelp

and the other technology leaders..

Workshops

 • Łukasz Grala, Język R z wykorzystaniem bibliotek Microsoft. (in Polish), 30.09 (Saturday) 10AM-4PM
 • Mariusz Liksza, Machine Learning in R using H2O framework. (in Polish), 30.09 (Saturday) 10AM-4PM
 • Jakub Wszolek, Kylo - opensource DataLake platform. (in Polish), 30.09 (Saturday) 10AM-4PM
Zobacz również:

konferencje konferencje w Gdańsku wydarzenia Gdańsk