Zatrudnienie przez Bergman Engineering w ramach umowy B2B
Wynagrodzenie: 80–110 zł netto/h (w zależności od doświadczenia)
Zatrudnienie na okres 24 miesięcy z możliwością przedłużenia oraz nawiązania stałej współpracy
Możliwość przystąpienia do pakietu medycznego, sportowego oraz ubezpieczenia
Możliwość udziału w ciekawych projektach w ramach grupy Bergman Engineering
Możliwość pracy hybrydowej lub zdalnej
Obowiązki
Projektowanie i rozwój platform danych wspierających aplikacje AI w środowisku produkcyjnym
Integracja danych z systemów klienta (ERP, MES, WMS, QMS, CMMS) oraz ze źródeł zewnętrznych (API, pliki, bazy danych)
Budowa i utrzymanie procesów ETL/ELT, harmonogramowanie zadań oraz implementacja mechanizmów niezawodności (ponowienia, alerty)
Definiowanie i wdrażanie ujednoliconego logu zdarzeń obejmującego cały cykl przetwarzania danych, analiza przepływów procesowych oraz identyfikacja wąskich gardeł
Zapewnienie jakości danych: walidacja, testowanie, standaryzacja sposobu liczenia KPI (np. OEE, OTIF) oraz śledzenie i dokumentowanie pochodzenia danych (data lineage)
Współpraca z zespołami ML Engineering i MLOps przy przygotowaniu danych pod modele (feature-ready datasets) oraz zapewnieniu spójności danych w całym cyklu życia produktu
Wymagania
Bardzo dobra znajomość SQL oraz doświadczenie w modelowaniu warstwy analitycznej (data warehouse/lakehouse)
Znajomość relacyjnych baz danych (np. PostgreSQL, MySQL, MS SQL) oraz baz NoSQL
Bardzo dobra znajomość Pythona (m.in. pandas, numpy, SQLAlchemy, PyMongo, Spark) w zakresie przetwarzania danych oraz integracji z różnymi systemami i bazami danych
Doświadczenie w orkiestracji i uruchamianiu pipeline’ów danych z wykorzystaniem narzędzi takich jak Airflow oraz platform i środowisk data (np. Snowflake, Kubernetes, Docker lub podobne)
Doświadczenie w pracy z danymi zdarzeniowymi i procesowymi (statusy, czasy, logi)
Doświadczenie w normalizacji i ujednolicaniu danych pomiędzy różnymi systemami
Doświadczenie w pracy z Infrastructure as Code oraz w budowie i utrzymaniu pipeline’ów CI/CD dla rozwiązań data (automatyzacja wdrożeń, testy, deployment)