podcast

Хабр ПРО // Конвейер для «нового золота»: что можно сделать с большими данными

10.09.2021
Listen to the episode on your favorite platforms:
  • Apple Podcasts
  • Yandex Music
  • Spotify
  • Звук
  • Castbox
  • Pocket Casts
  • PlayerFM
  • SoundStream
  • Overcast
  • Castro
  • RadioPublic
В этом выпуске мы обсуждаем сложности сбора и обработки данных. Работа с Big Data и получение из них ценности — это конвейер, на котором трудятся целые команды. Как идёт работа в начале и конце этого пути, нам расскажут два разных специалиста: data engineer и product owner.  
 
О том, как и какими инструментами добываются данные, мы узнаем от Дмитрия Захарова — дата-инженера и тимлида разработки витрины данных в Сбере. 
 
А Игнат Постный, исполнительный директор TAG Consulting, поведает, какие задачи он решает с помощью инструментов AI и какие барьеры есть на проде. 
 
Содержание: 
 
Кто есть кто: чем занимаются data engineer и product owner в Big Data 
Этапы обработки больших данных в крупной финансовой компании 
Особенности работы с естественным языком и неструктурированными документами 
Как обойти проблему «Garbage in — garbage out» и дорогостоящих ошибок 
Отсутствие стандартов и другие боли дата-сатанистов 
Как строится витрина данных 
Корпоративный ресурс vs творческий подход 
Как объём данных влияет на качество их обработки 
Сможет ли нейросеть понять естественный язык 
Как попасть на «конвейер» Big Data, важен ли математический бэкграунд 
Минимальный объём скиллов для дата-инженера 
Правильный T-shape для дата-сайентиста 
Каких прорывов больше всего ожидают в Data Science 
Нерешённые проблемы и тенденции индустрии 
 
Запись прямого эфира можно посмотреть тут: https://www.youtube.com/watch?v=fjBcIvVVkF4