В этом выпуске мы обсуждаем сложности сбора и обработки данных. Работа с Big Data и получение из них ценности — это конвейер, на котором трудятся целые команды. Как идёт работа в начале и конце этого пути, нам расскажут два разных специалиста: data engineer и product owner.
О том, как и какими инструментами добываются данные, мы узнаем от Дмитрия Захарова — дата-инженера и тимлида разработки витрины данных в Сбере.
А Игнат Постный, исполнительный директор TAG Consulting, поведает, какие задачи он решает с помощью инструментов AI и какие барьеры есть на проде.
Содержание:
Кто есть кто: чем занимаются data engineer и product owner в Big Data
Этапы обработки больших данных в крупной финансовой компании
Особенности работы с естественным языком и неструктурированными документами
Как обойти проблему «Garbage in — garbage out» и дорогостоящих ошибок
Отсутствие стандартов и другие боли дата-сатанистов
Как строится витрина данных
Корпоративный ресурс vs творческий подход
Как объём данных влияет на качество их обработки
Сможет ли нейросеть понять естественный язык
Как попасть на «конвейер» Big Data, важен ли математический бэкграунд
Минимальный объём скиллов для дата-инженера
Правильный T-shape для дата-сайентиста
Каких прорывов больше всего ожидают в Data Science
Нерешённые проблемы и тенденции индустрии
Запись прямого эфира можно посмотреть тут: https://www.youtube.com/watch?v=fjBcIvVVkF4
О том, как и какими инструментами добываются данные, мы узнаем от Дмитрия Захарова — дата-инженера и тимлида разработки витрины данных в Сбере.
А Игнат Постный, исполнительный директор TAG Consulting, поведает, какие задачи он решает с помощью инструментов AI и какие барьеры есть на проде.
Содержание:
Кто есть кто: чем занимаются data engineer и product owner в Big Data
Этапы обработки больших данных в крупной финансовой компании
Особенности работы с естественным языком и неструктурированными документами
Как обойти проблему «Garbage in — garbage out» и дорогостоящих ошибок
Отсутствие стандартов и другие боли дата-сатанистов
Как строится витрина данных
Корпоративный ресурс vs творческий подход
Как объём данных влияет на качество их обработки
Сможет ли нейросеть понять естественный язык
Как попасть на «конвейер» Big Data, важен ли математический бэкграунд
Минимальный объём скиллов для дата-инженера
Правильный T-shape для дата-сайентиста
Каких прорывов больше всего ожидают в Data Science
Нерешённые проблемы и тенденции индустрии
Запись прямого эфира можно посмотреть тут: https://www.youtube.com/watch?v=fjBcIvVVkF4
Smart linkhttps://podcast.ru/e/4lw8MIKGJad
Auto-openhttps://podcast.ru/e/4lw8MIKGJad?a
Add podcast to the siteEmbed Podcast