article-spots
article-carousel-spots
programs
Материалы

Data Science: материалы для самоподготовки

4 мая 2021

Сфера Data Science (DS) последние несколько лет привлекает все больше и больше начинающих разработчиков, и неспроста. Работа Data Science специалистов влияет на все сферы, начиная от рекламы и заканчивая медициной, а это, в свою очередь, обеспечивает разработчику постоянный приток новых увлекательных задач. Чтобы с легкостью освоить базис Data Science, можно воспользоваться списком материалов от Data-специалистов EPAM.

Книги и порталы

  • Python Machine Learning, S. Raschka and V. Mirjalili

Данная книга пользуется огромной популярностью среди начинающих разработчиков благодаря тому, что сложные концепции в ней объясняются простым языком, а между теорией и практикой соблюден грамотный баланс. Это – отличная стартовая точка для тех, кто только начинает погружение в Machine Learning и Data Science и хочет научиться разбираться в их базовых понятиях.

  • Глубокое обучение, Николенко С. и Кадурин А.

Максимум информации, минимум кода – именно так можно описать данную книгу по Deep Learning. В ней затронуты математические аспекты обучения нейронных сетей, поэтому не стоит ожидать легкого развлекательного чтения. Тем не менее, несмотря на сложность материала, книга не «скатывается» в академизм и старается подробно объяснять самые сложные идеи.

  • Deep Learning for Computer Vision with Python, Dr. Adrian Rosebrock

Имея интерес к области Computer Vision, стоит обратить внимание на данную книгу. В ней затрагиваются как азы обучения компьютерному зрению, так и построение нейронных сетей, глубокое обучение, и даже свёрточные нейронные сети (Convolutional Neural Networks). Книга нацелена на начинающих специалистов, но имеет еще два тома для тех, кто хочет продолжить погружение в данную область.

  • Pattern Recognition and Machine Learning, C. M. Bishop

Несмотря на кажущуюся сложность, данная книга о теории распознавании образов (Pattern Recognition) еще в аннотации успокаивает будущих читателей – для ее освоения не нужны глубокие познания в ML или PR, достаточно хорошо знать линейную алгебру, многомерный анализ, и щепотку теории вероятности. Идеальное пособие для студентов технических специальностей, или же просто любителей математики.

  • Deep Learning, I. Goodfellow, Y. Bengio and A. Courville

Одна из самых свежих и, одновременно, глубоких книг о Deep Learning, написанная на простом языке и потому подходящая для читателей с любым уровнем подготовки. Она считается «настольной книгой» любого Data Science специалиста благодаря стуктурности подачи информации, приличной порции математики, и – что уж там – восторженному отзыву Илона Маска, где он называет её «единственным исчерпывающим материалом» в сфере DL.

Доска на Medium, посвященная Data Science и всем её аспектам, где постоянно публикуются полезные практические материалы для разработчиков. Настоятельно рекомендуем следить за выходом новых статей, и смело обращаться туда за надежной информацией от специалистов из сферы DS.

Профессиональный ресурс, посвященный Machine Learning, Pattern Recognition, Data Mining и построенный по подобию Википедии, который собрал вокруг себя активное ядро профессиональных разработчиков. Над порталом ведется постоянная работа, благодаря чему туда можно обратиться за последней информацией из мира DS или профессиональным советом.

Практика

Платформа от Google, функционирующая как площадка для общения и система проведения соревнований для разрабочиков. Тут можно поучаствовать в публичных конкурсах от крупных компаний чтобы получить опыт работы над практическими задачами – от анализа поведения пользователей (Anti-fraud систем) до разпознавания deep fake-ов.  

Еще один продукт от Google – среда запуска кода на Python прямо в браузере. Удобное облачное решение, к тому же бесплатное, которое продвигается как продукт для исследователей в области искусственного интеллекта.

Открытая платформа для специалистов по DS со всего мира, где есть как бесплатные курсы по Machine Learning, Neural Learning и Deep Learning, которые считаются базовыми (и самыми лучшими) для старта, так и классические соревнования в духе распознавания речи, ориентирования по фото, трекингу фигур в режиме реального времени, и т. д.

Платформа для проведения соревнований, среди организаторов – крупнейшие российские компании. Формат проведения соревнований стандартен: за призовой фонд могут бороться все участники платформы, а среди задач – предсказание поведения пользователей в приложении, анализ характера человека и даже прогнозирование сейсмической активности.

Курсы

Формат онлайн-обучения отлично подходит для молодых специалистов, которые ищут структурированности знаний и доступности изложения. Из всего разнообразия бесплатных или недорогих курсов очень сложно выбрать стоящие материалы – поэтому мы собрали, на наш взгляд, самые качественные онлайн-занятия на популярных платформах. Многие курсы посвящены пересекающимся темам, но это – лишь повод повторить пройденную информацию, узнать её в новом изложении и почерпнуть для себя что-то новое. 

Огромный плюс онлайн-курсов – большинство из них предоставляют ученикам сертификаты о прохождении, которые затем можно показать рекрутеру как подтверждение своих знаний. Тем не менее, мы не советуем увлекаться их коллекционированием, поскольку самым важным аспектом при приеме на работу является реальный опыт разработки: pet проекты, участие в хакатонах, или призовое место в одном из DS\ML соревнований на перечисленных выше порталах произведут на рекрутера куда большее впечатление.

Stepik

Coursera

ODS


YouTube-стрим по Data Science от EPAM Training Center

Смотри запись нашего недавнего YouTube-стрима Small Talk with Data Lab Head, где Анна Петрашко, руководитель Data-лаборатории EPAM, рассказала:

• Что такое Data Lab и как устроен процесс обучения

• Зачем она нужна и кому будет полезна

• Какие навыки нужны студенту лабы

Также в видео ты сможешь найти ответы на самые популярные вопросы о Data-практике в EPAM, узнать отличия Data Engineer и Database Administrator, а также услышать о всех тонкостях Project Stage нашей лаборатории.

Бесплатное обучение по Data Science в EPAM

Приглашаем на бесплатный онлайн-тренинг по Data Science, который поможет вам освоить это востребованное направление и получить возможность трудоустроиться в компанию EPAM.

Мы приветствуем самостоятельное обучение, но без крутого наставника прогресс в Data Science будет медленным и хаотическим – мы же предлагаем полное погружение в новую профессию под руководством опытных специалистов компании. Чтобы присоединиться к нам, не нужно наизусть учить все перечисленные материалы! Достаточно уверенно знать Python и английский на уровне B1, а также иметь понимание о том, что такое алгоритмы и структуры данных (поиск, сортировка, списки, очереди, стеки, и т.п.), хорошо понимать линейную алгебру, оптимизацию, теорию вероятностей и математическую статистику.