Инструменты кэширования для ML-функций в Python 3.11

Работа инференса ML-проекта может быть очень интенсивной по CPU и требовать значительной RAM. С ростом RPS, числа подов и при наличии нескольких DC, вопрос приобретает ещё большее значение, т.к. неэффективность умножается на число инстансов приложения.

Ресурсы в РФ всегда дорогие, поэтому имеет смысл рассмотреть вариант Server-Side кэширования вызовов таких функций. Кэширование позволяет значительно сократить время выполнения, сохраняя результаты предыдущих вычислений.

В этом посте я рассмотрел популярные инструменты кэширования, которые могут быть полезны для оптимизации вызовов дорогостоящих CPU-bound ML-функций в Python 3.11.

Изучил «Рекомендательные системы» из курса Hard ML

С сентября 2024 года я работаю в RUTUBE и первая же задача связана с микросервисом рекомендательной системы. С MLOps технологиями проекта у меня явных сложностей нет, но чтобы быть более эффективным в разработке и эксплуатации, я решил изучить теорию.

Эта тема мне всегда была интересна. Впервые о подходах к их реализации я услышал в 2017 году в курсе MITx: 15.071x The Analytics Edge на примере Netflix. Далее были видео от ШАД и команды Яндекс.Дзена с теорией и обширная практика работы в контентном портале, где я подробно изучал рекомендательные системы платформ дистрибуции контента.

Но время идёт, информация забывается, подходы меняются. Поэтому, я решил изучить блок «Рекомендательные системы» из более свежего курса Hard ML.

Это мой конспект данного блока. Содержание дополняется по мере изучения материалов.

Прослушал курс "MLOps for ML Engineers", МФТИ, весна 2024

В одном MLOps чате я увидел ссылку на плейлист с видео этого курса. В первую очередь меня заинтересовал контент, связанный с NVIDIA GPU и Triton Inference Server.

Посмотрел первую лекцию, понял, что материал годный и решил прослушать полностью. На изучение ушло примерно 30 рабочих часов (я трекал).

Читайте мои впечатления от курса и конспект.

Как подготовиться и пройти System Design Interview — конспект и анализ выступления Александра Поломодова

У меня есть цель стать в будущем Solution Architect и я ищу пути её достижения.

Поэтому я нашел и послушал доклад Александра Поломодова c ArchDays 2022, в котором он показал путь, который сам когда-то проходил и кажется ему правильным.

Написал конспект с основными мыслями. Привел ссылки на: книги, записи видео, обучающие курсы и прочие ресурсы.

Сделал свои выводы. Помимо прочего, в них я показал альтернативный способ, как можно стать Solutions Architect.

Если у вас такая же цель, как и у меня, читайте, будет полезно!

Прохожу курс "SRE: Стратегия и методы" от МТС

Я проектирую и создаю приложения, которые потом довожу до продуктивной среды. Я делаю всё, чтобы команда могла спокойно спать по ночам, отдыхать на выходных и праздниках.

Но, чтобы я ни делал, в моей практике отказы все равно случались. И я уверен, что еще будут случаться. Поэтому, тема надежности и восстановления после отказов интересует меня особенно.

Смотрите под катом: краткое описание, ссылки на видеозаписи лекций и презентации, информация о дополнительных материалах.

Демография РФ: текущая ситуация, влияние на пенсии и рынок труда

Читайте и узнайте:

  1. Почему у сегодняшних работников будет повышаться пенсионный возраст и/или будет крошечная пенсия.
  2. Почему Team Leads и Engineering Managers на ближайшие 12-14 лет придется перестроить работу с кадрами.

Пирамида критики Пола Грэма

Мы критикуем и нас критикуют. Критика — это нормально. Ненормально, когда звучит неконструктивная критика.

Смотрите под катом пирамиду критики Пола Грэма и критикуйте правильно.

Прочитал и разобрал на молекулы книгу Building Microservices, 2nd Edition - Sam Newman

Автор 12 лет работал в компании ThoughtWorks. Да-да, это та самая ThoughtWorks, в которой работает Martin Fowler 😄

Под катом:

  1. для кого и чем она полезна;
  2. полезные артефакты: Mind Map конспекта и ссылка на мой Solution Architect Framework, который я разработал после прочтения книги;
  3. список материалов для дальнейшего изучения.