🤖 Датаист
2.48K subscribers
9 photos
13 videos
1 file
85 links
Меня зовут Андрей Кузьминых, я технологический предприниматель, ex-директор по данным и ИИ в Сбере. Рассказываю о своих проектах, объясняю, как работают все эти ИИ-чудеса, комментирую новости и рассуждаю о будущем индустрии

Для связи: @andre_andreevich
Download Telegram
Привет! Меня зовут Андрей, я технологический предприниматель в сфере искусственного интеллекта (ИИ).

Я обладаю обширными знаниями в области ИИ, а также богатым практическим опытом разработки ИИ-продуктов любой сложности и их вывода на международный рынок. Если вам нужно запустить ИИ-стартап с нуля или внедрить ИИ в процессы вашей компании, я готов помочь. В моей команде работают профессионалы, увлеченные решением сложных задач: от интеллектуального анализа данных до разработки цифровых двойников и обучения беспилотных автомобилей.

В этом блоге я делюсь своими кейсами, простыми словами объясняю сложные технологические аспекты работы ИИ-продуктов, комментирую актуальные новости индустрии, делюсь своим мнением и видением будущего технологий, а также даю практические советы по созданию успешных ИИ-стартапов.

Коротко обо мне:

• Выпускник Вышки;
• Ex-Data Engineer в Accenture;
• Ex-Chief Data Officer в Сбере;
• Ex-Chief Data Scientist в Сбере;
• Ex-Куратор национальных проектов в области ИИ;
• Ex-Chief Technology Officer в венчурной студии для ИИ-стартапов;
• Сооснователь и CTO в Pygma AI;
• Создаю ИИ-сотрудников для автоматизации рутины;
• Консультирую ИИ-стартапы и технологические компании.

История моего пути
О моей компании

Узнать больше о моей компании можно по ссылке

Мои проекты:
Pygma AI - ИИ-ассистент для соцсетей;
Dataist AI - ИИ-ассистент для исследователей;
Landao AI - ИИ-коуч по счастью.

#обо_мне - о моем пути;
#технологии - анализирую текущие тренды;
#кейсы - делюсь своим опытом;
#мысли - размышляю о технологиях;
#новости - только самое интересное;
#исследования- обзор статей об ИИ;
#анонс - анонсы о событиях и релизах.

Присоединяйтесь, будет интересно!
В эту субботу я выступаю с докладом на конференции Data Fest в Ереване. Мой доклад будет посвящен персонализации мультиагентных систем для автоматизации ведения блога в соцсетях.

Конференция пройдет 6-7 сентября. На ней выступят представители Nvidia, Google, AWS, Yandex и других крупных компаний - регистрация бесплатная.

#анонс
ИИ-стартап: путь к успеху

Я знаю по опыту, что большинство стартапов терпят неудачу, и с этим ничего не поделать. Но также я знаю, что принятие верных и быстрых технологических решений может помочь одной из десятка идей пройти весь путь до финальной стадии и привести команду к большому успеху.

Недавно я написал об этом статью на Хабр. Дал ей отлежаться, слегка переписал и теперь хочу рассказать о ней и здесь.

В ней говорится о том, как устроен запуск стартапа с точки зрения технологий, а не инвестиций и бизнеса.

Какой софт использовать для создания структуры бизнес-модели и архитектуры технического решения? Как прототипировать? Как максимально быстро собрать MVP продукта, чтобы получить первый фидбек от пользователей? Как подключить платежки и аналитику, какие для этого использовать решения? Как правильно масштабироваться, если получилось начать расти? Наконец, как поддерживать готовый зрелый продукт? Обо всем этом я рассказываю в статье.

Буду рад, если это окажется полезным.

#анонс
Как мы провели ИИ-трансформацию стратегических процессов в Сбере

Сегодня выпустил статью на Хабре (в продолжении этого поста), в которой рассказываю как наша команда за один квартал провела масштабную ИИ-трансформацию в стратегическом блоке Сбера. Перед нами стояла амбициозная задача - внедрить ИИ в 30 ключевых управленческих процессов в сжатые сроки.

В статье вы узнаете о методологии и фреймворках по внедрению ИИ в процессы компании; о сложностях и вызовах при внедрении ИИ в крупной корпорации; о практических уроках и инсайтах, которые можно применить в своем бизнесе.

Буду рад вашим вопросам и комментариям!

#анонс
Dataist AI — ежедневный гид по лучшим научным статьям об ИИ

В наше время, чтобы быть в курсе всего нового в области ИИ, нужно регулярно читать актуальные научные статьи. Но ежедневно выходит тысячи статей, и прочитать их все почти невозможно.

Поэтому я создал телеграм-бота Dataist AI. Каждый будний день бот присылает короткие обзоры топовых статей об ИИ на русском и английском языках.

Присоединяйтесь к Dataist AI совершенно бесплатно и будьте в тренде последних ИИ-технологий в удобном формате.

🔗 Ссылка на бот

#анонс
Задумывались ли вы, что с помощью данных и машинного обучения можно не только оптимизировать рабочие процессы, но и помогать людям находить родственные души?

В новой статье на Хабре я рассказываю о том, как мы в Сбере создали первый в России корпоративный дейтинг-сервис, победили в бизнес-акселераторе и помогли сотням людей найти себе пары, а некоторым даже пожениться.

Если вы ищете вдохновение в том, как ИИ может делать людей счастливее, читайте статью по ссылке.

#анонс
Эксперимент с Landao AI - персональным ИИ-коучем по счастью

Обычно на Новый год люди желают друг другу счастья. Нобелевский лауреат по физике Лев Ландау считал, что быть счастливым - обязанность каждого человека.

Что же такое счастье - вопрос субъективный, хотелось бы подойти к нему “по-науке”. С нейробиологической перспективы счастье - выброс серотонина и дофамина, но все же и это часто следствие более глубоких психологических процессов.

Хотя базовый уровень счастья предопределен генетически, я все же хочу провести эксперимент с целью проверить сможет ли ИИ помочь нам стать чуть счастливее.

Мой подарок вам - ИИ-коуч, который поможет быть счастливее через:

Практики стоицизма. Он ежедневно присылает короткие уроки стоицизма. Стоицизм – древнегреческая философия, которая учит опираться на разум и отделять эмоции от внешних обстоятельств.

Ментальные установки. Вы сможете записывать мысли, вызывающие у вас определенные эмоции, и получать поддержку, используя когнитивно-поведенческую терапию. Это научно обоснованный метод, помогающий менять установки, ведущие к счастью.

Социальную поддержку. Анонимно обменивайтесь эмоциями и знакомьтесь с единомышленниками. Гарвардское исследование доказало, что хорошие отношения с людьми напрямую влияют на наш уровень счастья.

Все это бесплатно.

Планирую расширение в сторону дейтинга и нетворкинга, ведь, по Ландау, счастье складывается из трех слагаемых: работа, любовь и общение с людьми.

На уровень счастья влияет и физическое состояние, поэтому для чистоты эксперимента важно регулярно заниматься спортом, правильно питаться, качественно отдыхать, начинать и заканчивать день без смартфона (лучше - медитации).

Отделять эмоции от внешних обстоятельств - важный навык для человека любой эпохи. Надеюсь в совокупности с другими методами Landao AI поможет многим людям.

Я сам буду пользоваться ботом ежедневно и через год подведу итоги стал ли я более счастливым, чего желаю и вам.

Приглашаю и вас присоединиться к эксперименту по ссылке, буду рад обратной связи.

@landao_bot

#анонс
Как устроить гонки с ИИ на настоящих картах, не вставая с дивана?

В новой статье на Хабре я рассказываю, как мы построили трассу из покрышек, оснастили гоночный карт различными датчиками и дали возможность управлять им прямо из браузера.

Но самое интересное — это наш фреймворк Simularity для обучения беспилотных агентов. С его помощью мы натренировали ИИ-соперников, которые учатся ездить агрессивно, совершать обгоны и избегать столкновений благодаря синтетическим данным и обучению с подкреплением.

Если вы хотите узнать, как мы совмещаем симуляцию и реальную физику и что такое Curriculum Learning, загляните в мою статью на Хабре. В ней я рассказал о пайплайне обучения беспилотников в симуляции и о том, как мы превращаем обычный гоночный карт в высокотехнологичную игрушку будущего.

Буду рад ответить на ваши вопросы и комментарии.

#анонс
Топ-10 исследований ИИ за январь 2025

Вышла моя новая статья на Хабре, где я сделал обзор десяти самых перспективных (на мой взгляд) исследований в ИИ за январь этого года. Вот краткий обзор каждого исследования:

1. DeepSeek R1

Китайская модель DeepSeek R1 демонстрирует, как с помощью обучения с подкреплением можно научить ИИ рассуждать, генерируя подробные цепочки мыслей. R1 успешно конкурируют с закрытыми аналогами на задачах математики, логики и программирования, а также требует меньше вычислений для обучения.

2. Cosmos World Foundation Model Platform for Physical AI

Cosmos WFM (модель мира) от Nvidia – платформа для «Физического ИИ», способная предсказывать следующие кадры видео и моделировать реальные физические процессы. Платформа позволяет обучать роботов и устройства с сенсорами без риска для реальных устройств.

3. GameFactory: Creating New Games with Generative Interactive Videos

GameFactory – фреймворк, который на основе диффузионных видеомоделей генерирует интерактивные игровые сцены. Специальный датасет из Minecraft и многоступенчатая стратегия обучения позволяют системе реагировать на действия пользователя, открывая новые горизонты в создании игр.

4. UI-TARS: Pioneering Automated GUI Interaction with Native Agents

ИИ-агент от разработчиков TikTok, который, используя только скриншоты, самостоятельно анализирует графические интерфейсы и принимает решения (клики, ввод текста и т.д.). Модель генерирует цепочки рассуждений перед каждым действием, демонстрируя рекордные результаты на различных задачах взаимодействия с пользовательским интерфейсом.

5. Multiagent Finetuning: Self Improvement with Diverse Reasoning Chains

Исследователи из Гарварда, Оксфорда, MIT и Google DeepMind предложили метод мультиагентного дообучения, при котором несколько агентов участвуют в «дебатах», чтобы выбрать финальное решение. Такой подход сохраняет разнообразие логических цепочек и значительно повышает точность при решении сложных задач.

6. Chain of Agents: Large language models collaborating on long-context tasks

Метод Chain-of-Agents от Google Cloud AI Research делит длинные тексты на фрагменты, каждый из которых обрабатывается отдельным агентом. Итоговый менеджер объединяет результаты, что позволяет улучшить суммаризацию и ответы на вопросы, хотя передается риск потери деталей при передаче информации между агентами.

7. Towards System 2 Reasoning in LLMs: Learning How to Think With Meta Chain-of-Thought

Исследователи из Стэнфорда и Беркли предлагают Meta Chain-of-Thought – метод, в котором модель не только генерирует пошаговые рассуждения, но и фиксирует историю перебора гипотез. Такой подход приближает мышление ИИ к «Системе 2», позволяя решать более сложные задачи с элементами самоанализа и коррекции.

8. Humanity’s Last Exam

Бенчмарк Humanity’s Last Exam – это комплексный тест из более чем 3000 вопросов уровня PhD по дисциплинам от математики до археологии. Он позволяет оценить истинный уровень знаний современных моделей и стимулирует дискуссии о безопасности и регулировании ИИ.

9. VideoRAG: Retrieval-Augmented Generation over Video Corpus

VideoRAG расширяет концепцию RAG, объединяя визуальные и текстовые данные для работы с видеоконтентом. Модель динамически находит релевантные видео из огромного корпуса и интегрирует их в ответ, что значительно повышает точность и детализацию результатов.

10. Agent Laboratory: Using LLM Agents as Research Assistants

Лаборатория ИИ-агентов автоматизирует весь цикл научного исследования – от обзора литературы до генерации отчетов. Система помогает ускорить рутинные процессы, оставляя за исследователем возможность контроля и корректировки итоговых результатов.

Читайте полную статью на Хабре, чтобы быть на шаг впереди в этом быстро меняющемся мире технологий.

#исследования #анонс
Недавно в блоге контент-агентства «Простыми словами» вышла статья о больших языковых моделях.

В ней я выступил в роли эксперта и простым языком рассказал:

• Что такое большие языковые модели и как они работают;

• Какие тенденции сейчас определяют развитие этой технологии;

• Как и где применять LLM в бизнесе;

• На что обратить внимание при выборе модели;

• Готовые примеры эффективных промптов для решения разных задач.

Статья ориентирована в первую очередь на новичков, но может быть полезна как предпринимателям, так и IT-специалистам.

#анонс
This media is not supported in your browser
VIEW IN TELEGRAM
Знакомьтесь, Виктория - джуниор рекрутер

В прошлый раз я писал об автоматизации найма, а сегодня представляю вам новую ИИ-сотрудницу – Викторию, которая уже автоматизировала найм в моей компании.

Теперь она готова помочь и вам:

• Создание вакансий: Виктория поможет грамотно сформулировать описание вакансии, учитывая актуальные требования и особенности вашей компании;

• Профессиональный отбор: Она отберет кандидатов по определенным критериям и предоставит подробный анализ каждого претендента;

• Удобство коммуникаций: Общайтесь с Викторией голосом или отправляйте файлы с описанием вакансии и резюме – она легко справится с любыми форматами.

Вы можете взять Викторию на бесплатную стажировку, оценить ее работу, а затем нанять на неделю, месяц или год. У меня работают и другие ИИ-сотрудники, я называю их iHumans, и в ближайшее время познакомлю вас с ними.

Если хотите себе ИИ-сотрудника с вашим лицом и голосом – пишите в личные сообщения, также буду рад получить обратную связь.

@hr_ihumanbot

#анонс
Как ИИ научился читать мысли и чем опасны суперинтеллектуальные агенты: топ-10 исследований ИИ за февраль 2025

Вышла моя новая статья на Хабре, где я сделал обзор десяти самых интересных исследований в области ИИ за февраль этого года (простым языком и с мемами).

1. Системная карточка OpenAI o3-mini

Новая модель o3-mini значительно приблизилась к уровню общего искусственного интеллекта (AGI). С использованием технологии цепочек рассуждений модель демонстрирует впечатляющие результаты в математике, программировании и устойчивости к небезопасному контенту, превосходя предыдущие версии по точности и скорости.

2. Эмерджентное планирование ответов в LLM

Исследование Шанхайской ИИ-лаборатории выявило, что большие языковые модели заранее планируют характеристики своих ответов, используя скрытые слои. С помощью более простых нейросетей ученые научились предсказывать длину, стиль и уверенность ответа модели до начала генерации текста.

3. ReLearn: Эффективное забывание информации в LLM

Предложен инновационный подход к удалению нежелательной информации из больших языковых моделей. Используя позитивную оптимизацию, ReLearn позволяет эффективно забывать чувствительные данные без потери полезных знаний и связности текстов.

4. AI co-scientist от Google Research

Разработана мультиагентная платформа в качестве ИИ-помощника для ученого, которая автоматизирует создание и проверку научных гипотез. Система успешно генерирует и проверяет гипотезы в биомедицине, значительно ускоряя научный процесс.

5. Brain2Qwerty: Неинвазивное декодирование текста из мозговой активности

Создана нейросеть Brain2Qwerty, которая с высокой точностью декодирует набираемый текст по мозговой активности с помощью магнитной энцефалографии (МЭГ). Модель успешно распознаёт текст с точностью до 81%, открывая новые перспективы для создания безопасных интерфейсов «мозг-компьютер».

6. LLaDA: Большие языковые диффузионные модели

Разработана диффузионная модель LLaDA, которая генерирует текст параллельно, а не последовательно. Это ускоряет процесс генерации и повышает качество на сложных задачах. Модель превосходит GPT-4 в задачах, требующих сложных рассуждений.

7. SWE-Lancer: Может ли ИИ заработать миллион на фрилансе?

Исследование показало реальную эффективность языковых моделей в решении задач разработки ПО на платформе Upwork. Модель Claude 3.5 Sonnet успешно решила задачи на $403 тыс. из потенциального $1 млн, подчеркнув как потенциал, так и текущие ограничения ИИ в фрилансе.

8. TwinMarket: Реалистичная симуляция финансовых рынков с помощью ИИ

Создана платформа TwinMarket, использующая большие языковые модели для реалистичной симуляции финансовых рынков. Модель воспроизводит сложные рыночные явления, включая финансовые пузыри и коллективное поведение инвесторов для изучения и управления рисками.

9. AutoAgent: No-code платформа для создания сложных LLM-агентов

Представлен no-code фреймворк AutoAgent, позволяющий создавать и настраивать LLM-агентов простыми командами на естественном языке. Платформа показала высокую точность и адаптивность при выполнении задач различной сложности, делая ИИ-технологии доступными широкой аудитории.

10. Суперинтеллектуальные агенты: Как избежать катастрофических рисков

Исследование предлагает концепцию Scientist AI - безопасной альтернативы традиционным агентным системам. Используя байесовский подход и отсутствие внутренней мотивации, Scientist AI снижает риск непредсказуемого и агрессивного поведения агентов, делая их работу более прозрачной и управляемой.

Читайте полную статью, чтобы узнать больше о передовых исследованиях в области ИИ и быть на шаг впереди в этом стремительно развивающемся мире технологий.

#исследования #анонс
🤖 Датаист
А вот и демо того, как мы учили беспилотники в симуляции. На видео показано, как несколько машинок учатся одновременно в Carla-симуляции. Вид сверху создан с помощью виртуальных лидаров, а реальный карт едет по трассе самостоятельно. #кейсы
Из симуляции в реальность: как мы обучили виртуальные гоночные карты ездить по настоящей трассе

Ура, на днях вышло наше исследование «Go-Kart Racing Simulator for Reinforcement Learning with Augmented Sim2Real Adaptation» в сборнике воркшопов престижной научной конференции ICDM 2024 (International Conference on Data Mining), которая проходила в Абу-Даби 9-12 декабря 2024 года.

Обучение беспилотников в реальных условиях сопряжено с высокими рисками аварий. Для минимизации этих рисков мы решили разработать виртуальную среду, в которой можно безопасно и эффективно обучать ИИ автономному вождению с подкреплением и применением дополненной реальности (AR).

В работе предложен фреймворк для интеграции виртуальной модели гоночного карта в CARLA-симулятор с помощью Gym-интерфейса, а также реализованы следующие технологии:

• Интеграция дополненной реальности (AR): В симулятор добавлен «вид с высоты птичьего полета», маркировка дорожного полотна, препятствий и других элементов трассы, а также виртуальный LiDAR для измерения расстояний до краев дороги;

• Адаптация симуляции к реальному миру: Для сокращения разрыва между симуляцией и реальностью (Sim2Real) использованы техники доменной адаптации и Curriculum Learning;

• Архитектура системы: Система построена на базе Docker-контейнеров, где каждый агент управляет своей копией симулятора, а собранные данные агрегируются для обучения с использованием алгоритма PPO (Proximal Policy Optimization).

В эксперименте показано, что переход от симуляции к реальности возможен без дополнительного обучения на реальных данных. Настоящий гоночный карт, ограниченный максимальной скоростью 11.5 м/с, успешно завершил шесть кругов по закрытой трассе, избегая аварийных ситуаций, при чем даже на незнакомых для него трассах!

Внедрение элементов дополненной реальности значительно улучшило качество восприятия окружающей среды по сравнению с обучением только на основе датчиков, что позволило агенту принимать более обоснованные решения.

Хотя разработка проводилась в контролируемой среде с фиксированной трассой, такой метод может не полностью отражать сложности открытого мира, а также возможны дополнительные сложности при масштабировании Sim2Real-перехода. На реальной трассе могут встречаться песок и мелкие камни, чего не было в симуляторе, а эти мелкие детали сильно влияют на езду на больших скоростях - машинку натурально начинает вилять.

Фреймворк полезен для обучения сложных беспилотных систем, позволяя ускорить разработку и тестирование алгоритмов, а использование дополненной реальности в этой задаче улучшает точность алгоритмов.

В исследовании принимали участие:

Илья Макаров (AIRI, ИТМО, ВШЭ) - признанный эксперт в области ИИ, PhD в компьютерных науках, лучший научный руководитель по версии Яндекс (2023), ex-BCG X, ex-VK, ex-Samsung, ex-Huawei. Илья крутой, мы работали с ним над несколькими проектами, если вам интересно, то могу взять у него интервью;

Андрей Савченко (Sber AI Lab, ВШЭ) - опытный научный руководитель, доктор технических наук, профессор в ВШЭ, ведущий научный сотрудник и автор более ста публикаций;

Ильдар Нургалиев (Dataism Lab) - ведущий ИИ-инженер в области агентов и обучения с подкреплением, занимался технической реализацией нашего решения. С Ильдаром мы реализовывали разные сложные проекты, в том числе с нуля запускали стартапы;

• Ну и я (Dataism Lab) - архитектор фреймворка, который мы в итоге выпустили в открытый доступ под названием Simularity.

Работать с такими профессионалами – настоящее удовольствие.

Лаборатория Датаизма (Dataism Lab) - это открытое сообщество исследователей и разработчиков в области прикладного ИИ.

Надеюсь наши разработки будут способствовать дальнейшему прогрессу в области беспилотных систем и использоваться на благо общества.

Ну а мы дальше продолжаем заниматься интересными исследованиями, так что ждите новых работ.

#исследования #анонс