🤖 Датаист

Привет! Меня зовут Андрей, я технологический предприниматель в сфере искусственного интеллекта (ИИ).

Я обладаю обширными знаниями в области ИИ, а также богатым практическим опытом разработки ИИ-продуктов любой сложности и их вывода на международный рынок. Если вам нужно запустить ИИ-стартап с нуля или внедрить ИИ в процессы вашей компании, я готов помочь. В моей команде работают профессионалы, увлеченные решением сложных задач: от интеллектуального анализа данных до разработки цифровых двойников и обучения беспилотных автомобилей.

В этом блоге я делюсь своими кейсами, простыми словами объясняю сложные технологические аспекты работы ИИ-продуктов, комментирую актуальные новости индустрии, делюсь своим мнением и видением будущего технологий, а также даю практические советы по созданию успешных ИИ-стартапов.

Коротко обо мне:

• Выпускник Вышки;
• Ex-Data Engineer в Accenture;
• Ex-Chief Data Officer в Сбере;
• Ex-Chief Data Scientist в Сбере;
• Ex-Куратор национальных проектов в области ИИ;
• Ex-Chief Technology Officer в венчурной студии для ИИ-стартапов;
• Сооснователь и CTO в Pygma AI;
• Создаю ИИ-сотрудников для автоматизации рутины;
• Консультирую ИИ-стартапы и технологические компании.

История моего пути
О моей компании

Узнать больше о моей компании можно по ссылке

Мои проекты:
Pygma AI - ИИ-ассистент для соцсетей;
Dataist AI - ИИ-ассистент для исследователей;
Landao AI - ИИ-коуч по счастью.

#обо_мне - о моем пути;
#технологии - анализирую текущие тренды;
#кейсы - делюсь своим опытом;
#мысли - размышляю о технологиях;
#новости - только самое интересное;
#исследования- обзор статей об ИИ;
#анонс - анонсы о событиях и релизах.

Присоединяйтесь, будет интересно!

1.5K viewsedited 13:42

🤖 Датаист

Топ-10 исследований ИИ за январь 2025

Вышла моя новая статья на Хабре, где я сделал обзор десяти самых перспективных (на мой взгляд) исследований в ИИ за январь этого года. Вот краткий обзор каждого исследования:

1. DeepSeek R1

Китайская модель DeepSeek R1 демонстрирует, как с помощью обучения с подкреплением можно научить ИИ рассуждать, генерируя подробные цепочки мыслей. R1 успешно конкурируют с закрытыми аналогами на задачах математики, логики и программирования, а также требует меньше вычислений для обучения.

2. Cosmos World Foundation Model Platform for Physical AI

Cosmos WFM (модель мира) от Nvidia – платформа для «Физического ИИ», способная предсказывать следующие кадры видео и моделировать реальные физические процессы. Платформа позволяет обучать роботов и устройства с сенсорами без риска для реальных устройств.

3. GameFactory: Creating New Games with Generative Interactive Videos

GameFactory – фреймворк, который на основе диффузионных видеомоделей генерирует интерактивные игровые сцены. Специальный датасет из Minecraft и многоступенчатая стратегия обучения позволяют системе реагировать на действия пользователя, открывая новые горизонты в создании игр.

4. UI-TARS: Pioneering Automated GUI Interaction with Native Agents

ИИ-агент от разработчиков TikTok, который, используя только скриншоты, самостоятельно анализирует графические интерфейсы и принимает решения (клики, ввод текста и т.д.). Модель генерирует цепочки рассуждений перед каждым действием, демонстрируя рекордные результаты на различных задачах взаимодействия с пользовательским интерфейсом.

5. Multiagent Finetuning: Self Improvement with Diverse Reasoning Chains

Исследователи из Гарварда, Оксфорда, MIT и Google DeepMind предложили метод мультиагентного дообучения, при котором несколько агентов участвуют в «дебатах», чтобы выбрать финальное решение. Такой подход сохраняет разнообразие логических цепочек и значительно повышает точность при решении сложных задач.

6. Chain of Agents: Large language models collaborating on long-context tasks

Метод Chain-of-Agents от Google Cloud AI Research делит длинные тексты на фрагменты, каждый из которых обрабатывается отдельным агентом. Итоговый менеджер объединяет результаты, что позволяет улучшить суммаризацию и ответы на вопросы, хотя передается риск потери деталей при передаче информации между агентами.

7. Towards System 2 Reasoning in LLMs: Learning How to Think With Meta Chain-of-Thought

Исследователи из Стэнфорда и Беркли предлагают Meta Chain-of-Thought – метод, в котором модель не только генерирует пошаговые рассуждения, но и фиксирует историю перебора гипотез. Такой подход приближает мышление ИИ к «Системе 2», позволяя решать более сложные задачи с элементами самоанализа и коррекции.

8. Humanity’s Last Exam

Бенчмарк Humanity’s Last Exam – это комплексный тест из более чем 3000 вопросов уровня PhD по дисциплинам от математики до археологии. Он позволяет оценить истинный уровень знаний современных моделей и стимулирует дискуссии о безопасности и регулировании ИИ.

9. VideoRAG: Retrieval-Augmented Generation over Video Corpus

VideoRAG расширяет концепцию RAG, объединяя визуальные и текстовые данные для работы с видеоконтентом. Модель динамически находит релевантные видео из огромного корпуса и интегрирует их в ответ, что значительно повышает точность и детализацию результатов.

10. Agent Laboratory: Using LLM Agents as Research Assistants

Лаборатория ИИ-агентов автоматизирует весь цикл научного исследования – от обзора литературы до генерации отчетов. Система помогает ускорить рутинные процессы, оставляя за исследователем возможность контроля и корректировки итоговых результатов.

Читайте полную статью на Хабре, чтобы быть на шаг впереди в этом быстро меняющемся мире технологий.

#исследования #анонс

Хабр

Как DeepSeek-R1 научилась мыслить и «последний экзамен человечества»: топ-10 исследований ИИ за январь 2025

Привет, Хабр! Я - Андрей, технологический предприниматель и консультант по ИИ. Январь вновь оказался насыщенным месяцем на прорывные исследования в сфере искусственного интеллекта (ИИ). В этой статье...

2.5K viewsedited 18:01

🤖 Датаист

Please open Telegram to view this post

VIEW IN TELEGRAM

1.8K viewsedited 10:59

🤖 Датаист

Как ИИ научился читать мысли и чем опасны суперинтеллектуальные агенты: топ-10 исследований ИИ за февраль 2025

Вышла моя новая статья на Хабре, где я сделал обзор десяти самых интересных исследований в области ИИ за февраль этого года (простым языком и с мемами).

1. Системная карточка OpenAI o3-mini

Новая модель o3-mini значительно приблизилась к уровню общего искусственного интеллекта (AGI). С использованием технологии цепочек рассуждений модель демонстрирует впечатляющие результаты в математике, программировании и устойчивости к небезопасному контенту, превосходя предыдущие версии по точности и скорости.

2. Эмерджентное планирование ответов в LLM

Исследование Шанхайской ИИ-лаборатории выявило, что большие языковые модели заранее планируют характеристики своих ответов, используя скрытые слои. С помощью более простых нейросетей ученые научились предсказывать длину, стиль и уверенность ответа модели до начала генерации текста.

3. ReLearn: Эффективное забывание информации в LLM

Предложен инновационный подход к удалению нежелательной информации из больших языковых моделей. Используя позитивную оптимизацию, ReLearn позволяет эффективно забывать чувствительные данные без потери полезных знаний и связности текстов.

4. AI co-scientist от Google Research

Разработана мультиагентная платформа в качестве ИИ-помощника для ученого, которая автоматизирует создание и проверку научных гипотез. Система успешно генерирует и проверяет гипотезы в биомедицине, значительно ускоряя научный процесс.

5. Brain2Qwerty: Неинвазивное декодирование текста из мозговой активности

Создана нейросеть Brain2Qwerty, которая с высокой точностью декодирует набираемый текст по мозговой активности с помощью магнитной энцефалографии (МЭГ). Модель успешно распознаёт текст с точностью до 81%, открывая новые перспективы для создания безопасных интерфейсов «мозг-компьютер».

6. LLaDA: Большие языковые диффузионные модели

Разработана диффузионная модель LLaDA, которая генерирует текст параллельно, а не последовательно. Это ускоряет процесс генерации и повышает качество на сложных задачах. Модель превосходит GPT-4 в задачах, требующих сложных рассуждений.

7. SWE-Lancer: Может ли ИИ заработать миллион на фрилансе?

Исследование показало реальную эффективность языковых моделей в решении задач разработки ПО на платформе Upwork. Модель Claude 3.5 Sonnet успешно решила задачи на $403 тыс. из потенциального $1 млн, подчеркнув как потенциал, так и текущие ограничения ИИ в фрилансе.

8. TwinMarket: Реалистичная симуляция финансовых рынков с помощью ИИ

Создана платформа TwinMarket, использующая большие языковые модели для реалистичной симуляции финансовых рынков. Модель воспроизводит сложные рыночные явления, включая финансовые пузыри и коллективное поведение инвесторов для изучения и управления рисками.

9. AutoAgent: No-code платформа для создания сложных LLM-агентов

Представлен no-code фреймворк AutoAgent, позволяющий создавать и настраивать LLM-агентов простыми командами на естественном языке. Платформа показала высокую точность и адаптивность при выполнении задач различной сложности, делая ИИ-технологии доступными широкой аудитории.

10. Суперинтеллектуальные агенты: Как избежать катастрофических рисков

Исследование предлагает концепцию Scientist AI - безопасной альтернативы традиционным агентным системам. Используя байесовский подход и отсутствие внутренней мотивации, Scientist AI снижает риск непредсказуемого и агрессивного поведения агентов, делая их работу более прозрачной и управляемой.

Читайте полную статью, чтобы узнать больше о передовых исследованиях в области ИИ и быть на шаг впереди в этом стремительно развивающемся мире технологий.

#исследования #анонс

Хабр

Как ИИ научился читать мысли и чем опасны суперинтеллектуальные агенты: топ-10 исследований ИИ за февраль 2025

Привет, Хабр! Я — Андрей, технологический предприниматель и консультант по ИИ. Февраль продолжает радовать нас выдающимися исследованиями в области искусственного интеллекта. В этой статье я собрал...

1.4K viewsedited 09:04

🤖 Датаист

А вот и демо того, как мы учили беспилотники в симуляции. На видео показано, как несколько машинок учатся одновременно в Carla-симуляции. Вид сверху создан с помощью виртуальных лидаров, а реальный карт едет по трассе самостоятельно. #кейсы

Из симуляции в реальность: как мы обучили виртуальные гоночные карты ездить по настоящей трассе

Ура, на днях вышло наше исследование «Go-Kart Racing Simulator for Reinforcement Learning with Augmented Sim2Real Adaptation» в сборнике воркшопов престижной научной конференции ICDM 2024 (International Conference on Data Mining, A*), которая проходила в Абу-Даби 9-12 декабря 2024 года.

Обучение беспилотников в реальных условиях сопряжено с высокими рисками аварий. Для минимизации этих рисков мы решили разработать виртуальную среду, в которой можно безопасно и эффективно обучать ИИ автономному вождению с подкреплением и применением дополненной реальности (AR).

В работе предложен фреймворк для интеграции виртуальной модели гоночного карта в CARLA-симулятор с помощью Gym-интерфейса, а также реализованы следующие технологии:

• Интеграция дополненной реальности (AR): В симулятор добавлен «вид с высоты птичьего полета», маркировка дорожного полотна, препятствий и других элементов трассы, а также виртуальный LiDAR для измерения расстояний до краев дороги;

• Адаптация симуляции к реальному миру: Для сокращения разрыва между симуляцией и реальностью (Sim2Real) использованы техники доменной адаптации и Curriculum Learning;

• Архитектура системы: Система построена на базе Docker-контейнеров, где каждый агент управляет своей копией симулятора, а собранные данные агрегируются для обучения с использованием алгоритма PPO (Proximal Policy Optimization).

В эксперименте показано, что переход от симуляции к реальности возможен без дополнительного обучения на реальных данных. Настоящий гоночный карт, ограниченный максимальной скоростью 11.5 м/с, успешно завершил шесть кругов по закрытой трассе, избегая аварийных ситуаций, при чем даже на незнакомых для него трассах!

Внедрение элементов дополненной реальности значительно улучшило качество восприятия окружающей среды по сравнению с обучением только на основе датчиков, что позволило агенту принимать более обоснованные решения.

Хотя разработка проводилась в контролируемой среде с заданной трассой, такой метод может не полностью отражать сложности открытого мира, а также возможны дополнительные сложности при масштабировании Sim2Real-перехода. На реальной трассе могут встречаться песок и мелкие камни, чего не было в симуляторе, а эти мелкие детали сильно влияют на езду на больших скоростях - машинку натурально начинает вилять.

Фреймворк полезен для обучения сложных беспилотных систем, позволяя ускорить разработку и тестирование алгоритмов, а использование дополненной реальности в этой задаче улучшает точность алгоритмов.

В исследовании принимали участие:

• Илья Макаров (AIRI, ИТМО, ВШЭ) - признанный эксперт в области ИИ, PhD в компьютерных науках, лучший научный руководитель по версии Яндекс (2023), ex-BCG X, ex-VK, ex-Samsung, ex-Huawei. Илья крутой, мы работали с ним над несколькими проектами, если вам интересно, то могу взять у него интервью;

• Андрей Савченко (Sber AI Lab, ВШЭ) - опытный научный руководитель, доктор технических наук, профессор в ВШЭ, ведущий научный сотрудник и автор более ста публикаций;

• Ильдар Нургалиев (Dataism Lab) - ведущий ИИ-инженер в области агентов и обучения с подкреплением, занимался технической реализацией нашего решения. С Ильдаром мы реализовывали разные сложные проекты, в том числе с нуля запускали стартапы;

• Ну и я (Dataism Lab) - архитектор фреймворка, который мы в итоге выпустили в открытый доступ под названием Simularity.

Работать с такими профессионалами – настоящее удовольствие.

Лаборатория Датаизма (Dataism Lab) - это открытое сообщество исследователей и разработчиков в области прикладного ИИ.

Надеюсь наши разработки будут способствовать дальнейшему прогрессу в области беспилотных систем и использоваться на благо общества.

Ну а мы дальше продолжаем заниматься интересными исследованиями, так что ждите новых работ.

#исследования #анонс

GitHub

GitHub - dataism-lab/simularity: Learning Self-driving Cars in Simulation

Learning Self-driving Cars in Simulation. Contribute to dataism-lab/simularity development by creating an account on GitHub.

436 viewsedited 15:55

About

Blog

Apps

Platform