Привет! Меня зовут Андрей, я технологический предприниматель в сфере искусственного интеллекта (ИИ).
Я обладаю обширными знаниями в области ИИ, а также богатым практическим опытом разработки ИИ-продуктов любой сложности и их вывода на международный рынок. Если вам нужно запустить ИИ-стартап с нуля или внедрить ИИ в процессы вашей компании, я готов помочь. В моей команде работают профессионалы, увлеченные решением сложных задач: от интеллектуального анализа данных до разработки цифровых двойников и обучения беспилотных автомобилей.
В этом блоге я делюсь своими кейсами, простыми словами объясняю сложные технологические аспекты работы ИИ-продуктов, комментирую актуальные новости индустрии, делюсь своим мнением и видением будущего технологий, а также даю практические советы по созданию успешных ИИ-стартапов.
Коротко обо мне:
• Выпускник Вышки;
• Ex-Data Engineer в Accenture;
• Ex-Chief Data Officer в Сбере;
• Ex-Chief Data Scientist в Сбере;
• Ex-Куратор национальных проектов в области ИИ;
• Ex-Chief Technology Officer в венчурной студии для ИИ-стартапов;
• Сооснователь и CTO в Pygma AI;
• Создаю ИИ-сотрудников для автоматизации рутины;
• Консультирую ИИ-стартапы и технологические компании.
История моего пути
О моей компании
Узнать больше о моей компании можно по ссылке
Мои проекты:
Pygma AI - ИИ-ассистент для соцсетей;
Dataist AI - ИИ-ассистент для исследователей;
Landao AI - ИИ-коуч по счастью.
#обо_мне - о моем пути;
#технологии - анализирую текущие тренды;
#кейсы - делюсь своим опытом;
#мысли - размышляю о технологиях;
#новости - только самое интересное;
#исследования- обзор статей об ИИ;
#анонс - анонсы о событиях и релизах.
Присоединяйтесь, будет интересно!
Я обладаю обширными знаниями в области ИИ, а также богатым практическим опытом разработки ИИ-продуктов любой сложности и их вывода на международный рынок. Если вам нужно запустить ИИ-стартап с нуля или внедрить ИИ в процессы вашей компании, я готов помочь. В моей команде работают профессионалы, увлеченные решением сложных задач: от интеллектуального анализа данных до разработки цифровых двойников и обучения беспилотных автомобилей.
В этом блоге я делюсь своими кейсами, простыми словами объясняю сложные технологические аспекты работы ИИ-продуктов, комментирую актуальные новости индустрии, делюсь своим мнением и видением будущего технологий, а также даю практические советы по созданию успешных ИИ-стартапов.
Коротко обо мне:
• Выпускник Вышки;
• Ex-Data Engineer в Accenture;
• Ex-Chief Data Officer в Сбере;
• Ex-Chief Data Scientist в Сбере;
• Ex-Куратор национальных проектов в области ИИ;
• Ex-Chief Technology Officer в венчурной студии для ИИ-стартапов;
• Сооснователь и CTO в Pygma AI;
• Создаю ИИ-сотрудников для автоматизации рутины;
• Консультирую ИИ-стартапы и технологические компании.
История моего пути
О моей компании
Узнать больше о моей компании можно по ссылке
Мои проекты:
Pygma AI - ИИ-ассистент для соцсетей;
Dataist AI - ИИ-ассистент для исследователей;
Landao AI - ИИ-коуч по счастью.
#обо_мне - о моем пути;
#технологии - анализирую текущие тренды;
#кейсы - делюсь своим опытом;
#мысли - размышляю о технологиях;
#новости - только самое интересное;
#исследования- обзор статей об ИИ;
#анонс - анонсы о событиях и релизах.
Присоединяйтесь, будет интересно!
Топ-10 исследований ИИ за январь 2025
Вышла моя новая статья на Хабре, где я сделал обзор десяти самых перспективных (на мой взгляд) исследований в ИИ за январь этого года. Вот краткий обзор каждого исследования:
1. DeepSeek R1
Китайская модель DeepSeek R1 демонстрирует, как с помощью обучения с подкреплением можно научить ИИ рассуждать, генерируя подробные цепочки мыслей. R1 успешно конкурируют с закрытыми аналогами на задачах математики, логики и программирования, а также требует меньше вычислений для обучения.
2. Cosmos World Foundation Model Platform for Physical AI
Cosmos WFM (модель мира) от Nvidia – платформа для «Физического ИИ», способная предсказывать следующие кадры видео и моделировать реальные физические процессы. Платформа позволяет обучать роботов и устройства с сенсорами без риска для реальных устройств.
3. GameFactory: Creating New Games with Generative Interactive Videos
GameFactory – фреймворк, который на основе диффузионных видеомоделей генерирует интерактивные игровые сцены. Специальный датасет из Minecraft и многоступенчатая стратегия обучения позволяют системе реагировать на действия пользователя, открывая новые горизонты в создании игр.
4. UI-TARS: Pioneering Automated GUI Interaction with Native Agents
ИИ-агент от разработчиков TikTok, который, используя только скриншоты, самостоятельно анализирует графические интерфейсы и принимает решения (клики, ввод текста и т.д.). Модель генерирует цепочки рассуждений перед каждым действием, демонстрируя рекордные результаты на различных задачах взаимодействия с пользовательским интерфейсом.
5. Multiagent Finetuning: Self Improvement with Diverse Reasoning Chains
Исследователи из Гарварда, Оксфорда, MIT и Google DeepMind предложили метод мультиагентного дообучения, при котором несколько агентов участвуют в «дебатах», чтобы выбрать финальное решение. Такой подход сохраняет разнообразие логических цепочек и значительно повышает точность при решении сложных задач.
6. Chain of Agents: Large language models collaborating on long-context tasks
Метод Chain-of-Agents от Google Cloud AI Research делит длинные тексты на фрагменты, каждый из которых обрабатывается отдельным агентом. Итоговый менеджер объединяет результаты, что позволяет улучшить суммаризацию и ответы на вопросы, хотя передается риск потери деталей при передаче информации между агентами.
7. Towards System 2 Reasoning in LLMs: Learning How to Think With Meta Chain-of-Thought
Исследователи из Стэнфорда и Беркли предлагают Meta Chain-of-Thought – метод, в котором модель не только генерирует пошаговые рассуждения, но и фиксирует историю перебора гипотез. Такой подход приближает мышление ИИ к «Системе 2», позволяя решать более сложные задачи с элементами самоанализа и коррекции.
8. Humanity’s Last Exam
Бенчмарк Humanity’s Last Exam – это комплексный тест из более чем 3000 вопросов уровня PhD по дисциплинам от математики до археологии. Он позволяет оценить истинный уровень знаний современных моделей и стимулирует дискуссии о безопасности и регулировании ИИ.
9. VideoRAG: Retrieval-Augmented Generation over Video Corpus
VideoRAG расширяет концепцию RAG, объединяя визуальные и текстовые данные для работы с видеоконтентом. Модель динамически находит релевантные видео из огромного корпуса и интегрирует их в ответ, что значительно повышает точность и детализацию результатов.
10. Agent Laboratory: Using LLM Agents as Research Assistants
Лаборатория ИИ-агентов автоматизирует весь цикл научного исследования – от обзора литературы до генерации отчетов. Система помогает ускорить рутинные процессы, оставляя за исследователем возможность контроля и корректировки итоговых результатов.
Читайте полную статью на Хабре, чтобы быть на шаг впереди в этом быстро меняющемся мире технологий.
#исследования #анонс
Вышла моя новая статья на Хабре, где я сделал обзор десяти самых перспективных (на мой взгляд) исследований в ИИ за январь этого года. Вот краткий обзор каждого исследования:
1. DeepSeek R1
Китайская модель DeepSeek R1 демонстрирует, как с помощью обучения с подкреплением можно научить ИИ рассуждать, генерируя подробные цепочки мыслей. R1 успешно конкурируют с закрытыми аналогами на задачах математики, логики и программирования, а также требует меньше вычислений для обучения.
2. Cosmos World Foundation Model Platform for Physical AI
Cosmos WFM (модель мира) от Nvidia – платформа для «Физического ИИ», способная предсказывать следующие кадры видео и моделировать реальные физические процессы. Платформа позволяет обучать роботов и устройства с сенсорами без риска для реальных устройств.
3. GameFactory: Creating New Games with Generative Interactive Videos
GameFactory – фреймворк, который на основе диффузионных видеомоделей генерирует интерактивные игровые сцены. Специальный датасет из Minecraft и многоступенчатая стратегия обучения позволяют системе реагировать на действия пользователя, открывая новые горизонты в создании игр.
4. UI-TARS: Pioneering Automated GUI Interaction with Native Agents
ИИ-агент от разработчиков TikTok, который, используя только скриншоты, самостоятельно анализирует графические интерфейсы и принимает решения (клики, ввод текста и т.д.). Модель генерирует цепочки рассуждений перед каждым действием, демонстрируя рекордные результаты на различных задачах взаимодействия с пользовательским интерфейсом.
5. Multiagent Finetuning: Self Improvement with Diverse Reasoning Chains
Исследователи из Гарварда, Оксфорда, MIT и Google DeepMind предложили метод мультиагентного дообучения, при котором несколько агентов участвуют в «дебатах», чтобы выбрать финальное решение. Такой подход сохраняет разнообразие логических цепочек и значительно повышает точность при решении сложных задач.
6. Chain of Agents: Large language models collaborating on long-context tasks
Метод Chain-of-Agents от Google Cloud AI Research делит длинные тексты на фрагменты, каждый из которых обрабатывается отдельным агентом. Итоговый менеджер объединяет результаты, что позволяет улучшить суммаризацию и ответы на вопросы, хотя передается риск потери деталей при передаче информации между агентами.
7. Towards System 2 Reasoning in LLMs: Learning How to Think With Meta Chain-of-Thought
Исследователи из Стэнфорда и Беркли предлагают Meta Chain-of-Thought – метод, в котором модель не только генерирует пошаговые рассуждения, но и фиксирует историю перебора гипотез. Такой подход приближает мышление ИИ к «Системе 2», позволяя решать более сложные задачи с элементами самоанализа и коррекции.
8. Humanity’s Last Exam
Бенчмарк Humanity’s Last Exam – это комплексный тест из более чем 3000 вопросов уровня PhD по дисциплинам от математики до археологии. Он позволяет оценить истинный уровень знаний современных моделей и стимулирует дискуссии о безопасности и регулировании ИИ.
9. VideoRAG: Retrieval-Augmented Generation over Video Corpus
VideoRAG расширяет концепцию RAG, объединяя визуальные и текстовые данные для работы с видеоконтентом. Модель динамически находит релевантные видео из огромного корпуса и интегрирует их в ответ, что значительно повышает точность и детализацию результатов.
10. Agent Laboratory: Using LLM Agents as Research Assistants
Лаборатория ИИ-агентов автоматизирует весь цикл научного исследования – от обзора литературы до генерации отчетов. Система помогает ускорить рутинные процессы, оставляя за исследователем возможность контроля и корректировки итоговых результатов.
Читайте полную статью на Хабре, чтобы быть на шаг впереди в этом быстро меняющемся мире технологий.
#исследования #анонс
Хабр
Как DeepSeek-R1 научилась мыслить и «последний экзамен человечества»: топ-10 исследований ИИ за январь 2025
Привет, Хабр! Я - Андрей, технологический предприниматель и консультант по ИИ. Январь вновь оказался насыщенным месяцем на прорывные исследования в сфере искусственного интеллекта (ИИ). В этой статье...
Как ИИ научился читать мысли и чем опасны суперинтеллектуальные агенты: топ-10 исследований ИИ за февраль 2025
Вышла моя новая статья на Хабре, где я сделал обзор десяти самых интересных исследований в области ИИ за февраль этого года (простым языком и с мемами).
1. Системная карточка OpenAI o3-mini
Новая модель o3-mini значительно приблизилась к уровню общего искусственного интеллекта (AGI). С использованием технологии цепочек рассуждений модель демонстрирует впечатляющие результаты в математике, программировании и устойчивости к небезопасному контенту, превосходя предыдущие версии по точности и скорости.
2. Эмерджентное планирование ответов в LLM
Исследование Шанхайской ИИ-лаборатории выявило, что большие языковые модели заранее планируют характеристики своих ответов, используя скрытые слои. С помощью более простых нейросетей ученые научились предсказывать длину, стиль и уверенность ответа модели до начала генерации текста.
3. ReLearn: Эффективное забывание информации в LLM
Предложен инновационный подход к удалению нежелательной информации из больших языковых моделей. Используя позитивную оптимизацию, ReLearn позволяет эффективно забывать чувствительные данные без потери полезных знаний и связности текстов.
4. AI co-scientist от Google Research
Разработана мультиагентная платформа в качестве ИИ-помощника для ученого, которая автоматизирует создание и проверку научных гипотез. Система успешно генерирует и проверяет гипотезы в биомедицине, значительно ускоряя научный процесс.
5. Brain2Qwerty: Неинвазивное декодирование текста из мозговой активности
Создана нейросеть Brain2Qwerty, которая с высокой точностью декодирует набираемый текст по мозговой активности с помощью магнитной энцефалографии (МЭГ). Модель успешно распознаёт текст с точностью до 81%, открывая новые перспективы для создания безопасных интерфейсов «мозг-компьютер».
6. LLaDA: Большие языковые диффузионные модели
Разработана диффузионная модель LLaDA, которая генерирует текст параллельно, а не последовательно. Это ускоряет процесс генерации и повышает качество на сложных задачах. Модель превосходит GPT-4 в задачах, требующих сложных рассуждений.
7. SWE-Lancer: Может ли ИИ заработать миллион на фрилансе?
Исследование показало реальную эффективность языковых моделей в решении задач разработки ПО на платформе Upwork. Модель Claude 3.5 Sonnet успешно решила задачи на $403 тыс. из потенциального $1 млн, подчеркнув как потенциал, так и текущие ограничения ИИ в фрилансе.
8. TwinMarket: Реалистичная симуляция финансовых рынков с помощью ИИ
Создана платформа TwinMarket, использующая большие языковые модели для реалистичной симуляции финансовых рынков. Модель воспроизводит сложные рыночные явления, включая финансовые пузыри и коллективное поведение инвесторов для изучения и управления рисками.
9. AutoAgent: No-code платформа для создания сложных LLM-агентов
Представлен no-code фреймворк AutoAgent, позволяющий создавать и настраивать LLM-агентов простыми командами на естественном языке. Платформа показала высокую точность и адаптивность при выполнении задач различной сложности, делая ИИ-технологии доступными широкой аудитории.
10. Суперинтеллектуальные агенты: Как избежать катастрофических рисков
Исследование предлагает концепцию Scientist AI - безопасной альтернативы традиционным агентным системам. Используя байесовский подход и отсутствие внутренней мотивации, Scientist AI снижает риск непредсказуемого и агрессивного поведения агентов, делая их работу более прозрачной и управляемой.
Читайте полную статью, чтобы узнать больше о передовых исследованиях в области ИИ и быть на шаг впереди в этом стремительно развивающемся мире технологий.
#исследования #анонс
Вышла моя новая статья на Хабре, где я сделал обзор десяти самых интересных исследований в области ИИ за февраль этого года (простым языком и с мемами).
1. Системная карточка OpenAI o3-mini
Новая модель o3-mini значительно приблизилась к уровню общего искусственного интеллекта (AGI). С использованием технологии цепочек рассуждений модель демонстрирует впечатляющие результаты в математике, программировании и устойчивости к небезопасному контенту, превосходя предыдущие версии по точности и скорости.
2. Эмерджентное планирование ответов в LLM
Исследование Шанхайской ИИ-лаборатории выявило, что большие языковые модели заранее планируют характеристики своих ответов, используя скрытые слои. С помощью более простых нейросетей ученые научились предсказывать длину, стиль и уверенность ответа модели до начала генерации текста.
3. ReLearn: Эффективное забывание информации в LLM
Предложен инновационный подход к удалению нежелательной информации из больших языковых моделей. Используя позитивную оптимизацию, ReLearn позволяет эффективно забывать чувствительные данные без потери полезных знаний и связности текстов.
4. AI co-scientist от Google Research
Разработана мультиагентная платформа в качестве ИИ-помощника для ученого, которая автоматизирует создание и проверку научных гипотез. Система успешно генерирует и проверяет гипотезы в биомедицине, значительно ускоряя научный процесс.
5. Brain2Qwerty: Неинвазивное декодирование текста из мозговой активности
Создана нейросеть Brain2Qwerty, которая с высокой точностью декодирует набираемый текст по мозговой активности с помощью магнитной энцефалографии (МЭГ). Модель успешно распознаёт текст с точностью до 81%, открывая новые перспективы для создания безопасных интерфейсов «мозг-компьютер».
6. LLaDA: Большие языковые диффузионные модели
Разработана диффузионная модель LLaDA, которая генерирует текст параллельно, а не последовательно. Это ускоряет процесс генерации и повышает качество на сложных задачах. Модель превосходит GPT-4 в задачах, требующих сложных рассуждений.
7. SWE-Lancer: Может ли ИИ заработать миллион на фрилансе?
Исследование показало реальную эффективность языковых моделей в решении задач разработки ПО на платформе Upwork. Модель Claude 3.5 Sonnet успешно решила задачи на $403 тыс. из потенциального $1 млн, подчеркнув как потенциал, так и текущие ограничения ИИ в фрилансе.
8. TwinMarket: Реалистичная симуляция финансовых рынков с помощью ИИ
Создана платформа TwinMarket, использующая большие языковые модели для реалистичной симуляции финансовых рынков. Модель воспроизводит сложные рыночные явления, включая финансовые пузыри и коллективное поведение инвесторов для изучения и управления рисками.
9. AutoAgent: No-code платформа для создания сложных LLM-агентов
Представлен no-code фреймворк AutoAgent, позволяющий создавать и настраивать LLM-агентов простыми командами на естественном языке. Платформа показала высокую точность и адаптивность при выполнении задач различной сложности, делая ИИ-технологии доступными широкой аудитории.
10. Суперинтеллектуальные агенты: Как избежать катастрофических рисков
Исследование предлагает концепцию Scientist AI - безопасной альтернативы традиционным агентным системам. Используя байесовский подход и отсутствие внутренней мотивации, Scientist AI снижает риск непредсказуемого и агрессивного поведения агентов, делая их работу более прозрачной и управляемой.
Читайте полную статью, чтобы узнать больше о передовых исследованиях в области ИИ и быть на шаг впереди в этом стремительно развивающемся мире технологий.
#исследования #анонс
Хабр
Как ИИ научился читать мысли и чем опасны суперинтеллектуальные агенты: топ-10 исследований ИИ за февраль 2025
Привет, Хабр! Я — Андрей, технологический предприниматель и консультант по ИИ. Февраль продолжает радовать нас выдающимися исследованиями в области искусственного интеллекта. В этой статье я собрал...
🤖 Датаист
А вот и демо того, как мы учили беспилотники в симуляции. На видео показано, как несколько машинок учатся одновременно в Carla-симуляции. Вид сверху создан с помощью виртуальных лидаров, а реальный карт едет по трассе самостоятельно. #кейсы
Из симуляции в реальность: как мы обучили виртуальные гоночные карты ездить по настоящей трассе
Ура, на днях вышло наше исследование «Go-Kart Racing Simulator for Reinforcement Learning with Augmented Sim2Real Adaptation» в сборнике воркшопов престижной научной конференции ICDM 2024 (International Conference on Data Mining, A*), которая проходила в Абу-Даби 9-12 декабря 2024 года.
Обучение беспилотников в реальных условиях сопряжено с высокими рисками аварий. Для минимизации этих рисков мы решили разработать виртуальную среду, в которой можно безопасно и эффективно обучать ИИ автономному вождению с подкреплением и применением дополненной реальности (AR).
В работе предложен фреймворк для интеграции виртуальной модели гоночного карта в CARLA-симулятор с помощью Gym-интерфейса, а также реализованы следующие технологии:
• Интеграция дополненной реальности (AR): В симулятор добавлен «вид с высоты птичьего полета», маркировка дорожного полотна, препятствий и других элементов трассы, а также виртуальный LiDAR для измерения расстояний до краев дороги;
• Адаптация симуляции к реальному миру: Для сокращения разрыва между симуляцией и реальностью (Sim2Real) использованы техники доменной адаптации и Curriculum Learning;
• Архитектура системы: Система построена на базе Docker-контейнеров, где каждый агент управляет своей копией симулятора, а собранные данные агрегируются для обучения с использованием алгоритма PPO (Proximal Policy Optimization).
В эксперименте показано, что переход от симуляции к реальности возможен без дополнительного обучения на реальных данных. Настоящий гоночный карт, ограниченный максимальной скоростью 11.5 м/с, успешно завершил шесть кругов по закрытой трассе, избегая аварийных ситуаций, при чем даже на незнакомых для него трассах!
Внедрение элементов дополненной реальности значительно улучшило качество восприятия окружающей среды по сравнению с обучением только на основе датчиков, что позволило агенту принимать более обоснованные решения.
Хотя разработка проводилась в контролируемой среде с заданной трассой, такой метод может не полностью отражать сложности открытого мира, а также возможны дополнительные сложности при масштабировании Sim2Real-перехода. На реальной трассе могут встречаться песок и мелкие камни, чего не было в симуляторе, а эти мелкие детали сильно влияют на езду на больших скоростях - машинку натурально начинает вилять.
Фреймворк полезен для обучения сложных беспилотных систем, позволяя ускорить разработку и тестирование алгоритмов, а использование дополненной реальности в этой задаче улучшает точность алгоритмов.
В исследовании принимали участие:
• Илья Макаров (AIRI, ИТМО, ВШЭ) - признанный эксперт в области ИИ, PhD в компьютерных науках, лучший научный руководитель по версии Яндекс (2023), ex-BCG X, ex-VK, ex-Samsung, ex-Huawei. Илья крутой, мы работали с ним над несколькими проектами, если вам интересно, то могу взять у него интервью;
• Андрей Савченко (Sber AI Lab, ВШЭ) - опытный научный руководитель, доктор технических наук, профессор в ВШЭ, ведущий научный сотрудник и автор более ста публикаций;
• Ильдар Нургалиев (Dataism Lab) - ведущий ИИ-инженер в области агентов и обучения с подкреплением, занимался технической реализацией нашего решения. С Ильдаром мы реализовывали разные сложные проекты, в том числе с нуля запускали стартапы;
• Ну и я (Dataism Lab) - архитектор фреймворка, который мы в итоге выпустили в открытый доступ под названием Simularity.
Работать с такими профессионалами – настоящее удовольствие.
Лаборатория Датаизма (Dataism Lab) - это открытое сообщество исследователей и разработчиков в области прикладного ИИ.
Надеюсь наши разработки будут способствовать дальнейшему прогрессу в области беспилотных систем и использоваться на благо общества.
Ну а мы дальше продолжаем заниматься интересными исследованиями, так что ждите новых работ.
#исследования #анонс
Ура, на днях вышло наше исследование «Go-Kart Racing Simulator for Reinforcement Learning with Augmented Sim2Real Adaptation» в сборнике воркшопов престижной научной конференции ICDM 2024 (International Conference on Data Mining, A*), которая проходила в Абу-Даби 9-12 декабря 2024 года.
Обучение беспилотников в реальных условиях сопряжено с высокими рисками аварий. Для минимизации этих рисков мы решили разработать виртуальную среду, в которой можно безопасно и эффективно обучать ИИ автономному вождению с подкреплением и применением дополненной реальности (AR).
В работе предложен фреймворк для интеграции виртуальной модели гоночного карта в CARLA-симулятор с помощью Gym-интерфейса, а также реализованы следующие технологии:
• Интеграция дополненной реальности (AR): В симулятор добавлен «вид с высоты птичьего полета», маркировка дорожного полотна, препятствий и других элементов трассы, а также виртуальный LiDAR для измерения расстояний до краев дороги;
• Адаптация симуляции к реальному миру: Для сокращения разрыва между симуляцией и реальностью (Sim2Real) использованы техники доменной адаптации и Curriculum Learning;
• Архитектура системы: Система построена на базе Docker-контейнеров, где каждый агент управляет своей копией симулятора, а собранные данные агрегируются для обучения с использованием алгоритма PPO (Proximal Policy Optimization).
В эксперименте показано, что переход от симуляции к реальности возможен без дополнительного обучения на реальных данных. Настоящий гоночный карт, ограниченный максимальной скоростью 11.5 м/с, успешно завершил шесть кругов по закрытой трассе, избегая аварийных ситуаций, при чем даже на незнакомых для него трассах!
Внедрение элементов дополненной реальности значительно улучшило качество восприятия окружающей среды по сравнению с обучением только на основе датчиков, что позволило агенту принимать более обоснованные решения.
Хотя разработка проводилась в контролируемой среде с заданной трассой, такой метод может не полностью отражать сложности открытого мира, а также возможны дополнительные сложности при масштабировании Sim2Real-перехода. На реальной трассе могут встречаться песок и мелкие камни, чего не было в симуляторе, а эти мелкие детали сильно влияют на езду на больших скоростях - машинку натурально начинает вилять.
Фреймворк полезен для обучения сложных беспилотных систем, позволяя ускорить разработку и тестирование алгоритмов, а использование дополненной реальности в этой задаче улучшает точность алгоритмов.
В исследовании принимали участие:
• Илья Макаров (AIRI, ИТМО, ВШЭ) - признанный эксперт в области ИИ, PhD в компьютерных науках, лучший научный руководитель по версии Яндекс (2023), ex-BCG X, ex-VK, ex-Samsung, ex-Huawei. Илья крутой, мы работали с ним над несколькими проектами, если вам интересно, то могу взять у него интервью;
• Андрей Савченко (Sber AI Lab, ВШЭ) - опытный научный руководитель, доктор технических наук, профессор в ВШЭ, ведущий научный сотрудник и автор более ста публикаций;
• Ильдар Нургалиев (Dataism Lab) - ведущий ИИ-инженер в области агентов и обучения с подкреплением, занимался технической реализацией нашего решения. С Ильдаром мы реализовывали разные сложные проекты, в том числе с нуля запускали стартапы;
• Ну и я (Dataism Lab) - архитектор фреймворка, который мы в итоге выпустили в открытый доступ под названием Simularity.
Работать с такими профессионалами – настоящее удовольствие.
Лаборатория Датаизма (Dataism Lab) - это открытое сообщество исследователей и разработчиков в области прикладного ИИ.
Надеюсь наши разработки будут способствовать дальнейшему прогрессу в области беспилотных систем и использоваться на благо общества.
Ну а мы дальше продолжаем заниматься интересными исследованиями, так что ждите новых работ.
#исследования #анонс
GitHub
GitHub - dataism-lab/simularity: Learning Self-driving Cars in Simulation
Learning Self-driving Cars in Simulation. Contribute to dataism-lab/simularity development by creating an account on GitHub.