Как мы обучали беспилотные машины в симуляции
Однажды на конференции CES 2022 был представлен беспилотный гоночный болид «Формулы-1», управляемый ИИ. Стейкхолдеры нашей венчурной студии решили сделать нечто подобное, но для начала используя менее дорогие машинки.
Итак, в роли технического директора венчурной студии я участвовал в проекте по созданию гоночной игры c машинками для картинга в смешанной реальности.
Идея заключалась в том, чтобы игрок мог, сидя у себя дома в любой точке мира, управлять настоящими гоночными картами и соревноваться с другими игроками и ИИ. Задача состояла в том, чтобы разработать ИИ-автопилот для машинок, адаптируя его в систему для устранения задержек при передаче данных.
Пока одни инженеры обвешивали машинки лидарами, радарами, GNSS (Global Navigation Satellite System), камерами и датчиками для измерения скорости, температуры двигателя и т.п., а другие инженеры строили трассу для игры, ИИ-инженеры решили не терять время и начали обучать беспилотники в симуляции без использования настоящих машинок и готовой трассы.
Обычно беспилотники обучают на реальных данных с использованием синтетических, имитируя различные погодные условия, время суток, типы поверхностей и уровни освещенности. В таком случае датасет для обучения получается больше и разнообразнее. Мы же решили попробовать обучить машинки используя только синтетические данные.
Сначала мы разработали базовый пайплайн обучения с подкреплением (RL) и научились решать задачу Reward Shaping на соревнованиях AWS DeepRacer (кстати, вошли в топ-4% мирового рейтинга), чтобы понимать, какую функцию вознаграждения использовать для бейзлайна. В итоге мы наказывали машинку за врезания в края трассы и поощряли за быстрое прохождение круга.
Далее мы начали изучать среды симуляции: Carla, LG SVL, Gazebo и даже рассматривали обучение в GTA 5. В результате анализа мы выбрали Carla, так как эта среда поддерживает различные сенсоры, собственные карты и хорошо интегрируется с ROS (Robot Operating System).
В среду симуляции мы встроили интерфейс OpenAI Gym для обучения с подкреплением, поместили модель настоящего гоночного карта, модель трассы и создали для него виртуальные лидары. Виртуальные лидары позволили создать для беспилотника дополненную реальность «вида сверху» (bird’s-eye-view) для более точного обучения. Мы организовали систему хранения данных из различных сенсоров и настроили необходимые ML-пайплайны.
Также мы использовали техники curriculum learning, постепенно обучая машинку сначала не врезаться в края трассы, потом избегать врезаний в другие машинки и следом учиться обгонять машинки. В результате мы получили систему для асинхронного обучения нескольких агентов в симуляции. Мы обучили около сотни агентов на одной трассе за 5 часов, выбрали лучшую модель и встроили ее в реальный карт.
Мы наблюдали, как настоящая машинка для картинга, обученная только в симуляции, поехала по реальной трассе. Беспилотник резво входил даже в крутые повороты на скорости до 40 км/ч. Также мы попробовали запустить машинку на других трассах — сработало! Модель хорошо управляла картом даже на незнакомых трассах.
К сожалению, при скорости более 40 км/ч машинка теряла управляемость — все-таки физика берет свое и обучение в симуляции не учитывало неровность асфальта и другие мелкие детали. Нас ожидала масштабная работа над Sim2Real transition.
Но в итоге мне и другим игрокам удалось, сидя дома, через браузер управлять настоящей машинкой, соревнуясь с другими машинками, управляемыми ИИ. Это были незабываемые ощущения, которые невозможно передать словами.
Не у всех стартапов сходится экономика, чтобы он оказался прибыльным, но зато нам удалось разработать собственный фреймворк для обучения любых машинок в симуляции, а также выступить с докладом на различных конференциях. Это был крутой опыт с Reinforcement Learning и Robotics, который определенно поможет в будущих проектах.
#кейсы
Однажды на конференции CES 2022 был представлен беспилотный гоночный болид «Формулы-1», управляемый ИИ. Стейкхолдеры нашей венчурной студии решили сделать нечто подобное, но для начала используя менее дорогие машинки.
Итак, в роли технического директора венчурной студии я участвовал в проекте по созданию гоночной игры c машинками для картинга в смешанной реальности.
Идея заключалась в том, чтобы игрок мог, сидя у себя дома в любой точке мира, управлять настоящими гоночными картами и соревноваться с другими игроками и ИИ. Задача состояла в том, чтобы разработать ИИ-автопилот для машинок, адаптируя его в систему для устранения задержек при передаче данных.
Пока одни инженеры обвешивали машинки лидарами, радарами, GNSS (Global Navigation Satellite System), камерами и датчиками для измерения скорости, температуры двигателя и т.п., а другие инженеры строили трассу для игры, ИИ-инженеры решили не терять время и начали обучать беспилотники в симуляции без использования настоящих машинок и готовой трассы.
Обычно беспилотники обучают на реальных данных с использованием синтетических, имитируя различные погодные условия, время суток, типы поверхностей и уровни освещенности. В таком случае датасет для обучения получается больше и разнообразнее. Мы же решили попробовать обучить машинки используя только синтетические данные.
Сначала мы разработали базовый пайплайн обучения с подкреплением (RL) и научились решать задачу Reward Shaping на соревнованиях AWS DeepRacer (кстати, вошли в топ-4% мирового рейтинга), чтобы понимать, какую функцию вознаграждения использовать для бейзлайна. В итоге мы наказывали машинку за врезания в края трассы и поощряли за быстрое прохождение круга.
Далее мы начали изучать среды симуляции: Carla, LG SVL, Gazebo и даже рассматривали обучение в GTA 5. В результате анализа мы выбрали Carla, так как эта среда поддерживает различные сенсоры, собственные карты и хорошо интегрируется с ROS (Robot Operating System).
В среду симуляции мы встроили интерфейс OpenAI Gym для обучения с подкреплением, поместили модель настоящего гоночного карта, модель трассы и создали для него виртуальные лидары. Виртуальные лидары позволили создать для беспилотника дополненную реальность «вида сверху» (bird’s-eye-view) для более точного обучения. Мы организовали систему хранения данных из различных сенсоров и настроили необходимые ML-пайплайны.
Также мы использовали техники curriculum learning, постепенно обучая машинку сначала не врезаться в края трассы, потом избегать врезаний в другие машинки и следом учиться обгонять машинки. В результате мы получили систему для асинхронного обучения нескольких агентов в симуляции. Мы обучили около сотни агентов на одной трассе за 5 часов, выбрали лучшую модель и встроили ее в реальный карт.
Мы наблюдали, как настоящая машинка для картинга, обученная только в симуляции, поехала по реальной трассе. Беспилотник резво входил даже в крутые повороты на скорости до 40 км/ч. Также мы попробовали запустить машинку на других трассах — сработало! Модель хорошо управляла картом даже на незнакомых трассах.
К сожалению, при скорости более 40 км/ч машинка теряла управляемость — все-таки физика берет свое и обучение в симуляции не учитывало неровность асфальта и другие мелкие детали. Нас ожидала масштабная работа над Sim2Real transition.
Но в итоге мне и другим игрокам удалось, сидя дома, через браузер управлять настоящей машинкой, соревнуясь с другими машинками, управляемыми ИИ. Это были незабываемые ощущения, которые невозможно передать словами.
Не у всех стартапов сходится экономика, чтобы он оказался прибыльным, но зато нам удалось разработать собственный фреймворк для обучения любых машинок в симуляции, а также выступить с докладом на различных конференциях. Это был крутой опыт с Reinforcement Learning и Robotics, который определенно поможет в будущих проектах.
#кейсы
⚡️OpenAI выпустили новую модель o1-preview!
OpenAI o1 — это новая LLM, специально обученная для выполнения сложных задач с помощью RL (reinforcement learning). Главная особенность — способность «думать перед тем, как ответить», благодаря чему она генерирует внутреннюю цепочку рассуждений (Chain-of-Thoughts) перед выдачей результата. Это позволяет модели лучше решать задачи, связанные с логикой, программированием и наукой.
Основные характеристики:
• 89-й перцентиль на задачах программирования (Codeforces);
• Успешно решает 73% задач на уровне кандидатов наук по физике, биологии и химии;
• Входит в число 500 лучших участников на отборе в Олимпиаду по математике в США (AIME);
• Модель o1-preview уже доступна в ChatGPT и через API для избранных пользователей.
Ключевые особенности:
• Прогрессивное мышление: модель использует «цепочку рассуждений» для поэтапного решения сложных вопросов, что улучшает качество выводов и позволяет эффективно исправлять ошибки.
• Повышенная точность: по сравнению с GPT-4o, модель o1 показывает значительно лучшие результаты в задачах с высокими требованиями к логическому мышлению — в 7-8 раз лучше в математике и на 15% точнее в науках, таких как физика и химия.
• Новая парадигма: теперь важно не только как много данных и ресурсов используется для обучения, но и сколько времени модель тратит на размышления.
• Рефлексия и самокритика: модель умеет «думать вслух» и анализировать свои ответы, что существенно повышает ее способность к самокоррекции.
В будущем OpenAI планирует значительно ускорить и удешевить модель, делая ее доступной для широкой аудитории.
Думаю, OpenAI o1 станет важной вехой в развитии ИИ благодаря способности размышлять, что кардинально меняет подход к использованию языковых моделей. Ранее нам приходилось использовать подход Chain-of-Thought самостоятельно, но теперь это делают за нас.
Возможно, скоро нас ждет интеграция и других методов рассуждений (Tree-of-Thoughts, Graph-of-Thoughts и т.д.), что позволит решать еще более сложные логические задачи.
#новости
OpenAI o1 — это новая LLM, специально обученная для выполнения сложных задач с помощью RL (reinforcement learning). Главная особенность — способность «думать перед тем, как ответить», благодаря чему она генерирует внутреннюю цепочку рассуждений (Chain-of-Thoughts) перед выдачей результата. Это позволяет модели лучше решать задачи, связанные с логикой, программированием и наукой.
Основные характеристики:
• 89-й перцентиль на задачах программирования (Codeforces);
• Успешно решает 73% задач на уровне кандидатов наук по физике, биологии и химии;
• Входит в число 500 лучших участников на отборе в Олимпиаду по математике в США (AIME);
• Модель o1-preview уже доступна в ChatGPT и через API для избранных пользователей.
Ключевые особенности:
• Прогрессивное мышление: модель использует «цепочку рассуждений» для поэтапного решения сложных вопросов, что улучшает качество выводов и позволяет эффективно исправлять ошибки.
• Повышенная точность: по сравнению с GPT-4o, модель o1 показывает значительно лучшие результаты в задачах с высокими требованиями к логическому мышлению — в 7-8 раз лучше в математике и на 15% точнее в науках, таких как физика и химия.
• Новая парадигма: теперь важно не только как много данных и ресурсов используется для обучения, но и сколько времени модель тратит на размышления.
• Рефлексия и самокритика: модель умеет «думать вслух» и анализировать свои ответы, что существенно повышает ее способность к самокоррекции.
В будущем OpenAI планирует значительно ускорить и удешевить модель, делая ее доступной для широкой аудитории.
Думаю, OpenAI o1 станет важной вехой в развитии ИИ благодаря способности размышлять, что кардинально меняет подход к использованию языковых моделей. Ранее нам приходилось использовать подход Chain-of-Thought самостоятельно, но теперь это делают за нас.
Возможно, скоро нас ждет интеграция и других методов рассуждений (Tree-of-Thoughts, Graph-of-Thoughts и т.д.), что позволит решать еще более сложные логические задачи.
#новости
Openai
Learning to reason with LLMs
We are introducing OpenAI o1, a new large language model trained with reinforcement learning to perform complex reasoning. o1 thinks before it answers—it can produce a long internal chain of thought before responding to the user.
🤖 Датаист
Как мы обучали беспилотные машины в симуляции Однажды на конференции CES 2022 был представлен беспилотный гоночный болид «Формулы-1», управляемый ИИ. Стейкхолдеры нашей венчурной студии решили сделать нечто подобное, но для начала используя менее дорогие…
This media is not supported in your browser
VIEW IN TELEGRAM
А вот и демо того, как мы учили беспилотники в симуляции.
На видео показано, как несколько машинок учатся одновременно в Carla-симуляции. Вид сверху создан с помощью виртуальных лидаров, а реальный карт едет по трассе самостоятельно.
#кейсы
На видео показано, как несколько машинок учатся одновременно в Carla-симуляции. Вид сверху создан с помощью виртуальных лидаров, а реальный карт едет по трассе самостоятельно.
#кейсы
ИИ на распутье: продолжится ли стремительный рост или нас ждет замедление?
В последние годы мы наблюдаем бум искусственного интеллекта (ИИ). Кажется, что ИИ скоро сможет заменить человека во всех сферах — от генерации контента до управления бизнесом. Но так ли это на самом деле?
Термин «искусственный интеллект» появился в 1950-х годах, когда считалось, что создание «настоящего ИИ» — вопрос ближайших лет. Однако оптимизм быстро угас из-за недооценки сложности задач и недостатка вычислительных мощностей, что привело к скептицизму и сокращению финансирования в 1970-х.
В 1980-е годы интерес к ИИ возродился благодаря экспертным системам для узкоспециализированных бизнес-задач, но высокие затраты и трудоемкость снова привели к спаду интереса через десятилетие.
К концу 1990-х интерес вновь вырос благодаря увеличению вычислительных мощностей и победе IBM Deep Blue над Гарри Каспаровым. В 2010-х ИИ пережил расцвет благодаря глубокому обучению, большим данным и дальнейшему росту мощностей. В 2016-м алгоритм AlphaGo победил чемпиона мира по го Ли Седоля, а появление трансформеров в 2017 году дало начало моделям GPT и современным достижениям.
Но не ждет ли ИИ следующая зима? Все зависит от ожиданий общества, инвесторов и экспертов относительно способностей ИИ. Сейчас многие прогнозируют появление AGI (общего ИИ) в ближайшие годы, как и в 1960-х. Однако современные системы ИИ основаны на хорошо известных математических методах: векторные пространства, перемножение матриц, методы оптимизации. Трансформеры лишь предсказывают вероятность следующего токена. Можно ли это назвать интеллектом?
Проблема в том, что мы пока не знаем, что такое интеллект как феномен. Существует множество определений интеллекта, однако общее одно - способность решать когнитивные задачи. Сегодня мы имеем дело с «узким» ИИ (Artificial Narrow Intelligence), способным решать специфические задачи: распознавание лиц, машинный перевод и т.д. ИИ уже применяется в разных индустриях, от медицины до банкинга, принося значительную прибыль. Мы действительно живем в эпоху 4-й промышленной революции, где ИИ помогает решать задачи быстрее и качественнее, а иногда заменяет человеческий труд.
Насколько далеко расширится применение ИИ? Ждет ли нас замедление этого взрывного роста?
Есть несколько сдерживающих факторов:
- Алгоритмы. Помимо трансформеров и диффузионных моделей для генерации картинок, музыки и видео, нет качественно новых алгоритмов, требующих меньше данных для обучения. Методы обучения с подкреплением развиваются, но на горизонте не видно прорывных решений (о KAN-сетях Колмогорова-Арнольда пока судить рано).
- Данные. Для обучения ИИ нужны большие объемы качественных данных. OpenAI уже сталкивается с тем, что данные в интернете истощаются, а наполнение синтетическими данными может вести к деградации моделей. Нужно либо больше данных, либо новые алгоритмы обучения. Вероятно, необходимо и то, и другое.
- Вычисления. Закон Мура, предсказывающий удвоение числа транзисторов каждые два года, больше не обеспечивает прежнего прироста мощностей. Большие языковые модели требуют огромных вычислительных ресурсов, и это создает новые вызовы. Необходим качественно новый тип вычислений — например, квантовый. Тема квантового машинного обучения набирает обороты, но работающие квантовые компьютеры для прикладных задач пока недоступны.
В результате мы видим, что ИИ уже сегодня совершает революцию в различных индустриях и что многие ожидают от него и стоящих за ним в сущности банальных математических методов чего-то сверхъестественного. Прогресс продолжается: ИИ учится рассуждать и решать все более сложные задачи.
Но есть, как водится, две новости — хорошая и плохая. Плохая новость состоит в том, что однажды мы упремся в ограничения — по одной причине или по совокупности нескольких. Хорошая новость — это случится не сегодня.
Я думаю, что ИИ недалекого будущего поможет нам преодолеть эти ограничения, если мы будем применять его в науке и технике, ускоряя общий технологический прогресс. Мы живем в удивительное время, и хочется верить, что зима не близко.
#мысли
В последние годы мы наблюдаем бум искусственного интеллекта (ИИ). Кажется, что ИИ скоро сможет заменить человека во всех сферах — от генерации контента до управления бизнесом. Но так ли это на самом деле?
Термин «искусственный интеллект» появился в 1950-х годах, когда считалось, что создание «настоящего ИИ» — вопрос ближайших лет. Однако оптимизм быстро угас из-за недооценки сложности задач и недостатка вычислительных мощностей, что привело к скептицизму и сокращению финансирования в 1970-х.
В 1980-е годы интерес к ИИ возродился благодаря экспертным системам для узкоспециализированных бизнес-задач, но высокие затраты и трудоемкость снова привели к спаду интереса через десятилетие.
К концу 1990-х интерес вновь вырос благодаря увеличению вычислительных мощностей и победе IBM Deep Blue над Гарри Каспаровым. В 2010-х ИИ пережил расцвет благодаря глубокому обучению, большим данным и дальнейшему росту мощностей. В 2016-м алгоритм AlphaGo победил чемпиона мира по го Ли Седоля, а появление трансформеров в 2017 году дало начало моделям GPT и современным достижениям.
Но не ждет ли ИИ следующая зима? Все зависит от ожиданий общества, инвесторов и экспертов относительно способностей ИИ. Сейчас многие прогнозируют появление AGI (общего ИИ) в ближайшие годы, как и в 1960-х. Однако современные системы ИИ основаны на хорошо известных математических методах: векторные пространства, перемножение матриц, методы оптимизации. Трансформеры лишь предсказывают вероятность следующего токена. Можно ли это назвать интеллектом?
Проблема в том, что мы пока не знаем, что такое интеллект как феномен. Существует множество определений интеллекта, однако общее одно - способность решать когнитивные задачи. Сегодня мы имеем дело с «узким» ИИ (Artificial Narrow Intelligence), способным решать специфические задачи: распознавание лиц, машинный перевод и т.д. ИИ уже применяется в разных индустриях, от медицины до банкинга, принося значительную прибыль. Мы действительно живем в эпоху 4-й промышленной революции, где ИИ помогает решать задачи быстрее и качественнее, а иногда заменяет человеческий труд.
Насколько далеко расширится применение ИИ? Ждет ли нас замедление этого взрывного роста?
Есть несколько сдерживающих факторов:
- Алгоритмы. Помимо трансформеров и диффузионных моделей для генерации картинок, музыки и видео, нет качественно новых алгоритмов, требующих меньше данных для обучения. Методы обучения с подкреплением развиваются, но на горизонте не видно прорывных решений (о KAN-сетях Колмогорова-Арнольда пока судить рано).
- Данные. Для обучения ИИ нужны большие объемы качественных данных. OpenAI уже сталкивается с тем, что данные в интернете истощаются, а наполнение синтетическими данными может вести к деградации моделей. Нужно либо больше данных, либо новые алгоритмы обучения. Вероятно, необходимо и то, и другое.
- Вычисления. Закон Мура, предсказывающий удвоение числа транзисторов каждые два года, больше не обеспечивает прежнего прироста мощностей. Большие языковые модели требуют огромных вычислительных ресурсов, и это создает новые вызовы. Необходим качественно новый тип вычислений — например, квантовый. Тема квантового машинного обучения набирает обороты, но работающие квантовые компьютеры для прикладных задач пока недоступны.
В результате мы видим, что ИИ уже сегодня совершает революцию в различных индустриях и что многие ожидают от него и стоящих за ним в сущности банальных математических методов чего-то сверхъестественного. Прогресс продолжается: ИИ учится рассуждать и решать все более сложные задачи.
Но есть, как водится, две новости — хорошая и плохая. Плохая новость состоит в том, что однажды мы упремся в ограничения — по одной причине или по совокупности нескольких. Хорошая новость — это случится не сегодня.
Я думаю, что ИИ недалекого будущего поможет нам преодолеть эти ограничения, если мы будем применять его в науке и технике, ускоряя общий технологический прогресс. Мы живем в удивительное время, и хочется верить, что зима не близко.
#мысли
ИИ в медицине: революция в лечении и диагностике
Сегодня хочу поговорить про то, как исскусственный интеллект творит чудеса в медицине. Вот лишь несколько шокирующих (в хорошем смысле) примеров:
• Предсказание структуры молекул: Проект AlphaFold 3 помогает ученым быстрее разрабатывать новые лекарства.
• Ранняя диагностика рака: ИИ научился находить рак легких на КТ-снимках с точностью 87%. Живые врачи так не могут.
• Системы поддержки врачебных решений: Система использует языковые модели для анализа текстов и изображений, геномных данных и медицинских руководств. Результаты показали 97% случаев корректного применения соответствующих инструментов, 93,6% правильных заключений, 94% полноты предоставленных рекомендаций, 89,2% полезных рекомендаций и 82,5% корректных ссылок на релевантные источники.
• Персонализированная медицина: ИИ анализирует данные пациентов и помогает подобрать наилучшее лечение. Например, он может предсказать, поможет ли химиотерапия конкретному человеку с точностью более 80%.
• Умные носимые устройства: Теперь ваши часы могут следить за здоровьем и предупреждать о проблемах еще до того, как вы их заметите.
• Робот-стоматолог: Звучит как фантастика, но это уже реальность! Робот может подготовить зуб для коронки всего за 15 минут вместо обычных двух часов.
• Редактирование генов: ИИ помогает создавать инструменты для изменения ДНК. Это может помочь в борьбе с наследственными заболеваниями.
Несмотря на кажущиеся огромные успехи, использование ИИ в этой области поднимает серьезные этические вопросы. Как далеко мы готовы зайти в редактировании генов? Одним из таких вопросов является возможность несанкционированного редактирования генов у эмбрионов, что может привести к нежелательным мутациям. Регулирование в отрасли необходимо для того, чтобы эта технология использовалась этично и безопасно.
Кроме того, хотя ИИ имеет огромный потенциал для улучшения диагностики, разработки лекарств и редактирования генов, он сталкивается с рядом серьезных вызовов.
Во-первых, ИИ требует большого объема качественных данных для обучения. Если данные недостаточно разнообразны или неполны, это может привести к ошибочным результатам. ИИ может быть предвзятым, если он обучался на данных, которые не отражают всю популяцию, что может ухудшить результаты диагностики или лечения для недостаточно представленных групп пациентов.
Во-вторых, остается вопрос доверия к ИИ. Пациенты и врачи должны быть уверены в безопасности и надежности алгоритмов. Кроме того, важна интерпретируемость ИИ-решений — врачи должны понимать, как и почему ИИ принял то или иное решение, чтобы использовать его рекомендации обоснованно.
Наконец, есть проблемы с конфиденциальностью данных. Большие объемы медицинских данных требуют надежных механизмов защиты, чтобы предотвратить утечки.
Но я верю, что преимущества перевешивают риски. Вполне возможно, скоро мы сможем победить болезни, которые сегодня считаются неизлечимыми.
#технологии
Сегодня хочу поговорить про то, как исскусственный интеллект творит чудеса в медицине. Вот лишь несколько шокирующих (в хорошем смысле) примеров:
• Предсказание структуры молекул: Проект AlphaFold 3 помогает ученым быстрее разрабатывать новые лекарства.
• Ранняя диагностика рака: ИИ научился находить рак легких на КТ-снимках с точностью 87%. Живые врачи так не могут.
• Системы поддержки врачебных решений: Система использует языковые модели для анализа текстов и изображений, геномных данных и медицинских руководств. Результаты показали 97% случаев корректного применения соответствующих инструментов, 93,6% правильных заключений, 94% полноты предоставленных рекомендаций, 89,2% полезных рекомендаций и 82,5% корректных ссылок на релевантные источники.
• Персонализированная медицина: ИИ анализирует данные пациентов и помогает подобрать наилучшее лечение. Например, он может предсказать, поможет ли химиотерапия конкретному человеку с точностью более 80%.
• Умные носимые устройства: Теперь ваши часы могут следить за здоровьем и предупреждать о проблемах еще до того, как вы их заметите.
• Робот-стоматолог: Звучит как фантастика, но это уже реальность! Робот может подготовить зуб для коронки всего за 15 минут вместо обычных двух часов.
• Редактирование генов: ИИ помогает создавать инструменты для изменения ДНК. Это может помочь в борьбе с наследственными заболеваниями.
Несмотря на кажущиеся огромные успехи, использование ИИ в этой области поднимает серьезные этические вопросы. Как далеко мы готовы зайти в редактировании генов? Одним из таких вопросов является возможность несанкционированного редактирования генов у эмбрионов, что может привести к нежелательным мутациям. Регулирование в отрасли необходимо для того, чтобы эта технология использовалась этично и безопасно.
Кроме того, хотя ИИ имеет огромный потенциал для улучшения диагностики, разработки лекарств и редактирования генов, он сталкивается с рядом серьезных вызовов.
Во-первых, ИИ требует большого объема качественных данных для обучения. Если данные недостаточно разнообразны или неполны, это может привести к ошибочным результатам. ИИ может быть предвзятым, если он обучался на данных, которые не отражают всю популяцию, что может ухудшить результаты диагностики или лечения для недостаточно представленных групп пациентов.
Во-вторых, остается вопрос доверия к ИИ. Пациенты и врачи должны быть уверены в безопасности и надежности алгоритмов. Кроме того, важна интерпретируемость ИИ-решений — врачи должны понимать, как и почему ИИ принял то или иное решение, чтобы использовать его рекомендации обоснованно.
Наконец, есть проблемы с конфиденциальностью данных. Большие объемы медицинских данных требуют надежных механизмов защиты, чтобы предотвратить утечки.
Но я верю, что преимущества перевешивают риски. Вполне возможно, скоро мы сможем победить болезни, которые сегодня считаются неизлечимыми.
#технологии
ИИ-стартап: путь к успеху
Я знаю по опыту, что большинство стартапов терпят неудачу, и с этим ничего не поделать. Но также я знаю, что принятие верных и быстрых технологических решений может помочь одной из десятка идей пройти весь путь до финальной стадии и привести команду к большому успеху.
Недавно я написал об этом статью на Хабр. Дал ей отлежаться, слегка переписал и теперь хочу рассказать о ней и здесь.
В ней говорится о том, как устроен запуск стартапа с точки зрения технологий, а не инвестиций и бизнеса.
Какой софт использовать для создания структуры бизнес-модели и архитектуры технического решения? Как прототипировать? Как максимально быстро собрать MVP продукта, чтобы получить первый фидбек от пользователей? Как подключить платежки и аналитику, какие для этого использовать решения? Как правильно масштабироваться, если получилось начать расти? Наконец, как поддерживать готовый зрелый продукт? Обо всем этом я рассказываю в статье.
Буду рад, если это окажется полезным.
#анонс
Я знаю по опыту, что большинство стартапов терпят неудачу, и с этим ничего не поделать. Но также я знаю, что принятие верных и быстрых технологических решений может помочь одной из десятка идей пройти весь путь до финальной стадии и привести команду к большому успеху.
Недавно я написал об этом статью на Хабр. Дал ей отлежаться, слегка переписал и теперь хочу рассказать о ней и здесь.
В ней говорится о том, как устроен запуск стартапа с точки зрения технологий, а не инвестиций и бизнеса.
Какой софт использовать для создания структуры бизнес-модели и архитектуры технического решения? Как прототипировать? Как максимально быстро собрать MVP продукта, чтобы получить первый фидбек от пользователей? Как подключить платежки и аналитику, какие для этого использовать решения? Как правильно масштабироваться, если получилось начать расти? Наконец, как поддерживать готовый зрелый продукт? Обо всем этом я рассказываю в статье.
Буду рад, если это окажется полезным.
#анонс
Хабр
Путь к успеху для ИИ-стартапа
Этапы развития стартапа Привет! Я Андрей. Раньше я работал директором по данным и искусственному интеллекту в Сбере, победил в стартап-акселераторе Сбера с ИИ-сервисом для знакомств и был техническим...
Как ИИ помогает принимать стратегические решения
Люди эмоциональны и потому необъективны. Ты вкладываешься в проект, в который веришь, он приносит убытки и нет никаких причин, чтобы ситуация поменялась в будущем. Но ты продолжаешь верить, что проект вот-вот «выстрелит», и сжигаешь в нем все больше денег.
Было бы классно, если бы в этот момент кто-то мог бы честно и непредвзято проанализировать ситуацию и дать совет. Это вполне мог бы быть искусственный интеллект – чего у него точно нет, так это когнитивных искажений. Он оперирует только фактами.
Как раз такую задачу мы решали для «Сбера». Нужно было разработать систему для топ-менеджеров, которая помогала бы им принимать обоснованные объективные решения. Для работы мы использовали фреймворк CRISP-DM (Cross-industry standard process for data mining):
Определили бизнес-задачу. Мы определили ключевые процессы, на основе которых топ-менеджмент принимает решения, и согласовали методологию расчета KPI для каждого процесса. Например, мы проанализировали шаги выдачи кредитной карты — от получения клиентской заявки до активации карты. А затем написали KPI по всем этапам — время обработки заявки, процент одобрений и т.д.
Получили текущие данные по процессам. Это было сложно — пришлось искать в нескольких системах и договариваться с менеджерами. Но мы справились!
Привели данные в единый формат. Данные были неполными и в разных форматах. Мы очистили их и дополнили сведениями из дополнительных источников.
Построили ИИ-модели для прогнозирования метрик. Сделали это на основе полученных данных и выработанных KPI. Логистическая регрессия показала неплохие результаты.
Провели A/B-тестирование моделей, разделив данные на контрольную и тестовую группы. Сравнили эффективность модели с текущими показателями и убедились в ее надежности. Также проверили, чтобы модели соответствовали требованиям безопасности банка.
Внедрили модели в промышленный контур банка и настроили мониторинг качества. Чтобы модели не деградировали со временем, разработали процесс регулярного переобучения, используя MLOps-практики.
Также мы учли сложные взаимосвязи между процессами, чтобы предсказывать комплексные события. Например, рынок меняется из-за макроэкономических процессов, и это влияет на внутреннюю работу банка.
Чтобы связать модели и спрогнозировать влияние одного процесса на другой, мы использовали композитное моделирование и инструменты автоматического машинного обучения FEDOT и LightAutoML.
Конечно, ИИ пока не способен заменить людей в принятии решений. Но он может стать помощником, если вы хотите принимать бизнес-решения не на основе убеждений и интуиции, а руководствуясь точными и непредвзятыми данными.
#кейсы
Люди эмоциональны и потому необъективны. Ты вкладываешься в проект, в который веришь, он приносит убытки и нет никаких причин, чтобы ситуация поменялась в будущем. Но ты продолжаешь верить, что проект вот-вот «выстрелит», и сжигаешь в нем все больше денег.
Было бы классно, если бы в этот момент кто-то мог бы честно и непредвзято проанализировать ситуацию и дать совет. Это вполне мог бы быть искусственный интеллект – чего у него точно нет, так это когнитивных искажений. Он оперирует только фактами.
Как раз такую задачу мы решали для «Сбера». Нужно было разработать систему для топ-менеджеров, которая помогала бы им принимать обоснованные объективные решения. Для работы мы использовали фреймворк CRISP-DM (Cross-industry standard process for data mining):
Определили бизнес-задачу. Мы определили ключевые процессы, на основе которых топ-менеджмент принимает решения, и согласовали методологию расчета KPI для каждого процесса. Например, мы проанализировали шаги выдачи кредитной карты — от получения клиентской заявки до активации карты. А затем написали KPI по всем этапам — время обработки заявки, процент одобрений и т.д.
Получили текущие данные по процессам. Это было сложно — пришлось искать в нескольких системах и договариваться с менеджерами. Но мы справились!
Привели данные в единый формат. Данные были неполными и в разных форматах. Мы очистили их и дополнили сведениями из дополнительных источников.
Построили ИИ-модели для прогнозирования метрик. Сделали это на основе полученных данных и выработанных KPI. Логистическая регрессия показала неплохие результаты.
Провели A/B-тестирование моделей, разделив данные на контрольную и тестовую группы. Сравнили эффективность модели с текущими показателями и убедились в ее надежности. Также проверили, чтобы модели соответствовали требованиям безопасности банка.
Внедрили модели в промышленный контур банка и настроили мониторинг качества. Чтобы модели не деградировали со временем, разработали процесс регулярного переобучения, используя MLOps-практики.
Также мы учли сложные взаимосвязи между процессами, чтобы предсказывать комплексные события. Например, рынок меняется из-за макроэкономических процессов, и это влияет на внутреннюю работу банка.
Чтобы связать модели и спрогнозировать влияние одного процесса на другой, мы использовали композитное моделирование и инструменты автоматического машинного обучения FEDOT и LightAutoML.
Конечно, ИИ пока не способен заменить людей в принятии решений. Но он может стать помощником, если вы хотите принимать бизнес-решения не на основе убеждений и интуиции, а руководствуясь точными и непредвзятыми данными.
#кейсы
Будущее OpenAI: что ждет компанию после ухода технического директора
Не успела OpenAI представить нового голосового ассистента, способного адаптироваться к эмоциям пользователя, как объявила о своем уходе Мира Мурати, технический директор компании. Она занимала свою должность более шести лет и отвечала за техническое руководство компанией, а также за внедрение инноваций. Во многом именно благодаря ей OpenAI стала той компанией, которую мы все знаем.
Кроме чисто технических аспектов, Мурати также занималась стратегическим планированием и построением партнерских отношений с другими компаниями и организациями.
Ее уход может серьезно повлиять как на темпы, так и на направления развития компании. Будущее OpenAI будет во многом зависеть от того, как руководство справится с текущими изменениями и продолжит инновации в быстроразвивающейся и очень конкурентной индустрии ИИ.
Не пытаясь гадать о причинах ухода Мурати, скажу, что хорошо понимаю, с какими вызовами ей приходилось справляться ежедневно. OpenAI прямо сейчас необходимо решить множество проблем: для обучения более мощной модели требуется огромная инфраструктура, что-то нужно делать с вопросами безопасности и соответствия модели морально-этическим нормам. Под сомнением находится прозрачность источников данных — например, когда журналист спросил, откуда берутся данные для обучения SORA, Мира аккуратно ушла от ответа.
А впереди маячит следующая глобальная задача — обучение GPT-5, и там все эти проблемы снова встанут во весь рост.
Впрочем, инвесторы продолжают предлагать OpenAI больше денег, чем компания готова принять: если верить Bloomberg, компания вскоре получит еще 6,5 миллиардов долларов.
#новости
Не успела OpenAI представить нового голосового ассистента, способного адаптироваться к эмоциям пользователя, как объявила о своем уходе Мира Мурати, технический директор компании. Она занимала свою должность более шести лет и отвечала за техническое руководство компанией, а также за внедрение инноваций. Во многом именно благодаря ей OpenAI стала той компанией, которую мы все знаем.
Кроме чисто технических аспектов, Мурати также занималась стратегическим планированием и построением партнерских отношений с другими компаниями и организациями.
Ее уход может серьезно повлиять как на темпы, так и на направления развития компании. Будущее OpenAI будет во многом зависеть от того, как руководство справится с текущими изменениями и продолжит инновации в быстроразвивающейся и очень конкурентной индустрии ИИ.
Не пытаясь гадать о причинах ухода Мурати, скажу, что хорошо понимаю, с какими вызовами ей приходилось справляться ежедневно. OpenAI прямо сейчас необходимо решить множество проблем: для обучения более мощной модели требуется огромная инфраструктура, что-то нужно делать с вопросами безопасности и соответствия модели морально-этическим нормам. Под сомнением находится прозрачность источников данных — например, когда журналист спросил, откуда берутся данные для обучения SORA, Мира аккуратно ушла от ответа.
А впереди маячит следующая глобальная задача — обучение GPT-5, и там все эти проблемы снова встанут во весь рост.
Впрочем, инвесторы продолжают предлагать OpenAI больше денег, чем компания готова принять: если верить Bloomberg, компания вскоре получит еще 6,5 миллиардов долларов.
#новости
the Guardian
OpenAI CTO Mira Murati says she’s leaving firm to do her ‘own exploration’
Chief technology officer had taken over the ChatGPT maker when its board ousted CEO Sam Altman in November
ИИ для гуманоидных роботов: от механики к разуму
Все мы видели красивые видеоролики, на которых более или менее человекоподобные роботы выполняют сложные задачи: от точных движений руки до самостоятельного передвижения по комнате и даже сальто.
На первый взгляд, кажется, что это достижение чисто механической инженерии и сравнительно несложного программирования: есть карта помещения, есть датчики для определения своего положения в пространстве, есть сведения об устройстве и возможностях своих подвижных частей и уравнения, описывающие физические взаимодействия.
Казалось бы, совместить все это — дело техники. Однако такой механистический подход может работать только в полностью заданной среде либо при наличии внешнего управления (почитайте, как такую задачу «решили» в 18-м веке), а роботу предстоит действовать самостоятельно и в средах с динамическим окружением.
Конечно, у робота есть сенсоры и камеры, он получает информацию об окружающем мире, но эту информацию нужно обработать, проанализировать и принять адекватные решения. И тут без ИИ не обойтись.
Семантические сети, онтологии и языковые модели помогают роботу «понимать» контекст и связывать разрозненные данные из окружающего мира. Современные когнитивные архитектуры представлены в виде цепочек и графов мыслей, а также других форм рассуждений. Несмотря на то, что уже сейчас можно имитировать базовые формы человеческих рассуждений, до полноценного «понимания» еще далеко. Тем не менее, эти технологии позволяют роботам эффективно анализировать информацию и адаптироваться к новым ситуациям.
Чтобы просто пройти через комнату, не натыкаясь на препятствия, робот использует алгоритмы планирования и навигации. Технологии вроде SLAM (Одновременная локализация и построение карты) и алгоритмы поиска кратчайших путей (например, A* или алгоритм Дейкстры) помогают ему прокладывать маршрут и адаптироваться к изменяющейся среде. Без этих методов робот не смог бы эффективно перемещаться в неизвестных условиях.
Благодаря ИИ роботу может учиться на собственных ошибках, используя обучение с подкреплением. Когда робот сталкивается с трудностями, он анализирует свои действия, получает обратную связь и улучшает свои стратегии. Это особенно важно для задач, требующих адаптации, таких как ходьба по неровной поверхности или манипуляция объектами.
Не менее важны и симуляции. Перед тем как выйти в реальный мир, робот проходит обучение в виртуальных средах, таких как Carla или Gazebo. В этих симуляциях он может безопасно отрабатывать различные сценарии, что ускоряет процесс обучения и повышает надежность его действий.
Наконец, управление движениями требует точных алгоритмов стабилизации и координации. Такие методы, как PID-регулирование и адаптивные алгоритмы, обеспечивают плавное и безопасное движение робота, позволяя ему быстро реагировать на изменения и точно выполнять поставленные задачи.
В ближайшем будущем развитие робототехники будет сосредоточено на промышленных многофункциональных роботах для использования на безлюдных объектах и некоторых специализированных применений. Домашнее использование гуманоидных роботов пока остается в отдаленной перспективе: предстоит снизить стоимость, улучшить полезность, решить проблемы безопасности.
Но уже сегодня ИИ превращает гуманоидных роботов в интеллектуальных и автономных помощников, способных выполнять сложные задачи и адаптироваться к новым условиям. Если эти машины могут видеть, рассуждать, планировать и учиться, то чем мы принципиально отличаемся от них, кроме того, что наше «железо» построено на органической элементной базе?
Здесь придется перейти к разговору о сути сознания. К сожалению, мы еще далеко не до конца понимаем, что это такое — что, впрочем, не мешает нам рассуждать на эту тему.
Но об этом — в следующем посте.
#технологии
Все мы видели красивые видеоролики, на которых более или менее человекоподобные роботы выполняют сложные задачи: от точных движений руки до самостоятельного передвижения по комнате и даже сальто.
На первый взгляд, кажется, что это достижение чисто механической инженерии и сравнительно несложного программирования: есть карта помещения, есть датчики для определения своего положения в пространстве, есть сведения об устройстве и возможностях своих подвижных частей и уравнения, описывающие физические взаимодействия.
Казалось бы, совместить все это — дело техники. Однако такой механистический подход может работать только в полностью заданной среде либо при наличии внешнего управления (почитайте, как такую задачу «решили» в 18-м веке), а роботу предстоит действовать самостоятельно и в средах с динамическим окружением.
Конечно, у робота есть сенсоры и камеры, он получает информацию об окружающем мире, но эту информацию нужно обработать, проанализировать и принять адекватные решения. И тут без ИИ не обойтись.
Семантические сети, онтологии и языковые модели помогают роботу «понимать» контекст и связывать разрозненные данные из окружающего мира. Современные когнитивные архитектуры представлены в виде цепочек и графов мыслей, а также других форм рассуждений. Несмотря на то, что уже сейчас можно имитировать базовые формы человеческих рассуждений, до полноценного «понимания» еще далеко. Тем не менее, эти технологии позволяют роботам эффективно анализировать информацию и адаптироваться к новым ситуациям.
Чтобы просто пройти через комнату, не натыкаясь на препятствия, робот использует алгоритмы планирования и навигации. Технологии вроде SLAM (Одновременная локализация и построение карты) и алгоритмы поиска кратчайших путей (например, A* или алгоритм Дейкстры) помогают ему прокладывать маршрут и адаптироваться к изменяющейся среде. Без этих методов робот не смог бы эффективно перемещаться в неизвестных условиях.
Благодаря ИИ роботу может учиться на собственных ошибках, используя обучение с подкреплением. Когда робот сталкивается с трудностями, он анализирует свои действия, получает обратную связь и улучшает свои стратегии. Это особенно важно для задач, требующих адаптации, таких как ходьба по неровной поверхности или манипуляция объектами.
Не менее важны и симуляции. Перед тем как выйти в реальный мир, робот проходит обучение в виртуальных средах, таких как Carla или Gazebo. В этих симуляциях он может безопасно отрабатывать различные сценарии, что ускоряет процесс обучения и повышает надежность его действий.
Наконец, управление движениями требует точных алгоритмов стабилизации и координации. Такие методы, как PID-регулирование и адаптивные алгоритмы, обеспечивают плавное и безопасное движение робота, позволяя ему быстро реагировать на изменения и точно выполнять поставленные задачи.
В ближайшем будущем развитие робототехники будет сосредоточено на промышленных многофункциональных роботах для использования на безлюдных объектах и некоторых специализированных применений. Домашнее использование гуманоидных роботов пока остается в отдаленной перспективе: предстоит снизить стоимость, улучшить полезность, решить проблемы безопасности.
Но уже сегодня ИИ превращает гуманоидных роботов в интеллектуальных и автономных помощников, способных выполнять сложные задачи и адаптироваться к новым условиям. Если эти машины могут видеть, рассуждать, планировать и учиться, то чем мы принципиально отличаемся от них, кроме того, что наше «железо» построено на органической элементной базе?
Здесь придется перейти к разговору о сути сознания. К сожалению, мы еще далеко не до конца понимаем, что это такое — что, впрочем, не мешает нам рассуждать на эту тему.
Но об этом — в следующем посте.
#технологии
This media is not supported in your browser
VIEW IN TELEGRAM
Figure создает гуманоидных роботов с ИИ, которые анализируют объекты с помощью визуально-языковых моделей (VLM). На видео робот определяет съедобные предметы и передает человеку яблоко, демонстрируя способность к пониманию.
#технологии
#технологии
AGI: Когда ИИ превзойдет человека?
Все чаще мы слышим о том, что общий искусственный интеллект (AGI) может достичь или даже превзойти человеческий уровень. Сэм Альтман, CEO OpenAI, и Шейн Легг, сооснователь Google DeepMind, считают, что AGI может быть достигнут уже в ближайшие 4–5 лет. Однако другие специалисты указывают на технические и теоретические сложности, предполагая, что AGI появится не раньше 2075 года.
Но что мешает нам точно предсказать появление AGI? Одна из причин — путаница между понятиями сознания и интеллекта. Интеллект можно определить как способность системы понимать, рассуждать, учиться и применять знания для решения задач. Сознание же — более сложный и не до конца определенный феномен, включающий субъективный опыт и способность осознавать свои мысли и чувства.
Существует несколько теорий, пытающихся объяснить природу сознания:
• Теория глобального нейронного рабочего
пространства (GNWT)
• Теория интегрированной информации (IIT)
• Гиперсетевая теория мозга академика Константина Анохина
• Теория квантового сознания Роджера Пенроуза
• Теория внимания (Attention Schema Theory)
Каждая из этих теорий предлагает свой взгляд на сознание, и, возможно, истина лежит на пересечении этих идей. Но пока природа сознания остается загадкой, имеет смысл сосредоточиться на феномене интеллекта.
Измерение сознания — сложная и пока не решаемая научная задача. Интеллект же традиционно измеряется с помощью IQ-тестов, оценивающих логическое мышление, однако IQ не охватывает всех аспектов интеллекта. В целом можно считать, что интеллект — это способность субъекта решать задачи в определенной среде. Чем больше задач и чем неопределеннее среда, тем выше уровень интеллекта.
Чтобы понять прогресс в развитии AGI, рассмотрим его эволюцию через пять уровней, предложенных OpenAI:
1. Болталки — простые чат-боты, способные поддерживать диалог и сохранять контекст.
2. Агенты, способные рассуждать. Например, GPT-4o приближается к этому уровню, генерируя осмысленные и релевантные ответы для решения сложных задач.
3. Агенты, достигающие сложных целей, разбивая их на подзадачи, используя инструменты и контролируя результаты через внутренних критиков.
4. Креативные агенты, генерирующие оригинальные идеи, выходящие за рамки обучающих данных, способные совершать научные прорывы.
5. Мультиагентные системы, объединяющие специализированных «экспертов» в разных областях.
Эксперты OpenAI полагают, что достигнув пятого уровня, мы получим тот самый AGI, и это возможно в обозримом будущем. Но все не так просто. Помимо совершенствования когнитивных архитектур, требуется качественный скачок в вычислительных возможностях и более глубокое понимание интеллекта как физического феномена.
Квантовые компьютеры обещают революцию в вычислениях. Они способны обрабатывать огромные объемы информации параллельно, что в контексте ИИ может привести к созданию более мощных и адаптивных моделей. Однако когда квантовые вычисления станут доступными для широкого использования — вопрос открытый.
Сама возможность создания AGI поднимает важные этические и социальные проблемы. Такие системы должны быть контролируемыми, интерпретируемыми и должны соответствовать человеческим этическим стандартам. Кроме того, массовая автоматизация может привести к сокращению рабочих мест. Для управления этими рисками необходимо создавать международные стандарты и нормативы, а также глобально сотрудничать между государствами и организациями.
Стремясь к созданию интеллекта, который превзойдет человека, важно помнить об обратной стороне. Как говорил профессор Лотман: «У человека есть только две ноги: интеллект и совесть. Как совесть без развитого интеллекта слепа, но не опасна, так опасен интеллект без совести».
#мысли
Все чаще мы слышим о том, что общий искусственный интеллект (AGI) может достичь или даже превзойти человеческий уровень. Сэм Альтман, CEO OpenAI, и Шейн Легг, сооснователь Google DeepMind, считают, что AGI может быть достигнут уже в ближайшие 4–5 лет. Однако другие специалисты указывают на технические и теоретические сложности, предполагая, что AGI появится не раньше 2075 года.
Но что мешает нам точно предсказать появление AGI? Одна из причин — путаница между понятиями сознания и интеллекта. Интеллект можно определить как способность системы понимать, рассуждать, учиться и применять знания для решения задач. Сознание же — более сложный и не до конца определенный феномен, включающий субъективный опыт и способность осознавать свои мысли и чувства.
Существует несколько теорий, пытающихся объяснить природу сознания:
• Теория глобального нейронного рабочего
пространства (GNWT)
• Теория интегрированной информации (IIT)
• Гиперсетевая теория мозга академика Константина Анохина
• Теория квантового сознания Роджера Пенроуза
• Теория внимания (Attention Schema Theory)
Каждая из этих теорий предлагает свой взгляд на сознание, и, возможно, истина лежит на пересечении этих идей. Но пока природа сознания остается загадкой, имеет смысл сосредоточиться на феномене интеллекта.
Измерение сознания — сложная и пока не решаемая научная задача. Интеллект же традиционно измеряется с помощью IQ-тестов, оценивающих логическое мышление, однако IQ не охватывает всех аспектов интеллекта. В целом можно считать, что интеллект — это способность субъекта решать задачи в определенной среде. Чем больше задач и чем неопределеннее среда, тем выше уровень интеллекта.
Чтобы понять прогресс в развитии AGI, рассмотрим его эволюцию через пять уровней, предложенных OpenAI:
1. Болталки — простые чат-боты, способные поддерживать диалог и сохранять контекст.
2. Агенты, способные рассуждать. Например, GPT-4o приближается к этому уровню, генерируя осмысленные и релевантные ответы для решения сложных задач.
3. Агенты, достигающие сложных целей, разбивая их на подзадачи, используя инструменты и контролируя результаты через внутренних критиков.
4. Креативные агенты, генерирующие оригинальные идеи, выходящие за рамки обучающих данных, способные совершать научные прорывы.
5. Мультиагентные системы, объединяющие специализированных «экспертов» в разных областях.
Эксперты OpenAI полагают, что достигнув пятого уровня, мы получим тот самый AGI, и это возможно в обозримом будущем. Но все не так просто. Помимо совершенствования когнитивных архитектур, требуется качественный скачок в вычислительных возможностях и более глубокое понимание интеллекта как физического феномена.
Квантовые компьютеры обещают революцию в вычислениях. Они способны обрабатывать огромные объемы информации параллельно, что в контексте ИИ может привести к созданию более мощных и адаптивных моделей. Однако когда квантовые вычисления станут доступными для широкого использования — вопрос открытый.
Сама возможность создания AGI поднимает важные этические и социальные проблемы. Такие системы должны быть контролируемыми, интерпретируемыми и должны соответствовать человеческим этическим стандартам. Кроме того, массовая автоматизация может привести к сокращению рабочих мест. Для управления этими рисками необходимо создавать международные стандарты и нормативы, а также глобально сотрудничать между государствами и организациями.
Стремясь к созданию интеллекта, который превзойдет человека, важно помнить об обратной стороне. Как говорил профессор Лотман: «У человека есть только две ноги: интеллект и совесть. Как совесть без развитого интеллекта слепа, но не опасна, так опасен интеллект без совести».
#мысли
Как ИИ меняет военные конфликты
Как известно, война никогда не меняется. Но также известно, что война – двигатель прогресса. Поле боя всегда становилось ареной противоборства не только людей, но и технологий. Железо против бронзы, аркебузы против рыцарской конницы, и так далее, и тому подобное – примеров можно подобрать множество. В современном мире информационные технологии становятся ключевым фактором, определяющим исход военных конфликтов. Искусственный интеллект (ИИ) со временем кардинально и неизбежно изменит характер войн и военных операций, найдя применение во всех аспектах боевых действий.
Информационная война: с помощью дипфейков и бот-ферм распространяются фейковые новости и пропаганда. Кибератаки на инфраструктуру противника становятся более эффективными благодаря интеллектуальному анализу данных.
Стратегическое и тактическое планирование: на уровне театра военных действий ИИ, обученный на алгоритмах теории игр, может на данных мониторинга спутниковых снимков (см. британский проект Spotter) анализировать военную активность, симулировать различные сценарии и давать рекомендации военному руководству, повышая скорость и качество управления войсками. Аналогичный проект StormCloud, тоже родом из Британии, созданный Королевским флотом совместно c Microsoft и AWS, действует на тактическом уровне и анализирует данные с дронов, спутников и наземных сенсоров.
Применение в войсках: еще в 2021 году турецкий дрон Kargu-2 впервые в истории совершил автономную атаку. Дроны Bayraktar TB2 способны выполнять боевые задачи даже при нарушении связи с оператором. Различные наземные роботы используются для разведки, разминирования, эвакуации раненых. Отдельная история – роевые технологии, когда ПВО противника перегружается множеством дронов, управляемых единой интеллектуальной системой. В этой области мы узнаем что-то новое чуть ли не ежедневно.
Вытесняя людей из войн, ИИ меняет саму их природу. В будущем автономные роботы и дроны будут в основном сражаться между собой, а людям останется роль операторов, как в видеоигре – причем даже не в шутере, а в стратегии реального времени, условной Starcraft. Это снизит потери, увеличит скорость и точность операций, но повысит риски неконтролируемой эскалации и ошибок ИИ.
Внедрение ИИ в военное дело поднимает серьезные этические вопросы: можно ли доверять машинам принимать решения о жизни и смерти? Кто несет ответственность за ошибки ИИ? Не может ли развитие военных технологий и стремление к технологическому превосходству привести к новым конфликтам само по себе?
Мы не можем остановить развитие технологий, но можем договариваться о том, как их использовать. Военные применения ИИ – тот самый случай, когда очень важно выработать единые гуманные стандарты поведения устройств на базе искусственного интеллекта, прежде всего для того, чтобы сберечь жизни мирных жителей. Иначе вполне возможно, что в войнах будущего, когда роботы окончательно отстранят людей от участия в боевых действиях, гибнуть будут только гражданские. Уверен, не о таком будущем мы все мечтаем.
#технологии
Как известно, война никогда не меняется. Но также известно, что война – двигатель прогресса. Поле боя всегда становилось ареной противоборства не только людей, но и технологий. Железо против бронзы, аркебузы против рыцарской конницы, и так далее, и тому подобное – примеров можно подобрать множество. В современном мире информационные технологии становятся ключевым фактором, определяющим исход военных конфликтов. Искусственный интеллект (ИИ) со временем кардинально и неизбежно изменит характер войн и военных операций, найдя применение во всех аспектах боевых действий.
Информационная война: с помощью дипфейков и бот-ферм распространяются фейковые новости и пропаганда. Кибератаки на инфраструктуру противника становятся более эффективными благодаря интеллектуальному анализу данных.
Стратегическое и тактическое планирование: на уровне театра военных действий ИИ, обученный на алгоритмах теории игр, может на данных мониторинга спутниковых снимков (см. британский проект Spotter) анализировать военную активность, симулировать различные сценарии и давать рекомендации военному руководству, повышая скорость и качество управления войсками. Аналогичный проект StormCloud, тоже родом из Британии, созданный Королевским флотом совместно c Microsoft и AWS, действует на тактическом уровне и анализирует данные с дронов, спутников и наземных сенсоров.
Применение в войсках: еще в 2021 году турецкий дрон Kargu-2 впервые в истории совершил автономную атаку. Дроны Bayraktar TB2 способны выполнять боевые задачи даже при нарушении связи с оператором. Различные наземные роботы используются для разведки, разминирования, эвакуации раненых. Отдельная история – роевые технологии, когда ПВО противника перегружается множеством дронов, управляемых единой интеллектуальной системой. В этой области мы узнаем что-то новое чуть ли не ежедневно.
Вытесняя людей из войн, ИИ меняет саму их природу. В будущем автономные роботы и дроны будут в основном сражаться между собой, а людям останется роль операторов, как в видеоигре – причем даже не в шутере, а в стратегии реального времени, условной Starcraft. Это снизит потери, увеличит скорость и точность операций, но повысит риски неконтролируемой эскалации и ошибок ИИ.
Внедрение ИИ в военное дело поднимает серьезные этические вопросы: можно ли доверять машинам принимать решения о жизни и смерти? Кто несет ответственность за ошибки ИИ? Не может ли развитие военных технологий и стремление к технологическому превосходству привести к новым конфликтам само по себе?
Мы не можем остановить развитие технологий, но можем договариваться о том, как их использовать. Военные применения ИИ – тот самый случай, когда очень важно выработать единые гуманные стандарты поведения устройств на базе искусственного интеллекта, прежде всего для того, чтобы сберечь жизни мирных жителей. Иначе вполне возможно, что в войнах будущего, когда роботы окончательно отстранят людей от участия в боевых действиях, гибнуть будут только гражданские. Уверен, не о таком будущем мы все мечтаем.
#технологии
Media is too big
VIEW IN TELEGRAM
На видео показано, как передовые автономные дроны с ИИ способны эффективно перемещаться в сложных средах и формировать рой.
Роевые системы обеспечивают координацию и избегание препятствий в реальном времени, что повышает точность и скорость военных операций.
#технологии
Роевые системы обеспечивают координацию и избегание препятствий в реальном времени, что повышает точность и скорость военных операций.
#технологии
Как создать своего цифрового двойника и поставить блог на автопилот
Возможно, вы видели виртуальных инфлюенсеров в различных соцсетях. Каждую единицу контента для подобных блогеров создает человек вместе с ИИ. Мы решили автоматизировать этот процесс и создать полностью автономных ИИ-инфлюенсеров, которые бы не зависели от человека.
Знакомьтесь, Оливия, одна из несколько сотен наших автономных блогеров. Несколько недель Оливия вела свой блог о жизни и психологии полностью автоматически, отвечала на комментарии и сообщения. Оливия – синтетическая личность, созданная при помощи нашего сервиса Pygma AI. Расскажу, как он устроен.
Для создания автономного блогера в Pygma используется мультиагентная система, состоящая из нескольких ключевых компонентов:
Планировщик: определяет контент-план на заданный промежуток времени, выбирает темы и расписание публикаций. Он также обращается в интернет для сбора актуальных новостей и статей по интересующей тематике, чтобы контент был свежим и релевантным.
Исполнитель: является цифровым двойником пользователя или синтетической личностью, и генерирует мультимодальный контент на основе контент-плана. Он симулирует поведение и стиль реального пользователя, создавая тексты, изображения и видео.
Критик: создан на основе данных о подписчиках для симуляции подписчика и оценки качества контента. Если контент не удовлетворяет заданным критериям или не соответствует ожиданиям аудитории, он отправляется на доработку.
Такой подход позволяет автономному блогеру не только создавать контент без участия человека, но и адаптироваться к аудитории, делая его более «живым» и интересным.
Чтобы создать цифровую идентичность, которая выглядит и ощущается как реальный человек, необходимо уделить внимание нескольким аспектам персонализации:
Цифровая личность: Это набор ценностей, убеждений и целей, а также персональный характер по модели Big Five. Все эти параметры задаются с помощью промтов для LLM, что позволяет сформировать уникальную личность с индивидуальным стилем и поведением.
Цифровой человек: Чтобы блогер выглядел и звучал как человек, мы используем технологии файн-тюнинга языковых моделей для копирования стиля пользователя. Для генерации фото двойника мы применяем ID-эмбеддинги, которые клонируют внешность по одной фотографии за несколько секунд. Синтез голоса осуществляется с помощью инструментов вроде ElevenLabs. Для создания реалистичных говорящих голов используются MuseV, а MuseTalk для липсинка, но для этой задачи можно применить и другие инструменты, типа Ex-human или D-ID.
Цифровое «Я»: Ежедневно генерируется биография и мысли виртуального «Я» с учетом обратной связи от пользователей. Используя подход Retrieval-Augmented Generation (RAG), мы сохраняем биографию блогера в семантической базе данных. Перед созданием нового контента автономный блогер «рефлексирует», обращаясь к своему прошлому опыту. Это делает его поведение консистентным и придает глубину его личности.
Pygma AI помогает реальным блогерам автоматизировать процессы создания контента и повышать вовлеченность аудитории. Наше решение оказалось успешным: мы стали продуктом дня и недели на Product Hunt. Вы можете загрузить одну или несколько своих фото в Pygma AI и получить своего цифрового двойника совершенно бесплатно.
Создание целых ферм синтетических инфлюенсеров может использоваться для продвижения пропаганды или определенных идеологий, и это поднимает серьезные этические проблемы. Могут ли эти цифровые личности влиять на общественное мнение так же, как и реальные люди? Как отличить синтетического блогера от человека, и должны ли мы это делать? Эти вопросы требуют осознания и обсуждения как со стороны разработчиков и компаний, так и со стороны общества. В конечном итоге, эти технологии должны дополнять человеческий опыт, а не вводить людей в заблуждение.
#кейсы
Возможно, вы видели виртуальных инфлюенсеров в различных соцсетях. Каждую единицу контента для подобных блогеров создает человек вместе с ИИ. Мы решили автоматизировать этот процесс и создать полностью автономных ИИ-инфлюенсеров, которые бы не зависели от человека.
Знакомьтесь, Оливия, одна из несколько сотен наших автономных блогеров. Несколько недель Оливия вела свой блог о жизни и психологии полностью автоматически, отвечала на комментарии и сообщения. Оливия – синтетическая личность, созданная при помощи нашего сервиса Pygma AI. Расскажу, как он устроен.
Для создания автономного блогера в Pygma используется мультиагентная система, состоящая из нескольких ключевых компонентов:
Планировщик: определяет контент-план на заданный промежуток времени, выбирает темы и расписание публикаций. Он также обращается в интернет для сбора актуальных новостей и статей по интересующей тематике, чтобы контент был свежим и релевантным.
Исполнитель: является цифровым двойником пользователя или синтетической личностью, и генерирует мультимодальный контент на основе контент-плана. Он симулирует поведение и стиль реального пользователя, создавая тексты, изображения и видео.
Критик: создан на основе данных о подписчиках для симуляции подписчика и оценки качества контента. Если контент не удовлетворяет заданным критериям или не соответствует ожиданиям аудитории, он отправляется на доработку.
Такой подход позволяет автономному блогеру не только создавать контент без участия человека, но и адаптироваться к аудитории, делая его более «живым» и интересным.
Чтобы создать цифровую идентичность, которая выглядит и ощущается как реальный человек, необходимо уделить внимание нескольким аспектам персонализации:
Цифровая личность: Это набор ценностей, убеждений и целей, а также персональный характер по модели Big Five. Все эти параметры задаются с помощью промтов для LLM, что позволяет сформировать уникальную личность с индивидуальным стилем и поведением.
Цифровой человек: Чтобы блогер выглядел и звучал как человек, мы используем технологии файн-тюнинга языковых моделей для копирования стиля пользователя. Для генерации фото двойника мы применяем ID-эмбеддинги, которые клонируют внешность по одной фотографии за несколько секунд. Синтез голоса осуществляется с помощью инструментов вроде ElevenLabs. Для создания реалистичных говорящих голов используются MuseV, а MuseTalk для липсинка, но для этой задачи можно применить и другие инструменты, типа Ex-human или D-ID.
Цифровое «Я»: Ежедневно генерируется биография и мысли виртуального «Я» с учетом обратной связи от пользователей. Используя подход Retrieval-Augmented Generation (RAG), мы сохраняем биографию блогера в семантической базе данных. Перед созданием нового контента автономный блогер «рефлексирует», обращаясь к своему прошлому опыту. Это делает его поведение консистентным и придает глубину его личности.
Pygma AI помогает реальным блогерам автоматизировать процессы создания контента и повышать вовлеченность аудитории. Наше решение оказалось успешным: мы стали продуктом дня и недели на Product Hunt. Вы можете загрузить одну или несколько своих фото в Pygma AI и получить своего цифрового двойника совершенно бесплатно.
Создание целых ферм синтетических инфлюенсеров может использоваться для продвижения пропаганды или определенных идеологий, и это поднимает серьезные этические проблемы. Могут ли эти цифровые личности влиять на общественное мнение так же, как и реальные люди? Как отличить синтетического блогера от человека, и должны ли мы это делать? Эти вопросы требуют осознания и обсуждения как со стороны разработчиков и компаний, так и со стороны общества. В конечном итоге, эти технологии должны дополнять человеческий опыт, а не вводить людей в заблуждение.
#кейсы
Как за 5 шагов научить ChatGPT генерировать тексты, которые обходят ИИ-детекторы
Однажды мне предложили поучаствовать в проекте для одного стартапа, в котором ИИ должен был писать школьникам и студентам эссе и статьи, способные обойти системы антиплагиата и ИИ-детекторы. ИИ и так довольно неплохо справляется с системами антиплагиата, а вот обходить ИИ-детекторы — задача интересная.
ИИ-детекторы вроде GPTZero работают следующим образом:
• Используется модель детектирования, обученная на данных студенческих работ;
• Проверяется, насколько текст в целом похож на то, как пишет ИИ. Текст, написанный человеком, стилистически неоднороден. ИИ создает текст по другим принципам и это нетрудно определить;
• Для выявления смешанных текстов проводится дополнительное исследование, чтобы выявить, какие конкретно предложения написаны ИИ;
• Для этого после каждого слова в предложении языковая модель предполагает, какое слово будет следующим. Она проверяет, совпадают ли предположения с текстом, и делает выводы на основе количества совпадений.
Как сделать так, чтобы языковая модель начала генерировать человекоподобный текст? Я решил задачу следующим образом:
1. Скачал множество эссе на различные тематики и разного размера c сайта, где выкладываются эссе, получился датасет. Наличие качественного и разнообразного набора человеческих текстов позволяет модели лучше понимать, какие особенности отличают человеческий текст от машинного.
2. Каждое из эссе я проверил через GPTZero на то, что оно действительно написано человеком.
3. Задал промпт ChatGPT, в котором попросил переписать эти тексты, и на выходе получил сгенерированные тексты. Теперь у меня были пары текстов — до и после обработки нейросетью. Это необходимо для последующего обучения модели имитации человеческого стиля.
4. Из полученных пар текстов собрал датасет для файнтюнинга модели: для первого раза хватило десяти экземпляров.
5. Загрузил полученный датасет на платформу OpenAI, задав стандартные параметры для дообучения модели (файнтюнинга). В результате модель научилась имитировать стилистику, интонацию и вариативность, характерные для человеческого письма.
PROFIT. Теперь полученная модель понимает, как люди пишут тексты, и легко обходит проверки ИИ-детекторов. Школьники и студенты спасены. OpenAI пытается решить эту проблему с помощью вотермарков, но нам всегда будут доступны опенсорсные LLM.
Но если нам нужно генерировать не просто эссе, а статьи, ссылаясь на определенные источники, придется немного поколдовать. Обычно для таких задач применяется RAG (Retrieval-Augmented-Generation).
RAG — это метод, который ищет релевантные документы из большой базы данных, а затем использует эту информацию для формирования ответа.
В задаче по написанию статей для студентов я собрал данные из различных источников: ArXiv, SocArXiv и BioArXiv и настроил автоматический сбор свежих статей. После чего поднял векторную базу данных ChromaDB и определил алгоритм поиска информации в базе, использовал косинусное расстояние. Нарезал статьи на чанки (минимальные фрагменты текста, в нашем случае абзацы) и настроил индексацию абзацев.
Когда пользователь задает тему статьи, языковая модель создает ее оглавление и под каждую главу запускает поиск информации в векторной базе, возвращает найденный абзац в перегенерированном под контекст виде, а также ссылку на статью. В итоге статья содержит не только факты, но и ссылки на найденные работы.
Стартап, которому я помог, сегодня зарабатывает более $1 млн MRR. С одной стороны, такая технология кажется не совсем этичной, и непонятно, как ей противодействовать.
С другой стороны, кажется, что это проблема не технологии, а системы образования: в мире, где вся информация легко доступна, и есть системы, которые могут ее обрабатывать, выступая в роли внешнего носителя памяти и логического процессора, пора учить людей чему-то другому. Прежде всего – тому, как рассуждать самостоятельно, чтобы не стать рабом таких систем.
#кейсы
Однажды мне предложили поучаствовать в проекте для одного стартапа, в котором ИИ должен был писать школьникам и студентам эссе и статьи, способные обойти системы антиплагиата и ИИ-детекторы. ИИ и так довольно неплохо справляется с системами антиплагиата, а вот обходить ИИ-детекторы — задача интересная.
ИИ-детекторы вроде GPTZero работают следующим образом:
• Используется модель детектирования, обученная на данных студенческих работ;
• Проверяется, насколько текст в целом похож на то, как пишет ИИ. Текст, написанный человеком, стилистически неоднороден. ИИ создает текст по другим принципам и это нетрудно определить;
• Для выявления смешанных текстов проводится дополнительное исследование, чтобы выявить, какие конкретно предложения написаны ИИ;
• Для этого после каждого слова в предложении языковая модель предполагает, какое слово будет следующим. Она проверяет, совпадают ли предположения с текстом, и делает выводы на основе количества совпадений.
Как сделать так, чтобы языковая модель начала генерировать человекоподобный текст? Я решил задачу следующим образом:
1. Скачал множество эссе на различные тематики и разного размера c сайта, где выкладываются эссе, получился датасет. Наличие качественного и разнообразного набора человеческих текстов позволяет модели лучше понимать, какие особенности отличают человеческий текст от машинного.
2. Каждое из эссе я проверил через GPTZero на то, что оно действительно написано человеком.
3. Задал промпт ChatGPT, в котором попросил переписать эти тексты, и на выходе получил сгенерированные тексты. Теперь у меня были пары текстов — до и после обработки нейросетью. Это необходимо для последующего обучения модели имитации человеческого стиля.
4. Из полученных пар текстов собрал датасет для файнтюнинга модели: для первого раза хватило десяти экземпляров.
5. Загрузил полученный датасет на платформу OpenAI, задав стандартные параметры для дообучения модели (файнтюнинга). В результате модель научилась имитировать стилистику, интонацию и вариативность, характерные для человеческого письма.
PROFIT. Теперь полученная модель понимает, как люди пишут тексты, и легко обходит проверки ИИ-детекторов. Школьники и студенты спасены. OpenAI пытается решить эту проблему с помощью вотермарков, но нам всегда будут доступны опенсорсные LLM.
Но если нам нужно генерировать не просто эссе, а статьи, ссылаясь на определенные источники, придется немного поколдовать. Обычно для таких задач применяется RAG (Retrieval-Augmented-Generation).
RAG — это метод, который ищет релевантные документы из большой базы данных, а затем использует эту информацию для формирования ответа.
В задаче по написанию статей для студентов я собрал данные из различных источников: ArXiv, SocArXiv и BioArXiv и настроил автоматический сбор свежих статей. После чего поднял векторную базу данных ChromaDB и определил алгоритм поиска информации в базе, использовал косинусное расстояние. Нарезал статьи на чанки (минимальные фрагменты текста, в нашем случае абзацы) и настроил индексацию абзацев.
Когда пользователь задает тему статьи, языковая модель создает ее оглавление и под каждую главу запускает поиск информации в векторной базе, возвращает найденный абзац в перегенерированном под контекст виде, а также ссылку на статью. В итоге статья содержит не только факты, но и ссылки на найденные работы.
Стартап, которому я помог, сегодня зарабатывает более $1 млн MRR. С одной стороны, такая технология кажется не совсем этичной, и непонятно, как ей противодействовать.
С другой стороны, кажется, что это проблема не технологии, а системы образования: в мире, где вся информация легко доступна, и есть системы, которые могут ее обрабатывать, выступая в роли внешнего носителя памяти и логического процессора, пора учить людей чему-то другому. Прежде всего – тому, как рассуждать самостоятельно, чтобы не стать рабом таких систем.
#кейсы