This media is not supported in your browser
VIEW IN TELEGRAM
Разработчики Luma AI забили очередной гвоздь в крышку гроба диффузии. Их новый подход, Inductive Moment Matching (IMM), вроде бы решает фундаментальные ограничения текущих моделей генерации.
Интересно тут что проблема застоя в ИИ не в нехватке данных, а в отсутствии алгоритмических инноваций. IMM позволяет генерировать контент за несколько шагов вместо десятков итераций, что просто подрывает представления о скорости генерации.
Этот всё заметно упрощает создание приложений использующих генерацию в реальном времени.
Сергей Булаев AI 🤖 - об AI и не только
Интересно тут что проблема застоя в ИИ не в нехватке данных, а в отсутствии алгоритмических инноваций. IMM позволяет генерировать контент за несколько шагов вместо десятков итераций, что просто подрывает представления о скорости генерации.
Этот всё заметно упрощает создание приложений использующих генерацию в реальном времени.
Сергей Булаев AI 🤖 - об AI и не только
Google выпустил Gemma 3 – новую линейку мультимодальных моделей, которые работают как с текстом, так и с изображениями. Поддержка видео пока отсутствует :))
В линейке четыре модели: 1B, 4B, 12B и 27B параметров. Самое интересное, что даже младшая 4B версия уже обходит по качеству старшую Gemma 2 с 9B параметров. А 27B-модель вообще творит чудеса – на EQ-Bench она заняла второе место в категории креативного письма.
Технические характеристики:
На практике есть несколько нюансов:
В поведении пользователи отмечают сходство 27B-модели с Sonnet 3.7 – она даёт подробные ответы даже на простые вопросы. Есть интересные наблюдения, что модель иногда "знает" информацию после своей предполагаемой даты отсечки 2021 года.
Так же появился Gemmaverse - портал с кейсами и проектами использующими модель.
Все модели уже доступны на Google AI Studio и Hugging Face, а также добавлены в Ollama. Для использования в своих проектах стоит обратить внимание на двойные BOS-токены при деплое.
Сергей Булаев AI 🤖 - об AI и не только
В линейке четыре модели: 1B, 4B, 12B и 27B параметров. Самое интересное, что даже младшая 4B версия уже обходит по качеству старшую Gemma 2 с 9B параметров. А 27B-модель вообще творит чудеса – на EQ-Bench она заняла второе место в категории креативного письма.
Технические характеристики:
- Контекстное окно: 128K токенов для крупных моделей и 32K для 1B
- Выходной контекст: до 8192 токенов
- Рейтинг ELO на Chatbot Arena: 1338 (выше DeepSeek V3 671B)
- VRAM для 27B модели: примерно 45GB
На практике есть несколько нюансов:
- Есть проблемы с обещанной поддержкой tool calling
- Модели часто крашатся в
ollama
- Некоторые платформы (например, Transformers) пока не распознают архитектуру
- На AIstudio наблюдаются проблемы с вводом изображений для gemma-3-27b-it
В поведении пользователи отмечают сходство 27B-модели с Sonnet 3.7 – она даёт подробные ответы даже на простые вопросы. Есть интересные наблюдения, что модель иногда "знает" информацию после своей предполагаемой даты отсечки 2021 года.
Так же появился Gemmaverse - портал с кейсами и проектами использующими модель.
Все модели уже доступны на Google AI Studio и Hugging Face, а также добавлены в Ollama. Для использования в своих проектах стоит обратить внимание на двойные BOS-токены при деплое.
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Свежая партия из 170+ стартапов зимнего набора YC 2025 уже на подходе! В этот раз подборка особенно сильная - и основатели с видением, и технологии на острие. Вот несколько отборных проектов:
Mastra: TypeScript-фреймворк для создания ИИ-агентов. Вот вам NotebookLM на его базе.
Browser Use: Открытый веб-агент с 40 тысячами звёзд на GitHub. Есть даже интерфейс. (на приложенном видео)
Edexia: ИИ-ассистент для проверки учебных работ.
Harper: Страховой брокер с нативной ИИ-интеграцией.
Artificial Societies: ИИ для симуляции целых человеческих сообществ (Представьте что ваш пост завирусился до того как вы его выложили).
Onlook: позволяет визуально редактировать ваши React-сайты или веб-приложения и вносить изменения в код в режиме реального времени. Типа Cursor для дизайнеров.
A1Base: API для предоставления ИИ-агентам телефонного номера, электронной почты и надёжной идентификации. "Twilio для ИИ-агентов"
Misprint, Inc.: "Robinhood для карточек Покемон" (да, серьёзно!)
assistant-ui: Опенсорсная React.js библиотека для ИИ-чатов. Красивая.
Adam: самый быстрый способ превратить идеи в реальность. Опишите ваш прототип, и он появятся на свет. ИИ-инструменты для проектирования САПР
a0.dev: Создание мобильных приложений с помощью ИИ "за минуты"
Mosaic: Команда ИИ агентов для редактирования видео
Trata: ИИ база данных инвестиционных исследований от анонимных аналитиков хедж-фондов - крупнейшая в мире.
Сергей Булаев AI 🤖 - об AI и не только
Mastra: TypeScript-фреймворк для создания ИИ-агентов. Вот вам NotebookLM на его базе.
Browser Use: Открытый веб-агент с 40 тысячами звёзд на GitHub. Есть даже интерфейс. (на приложенном видео)
Edexia: ИИ-ассистент для проверки учебных работ.
Harper: Страховой брокер с нативной ИИ-интеграцией.
Artificial Societies: ИИ для симуляции целых человеческих сообществ (Представьте что ваш пост завирусился до того как вы его выложили).
Onlook: позволяет визуально редактировать ваши React-сайты или веб-приложения и вносить изменения в код в режиме реального времени. Типа Cursor для дизайнеров.
A1Base: API для предоставления ИИ-агентам телефонного номера, электронной почты и надёжной идентификации. "Twilio для ИИ-агентов"
Misprint, Inc.: "Robinhood для карточек Покемон" (да, серьёзно!)
assistant-ui: Опенсорсная React.js библиотека для ИИ-чатов. Красивая.
Adam: самый быстрый способ превратить идеи в реальность. Опишите ваш прототип, и он появятся на свет. ИИ-инструменты для проектирования САПР
a0.dev: Создание мобильных приложений с помощью ИИ "за минуты"
Mosaic: Команда ИИ агентов для редактирования видео
Trata: ИИ база данных инвестиционных исследований от анонимных аналитиков хедж-фондов - крупнейшая в мире.
Сергей Булаев AI 🤖 - об AI и не только
Media is too big
VIEW IN TELEGRAM
Часть 1.
Текст - новая модель OpenAI, перевод - Claude, озвучка - Elevenlabs, изображение - Flux, ракурсы - новая гемини, которая редактирует картинки промтами ну и видео - Hedra Character 3.
Сергей Булаев AI 🤖 - об AI и не только
Текст - новая модель OpenAI, перевод - Claude, озвучка - Elevenlabs, изображение - Flux, ракурсы - новая гемини, которая редактирует картинки промтами ну и видео - Hedra Character 3.
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Так, у нас новая рубрика - подкаст #СкорбнаяПятница с Васей в главной роли.
Первый выпуск о свежих новостях прошедшей недели.
Генерировалось почти полностью автоматически. Единственное, Hedra Charcter 3 не досупна пока через API, потому пришлось использовать вторую.
Сергей Булаев AI 🤖 - об AI и не только
Первый выпуск о свежих новостях прошедшей недели.
Генерировалось почти полностью автоматически. Единственное, Hedra Charcter 3 не досупна пока через API, потому пришлось использовать вторую.
Сергей Булаев AI 🤖 - об AI и не только
Вайб Кодинг (VIBE CODING) 🧠✨
#ИИНЦИКЛОПЕДИЯ
Когда ты не пишешь код, а просто объясняешь свои желания ИИ
История появления: Термин придумал Андрей Карпаты в феврале 2025-го, описывая свой опыт работы с ИИ-ассистентами в программировании. Тогда он сказал, что "полностью поддался вайбу" и "забыл, что код вообще существует".
Почему это важно: Vibe Coding радикально меняет программирование, делая его доступным для всех. Вместо изучения языков и синтаксиса, люди описывают задачи простыми словами, а ИИ превращает их в работающий код.
Ключевые особенности:
Применение на практике: Y Combinator сообщает, что 25% стартапов из зимнего набора 2025 имеют кодовые базы, на 95% сгенерированные искусственным интеллектом. Журналист New York Times Кевин Роуз создал несколько приложений, включая анализатор содержимого холодильника, который предлагает, что приготовить на обед.
Каждый раз, когда я работаю с Cursor Composer, ловлю себя на мысли, что уже не "программирую", а веду диалог. Прошу его рефакторить большие файлы, добавлять новый функционал, починить баги - и он делает это быстрее, чем я вспоминаю правильный синтаксис TypeScript.
Подводные камни: При всех плюсах, vibe coding создаёт риски. Код может работать, но быть неоптимальным или содержать скрытые уязвимости. Как говорят опытные программисты: "всё весело, пока не приходится vibe-дебажить".
Что почитать/посмотреть: моё видео как начать простейший проект с Composer, инструменты Cursor Composer и Replit Agent, статья в Business Insider "Silicon Valley's latest buzzword".
Сергей Булаев AI 🤖 - об AI и не только
#ИИНЦИКЛОПЕДИЯ
Когда ты не пишешь код, а просто объясняешь свои желания ИИ
История появления: Термин придумал Андрей Карпаты в феврале 2025-го, описывая свой опыт работы с ИИ-ассистентами в программировании. Тогда он сказал, что "полностью поддался вайбу" и "забыл, что код вообще существует".
Почему это важно: Vibe Coding радикально меняет программирование, делая его доступным для всех. Вместо изучения языков и синтаксиса, люди описывают задачи простыми словами, а ИИ превращает их в работающий код.
Ключевые особенности:
- Общение с ИИ голосом или текстом, минимальное использование клавиатуры
- Фокус на описании желаемого результата, а не процесса его достижения
- Копипаст ошибок обратно ИИ без объяснений - пусть сам разбирается
- Создание "программ для одного" - персонализированных решений под конкретные нужды
Применение на практике: Y Combinator сообщает, что 25% стартапов из зимнего набора 2025 имеют кодовые базы, на 95% сгенерированные искусственным интеллектом. Журналист New York Times Кевин Роуз создал несколько приложений, включая анализатор содержимого холодильника, который предлагает, что приготовить на обед.
Каждый раз, когда я работаю с Cursor Composer, ловлю себя на мысли, что уже не "программирую", а веду диалог. Прошу его рефакторить большие файлы, добавлять новый функционал, починить баги - и он делает это быстрее, чем я вспоминаю правильный синтаксис TypeScript.
Подводные камни: При всех плюсах, vibe coding создаёт риски. Код может работать, но быть неоптимальным или содержать скрытые уязвимости. Как говорят опытные программисты: "всё весело, пока не приходится vibe-дебажить".
Что почитать/посмотреть: моё видео как начать простейший проект с Composer, инструменты Cursor Composer и Replit Agent, статья в Business Insider "Silicon Valley's latest buzzword".
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Cursor продолжает радовать нас, вайбкодеров, новыми фичами! Вот что недавно добавили:
Сергей Булаев AI 🤖 - об AI и не только
- Checkpoints: автоматические снимки кода при каждой генерации, с возможностью откатиться в любой момент
- Themes: новые темы оформления для комфортной работы, включая тёмные режимы
- Auto-fix Errors: автоматическое обнаружение и исправление ошибок в коде
- @-контекст: улучшенная система для быстрой ссылки на файлы и код в запросах к ИИ
- Navbar: обновлённая навигационная панель для быстрого доступа к функциям
- Previews: предпросмотр изменений перед применением
- History: удобный доступ к истории запросов
- Code Blocks: улучшенная работа с блоками кода, с возможностью применять их одним кликом
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Convergence выпустили DeepWork - новую мультиагентную систему, которая координирует несколько AI агентов для выполнения сложных задач автономно. Пользователи указывают желаемый результат, включают систему, и она делает всё сама. Что то вроде Уже доступно для pro аккаунтов на convergence.ai (у меня не про, но попробовать получилось).
Лично я в последнее время стал фанатом Perplexity Deep Research, использую его по любому удобному случаю:
Конечно, уровень ниже чем у OpenAI, но и стоит гораздо дешевле, работает быстро и самое главное - можно использовать через API. А тут я делал подборку вообще бесплатных альтернатив.
Сергей Булаев AI 🤖 - об AI и не только
Лично я в последнее время стал фанатом Perplexity Deep Research, использую его по любому удобному случаю:
- собрать информацию по API для Composer
- собрать информацию о человеке или компании
- изучить новости по конкретной теме
- найти релевантные исследования
- сравнить разные инструменты и их возможности
Конечно, уровень ниже чем у OpenAI, но и стоит гораздо дешевле, работает быстро и самое главное - можно использовать через API. А тут я делал подборку вообще бесплатных альтернатив.
Сергей Булаев AI 🤖 - об AI и не только
#КриповаяСуббота сегодня с роликом о противостоянии рыцаря с гигантской улиткой. Основано на реальных средневековых манускриптах!
Средневековые монахи почему-то массово рисовали на полях своих книг сражения рыцарей с огромными улитками. Никто толком не знает почему. То ли это метафора на классовую борьбу, то ли древний мем, то ли что-то ещё более странное.
Jer из @EccentrismArt сделал две версии - короткую боевую и расширенную псевдодокументальную. Для создания использовал в основном Freepik Veo2 (и текст-видео, и картинка-видео), плюс один кадр на Luma.
Сергей Булаев AI 🤖 - об AI и не только
Средневековые монахи почему-то массово рисовали на полях своих книг сражения рыцарей с огромными улитками. Никто толком не знает почему. То ли это метафора на классовую борьбу, то ли древний мем, то ли что-то ещё более странное.
Jer из @EccentrismArt сделал две версии - короткую боевую и расширенную псевдодокументальную. Для создания использовал в основном Freepik Veo2 (и текст-видео, и картинка-видео), плюс один кадр на Luma.
Сергей Булаев AI 🤖 - об AI и не только