Новый Hedra Character-3 — первая омнимодальная модель, которая одновременно думает в тексте, картинках и звуке.
Собрали всё в одном: text-to-video, audio-to-video, генерация персонажей с сохранением стиля, динамические фоны. Прямотаки новая ступень эволюции видеогенерации.
Надо тестить самому! Сколько осталось инфлюенсерам?
Сергей Булаев AI 🤖 - об AI и не только
Собрали всё в одном: text-to-video, audio-to-video, генерация персонажей с сохранением стиля, динамические фоны. Прямотаки новая ступень эволюции видеогенерации.
Надо тестить самому! Сколько осталось инфлюенсерам?
Сергей Булаев AI 🤖 - об AI и не только
#КриповаяСуббота
Пока мы возимся с моделями ИИ, Cortical Labs зарелизили нечто ИНОЕ - CL1, первый в мире коммерчески доступный биологический компьютер на живых (искуственно выращенных) человеческих нейронах. И это не лабораторный эксперимент - они реально продают эти штуки по $35,000!
Самое удивительное здесь - "тело-в-коробке" (пророчество великого классика начинает сбываться) для этих нейронов. В CL1 встроена миниатюрная система жизнеобеспечения со всем необходимым для поддержания клеток в живом состоянии до шести месяцев - регулирование кислорода, доставка питательных веществ, удаление отходов и поддержание идеальной температуры 37°C. Никаких внешних инкубаторов не требуется!
Что же умеют эти био компьютеры? Они освоили игру в Pong всего за несколько часов - то, на что обычным моделям ИИ потребовалось бы гораздо больше времени. Нейроны могут невероятно быстро перестраивать свои связи, что делает их идеальными для обучения с подкреплением.
Стойка из 30 устройств CL1 потребляет всего 850-1000 ватт. Для сравнения, обучение модели типа GPT-3 требует около 1,300 МЕГАВАТТ-часов. Это разница в несколько порядков! Человеческие нейроны просто обрабатывают информацию гораздо эффективнее кремния.
Применения просто сумасшедшие - от тестирования лекарств от Альцгеймера на нейронах, полученных от реальных пациентов (вместо использования животных моделей), до создания роботов, которые могут адаптироваться к окружающей среде в реальном времени. Исследователи могут наблюдать, как нейроны формируют связи в реальном времени с помощью флуоресцентной микроскопии.
Конечно, эта технология поднимает и этические вопросы. Cortical Labs настаивает, что эти нейронные сети не обладают сознанием, но всё равно создали этический комитет и внедрили защитные механизмы, которые отключают систему, если нейронная сложность превышает определенные уровни. Лучше перестраховаться, когда имеешь дело с клетками человеческого мозга!
Что дальше? Они уже работают над объединением нескольких устройств CL1 в серверные стойки и движутся в сторону создания "Минимально Жизнеспособных Мозгов" с 3D-нейронными структурами. Границы между биологией и технологией становится всё более размытой.
Сергей Булаев AI 🤖 - об AI и не только
Пока мы возимся с моделями ИИ, Cortical Labs зарелизили нечто ИНОЕ - CL1, первый в мире коммерчески доступный биологический компьютер на живых (искуственно выращенных) человеческих нейронах. И это не лабораторный эксперимент - они реально продают эти штуки по $35,000!
Самое удивительное здесь - "тело-в-коробке" (пророчество великого классика начинает сбываться) для этих нейронов. В CL1 встроена миниатюрная система жизнеобеспечения со всем необходимым для поддержания клеток в живом состоянии до шести месяцев - регулирование кислорода, доставка питательных веществ, удаление отходов и поддержание идеальной температуры 37°C. Никаких внешних инкубаторов не требуется!
Что же умеют эти био компьютеры? Они освоили игру в Pong всего за несколько часов - то, на что обычным моделям ИИ потребовалось бы гораздо больше времени. Нейроны могут невероятно быстро перестраивать свои связи, что делает их идеальными для обучения с подкреплением.
Стойка из 30 устройств CL1 потребляет всего 850-1000 ватт. Для сравнения, обучение модели типа GPT-3 требует около 1,300 МЕГАВАТТ-часов. Это разница в несколько порядков! Человеческие нейроны просто обрабатывают информацию гораздо эффективнее кремния.
Применения просто сумасшедшие - от тестирования лекарств от Альцгеймера на нейронах, полученных от реальных пациентов (вместо использования животных моделей), до создания роботов, которые могут адаптироваться к окружающей среде в реальном времени. Исследователи могут наблюдать, как нейроны формируют связи в реальном времени с помощью флуоресцентной микроскопии.
Конечно, эта технология поднимает и этические вопросы. Cortical Labs настаивает, что эти нейронные сети не обладают сознанием, но всё равно создали этический комитет и внедрили защитные механизмы, которые отключают систему, если нейронная сложность превышает определенные уровни. Лучше перестраховаться, когда имеешь дело с клетками человеческого мозга!
Что дальше? Они уже работают над объединением нескольких устройств CL1 в серверные стойки и движутся в сторону создания "Минимально Жизнеспособных Мозгов" с 3D-нейронными структурами. Границы между биологией и технологией становится всё более размытой.
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Играю в Hedra Character 3, глючит жёстко, отказывается от генераций постоянно. С ошибками и без. Просто не создаёт и всё. Но иногда что то прикольное выходит. Хотелось бы стабильности для экспериментов.
Сергей Булаев AI 🤖 - об AI и не только
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Сергей Булаев AI 🤖 - об AI и не только
Смотрите, первый в мире ИИ-инвестор, выписывает чек на $100k! Зовут её No Cap. 🚫🧢
Основатель Wonder Family Артём Голдман получил подписанный SAFE и деньги. На финальном звонке No Cap управилась за 3 минуты: подписала документы, перевела $100k, познакомила с пятью новыми инвесторами и даже подкинула контакт потенциального сотрудника. Эффективность - огонь!
Я в прошлом году убил десятки часов на общение с инвесторами, и продолжаю тратить 2-3 в неделю. А тут - раз, и за 3 и готово!
No Cap обучали на более чем 60 выпускниках Y Combinator (сами ребята тоже оттуда), и они называют себя "No Cap Mafia". На звонке, она говорит, что не собирается на Burning Man, и вообще общаться с ней можно 24/7, но только если сам фаундер этого захочет.
Готовимся к следующему уровню: ИИ инвестор встречает ИИ фаундера.
UPD: Внезапно понял что как то не раскрыт вопрос как ей позвонить и передать данные для ваера :)
Сергей Булаев AI 🤖 - об AI и не только
Основатель Wonder Family Артём Голдман получил подписанный SAFE и деньги. На финальном звонке No Cap управилась за 3 минуты: подписала документы, перевела $100k, познакомила с пятью новыми инвесторами и даже подкинула контакт потенциального сотрудника. Эффективность - огонь!
Я в прошлом году убил десятки часов на общение с инвесторами, и продолжаю тратить 2-3 в неделю. А тут - раз, и за 3 и готово!
No Cap обучали на более чем 60 выпускниках Y Combinator (сами ребята тоже оттуда), и они называют себя "No Cap Mafia". На звонке, она говорит, что не собирается на Burning Man, и вообще общаться с ней можно 24/7, но только если сам фаундер этого захочет.
Готовимся к следующему уровню: ИИ инвестор встречает ИИ фаундера.
UPD: Внезапно понял что как то не раскрыт вопрос как ей позвонить и передать данные для ваера :)
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Новый Responses API от OpenAI
OpenAI выкатили новый Responses API - объединение Chat Completions и Assistants API! Наконец-то не нужно выбирать между простотой использования и функциональностью.
Что в нём клёвого:
Для тех, кто уже вложился в Assistants API - без паники! OpenAI обещает целый год на миграцию с полной поддержкой, включая перенос assistant-подобных объектов, code interpreter и вебхуков.
Responses API доступен уже сейчас всем разработчикам и работает со стандартными тарифами на токены и инструменты.
Сергей Булаев AI 🤖 - об AI и не только
OpenAI выкатили новый Responses API - объединение Chat Completions и Assistants API! Наконец-то не нужно выбирать между простотой использования и функциональностью.
Что в нём клёвого:
- Объединяет возможности обоих API в один интерфейс
- Упрощает интеграцию инструментов по сравнению с Assistants API
- По умолчанию сохраняет историю чата (бесплатно на 30 дней)
- Можно включить режим без состояния (как Chat Completions)
Для тех, кто уже вложился в Assistants API - без паники! OpenAI обещает целый год на миграцию с полной поддержкой, включая перенос assistant-подобных объектов, code interpreter и вебхуков.
Responses API доступен уже сейчас всем разработчикам и работает со стандартными тарифами на токены и инструменты.
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Разработчики Luma AI забили очередной гвоздь в крышку гроба диффузии. Их новый подход, Inductive Moment Matching (IMM), вроде бы решает фундаментальные ограничения текущих моделей генерации.
Интересно тут что проблема застоя в ИИ не в нехватке данных, а в отсутствии алгоритмических инноваций. IMM позволяет генерировать контент за несколько шагов вместо десятков итераций, что просто подрывает представления о скорости генерации.
Этот всё заметно упрощает создание приложений использующих генерацию в реальном времени.
Сергей Булаев AI 🤖 - об AI и не только
Интересно тут что проблема застоя в ИИ не в нехватке данных, а в отсутствии алгоритмических инноваций. IMM позволяет генерировать контент за несколько шагов вместо десятков итераций, что просто подрывает представления о скорости генерации.
Этот всё заметно упрощает создание приложений использующих генерацию в реальном времени.
Сергей Булаев AI 🤖 - об AI и не только
Google выпустил Gemma 3 – новую линейку мультимодальных моделей, которые работают как с текстом, так и с изображениями. Поддержка видео пока отсутствует :))
В линейке четыре модели: 1B, 4B, 12B и 27B параметров. Самое интересное, что даже младшая 4B версия уже обходит по качеству старшую Gemma 2 с 9B параметров. А 27B-модель вообще творит чудеса – на EQ-Bench она заняла второе место в категории креативного письма.
Технические характеристики:
На практике есть несколько нюансов:
В поведении пользователи отмечают сходство 27B-модели с Sonnet 3.7 – она даёт подробные ответы даже на простые вопросы. Есть интересные наблюдения, что модель иногда "знает" информацию после своей предполагаемой даты отсечки 2021 года.
Так же появился Gemmaverse - портал с кейсами и проектами использующими модель.
Все модели уже доступны на Google AI Studio и Hugging Face, а также добавлены в Ollama. Для использования в своих проектах стоит обратить внимание на двойные BOS-токены при деплое.
Сергей Булаев AI 🤖 - об AI и не только
В линейке четыре модели: 1B, 4B, 12B и 27B параметров. Самое интересное, что даже младшая 4B версия уже обходит по качеству старшую Gemma 2 с 9B параметров. А 27B-модель вообще творит чудеса – на EQ-Bench она заняла второе место в категории креативного письма.
Технические характеристики:
- Контекстное окно: 128K токенов для крупных моделей и 32K для 1B
- Выходной контекст: до 8192 токенов
- Рейтинг ELO на Chatbot Arena: 1338 (выше DeepSeek V3 671B)
- VRAM для 27B модели: примерно 45GB
На практике есть несколько нюансов:
- Есть проблемы с обещанной поддержкой tool calling
- Модели часто крашатся в
ollama
- Некоторые платформы (например, Transformers) пока не распознают архитектуру
- На AIstudio наблюдаются проблемы с вводом изображений для gemma-3-27b-it
В поведении пользователи отмечают сходство 27B-модели с Sonnet 3.7 – она даёт подробные ответы даже на простые вопросы. Есть интересные наблюдения, что модель иногда "знает" информацию после своей предполагаемой даты отсечки 2021 года.
Так же появился Gemmaverse - портал с кейсами и проектами использующими модель.
Все модели уже доступны на Google AI Studio и Hugging Face, а также добавлены в Ollama. Для использования в своих проектах стоит обратить внимание на двойные BOS-токены при деплое.
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Свежая партия из 170+ стартапов зимнего набора YC 2025 уже на подходе! В этот раз подборка особенно сильная - и основатели с видением, и технологии на острие. Вот несколько отборных проектов:
Mastra: TypeScript-фреймворк для создания ИИ-агентов. Вот вам NotebookLM на его базе.
Browser Use: Открытый веб-агент с 40 тысячами звёзд на GitHub. Есть даже интерфейс. (на приложенном видео)
Edexia: ИИ-ассистент для проверки учебных работ.
Harper: Страховой брокер с нативной ИИ-интеграцией.
Artificial Societies: ИИ для симуляции целых человеческих сообществ (Представьте что ваш пост завирусился до того как вы его выложили).
Onlook: позволяет визуально редактировать ваши React-сайты или веб-приложения и вносить изменения в код в режиме реального времени. Типа Cursor для дизайнеров.
A1Base: API для предоставления ИИ-агентам телефонного номера, электронной почты и надёжной идентификации. "Twilio для ИИ-агентов"
Misprint, Inc.: "Robinhood для карточек Покемон" (да, серьёзно!)
assistant-ui: Опенсорсная React.js библиотека для ИИ-чатов. Красивая.
Adam: самый быстрый способ превратить идеи в реальность. Опишите ваш прототип, и он появятся на свет. ИИ-инструменты для проектирования САПР
a0.dev: Создание мобильных приложений с помощью ИИ "за минуты"
Mosaic: Команда ИИ агентов для редактирования видео
Trata: ИИ база данных инвестиционных исследований от анонимных аналитиков хедж-фондов - крупнейшая в мире.
Сергей Булаев AI 🤖 - об AI и не только
Mastra: TypeScript-фреймворк для создания ИИ-агентов. Вот вам NotebookLM на его базе.
Browser Use: Открытый веб-агент с 40 тысячами звёзд на GitHub. Есть даже интерфейс. (на приложенном видео)
Edexia: ИИ-ассистент для проверки учебных работ.
Harper: Страховой брокер с нативной ИИ-интеграцией.
Artificial Societies: ИИ для симуляции целых человеческих сообществ (Представьте что ваш пост завирусился до того как вы его выложили).
Onlook: позволяет визуально редактировать ваши React-сайты или веб-приложения и вносить изменения в код в режиме реального времени. Типа Cursor для дизайнеров.
A1Base: API для предоставления ИИ-агентам телефонного номера, электронной почты и надёжной идентификации. "Twilio для ИИ-агентов"
Misprint, Inc.: "Robinhood для карточек Покемон" (да, серьёзно!)
assistant-ui: Опенсорсная React.js библиотека для ИИ-чатов. Красивая.
Adam: самый быстрый способ превратить идеи в реальность. Опишите ваш прототип, и он появятся на свет. ИИ-инструменты для проектирования САПР
a0.dev: Создание мобильных приложений с помощью ИИ "за минуты"
Mosaic: Команда ИИ агентов для редактирования видео
Trata: ИИ база данных инвестиционных исследований от анонимных аналитиков хедж-фондов - крупнейшая в мире.
Сергей Булаев AI 🤖 - об AI и не только
Media is too big
VIEW IN TELEGRAM
Часть 1.
Текст - новая модель OpenAI, перевод - Claude, озвучка - Elevenlabs, изображение - Flux, ракурсы - новая гемини, которая редактирует картинки промтами ну и видео - Hedra Character 3.
Сергей Булаев AI 🤖 - об AI и не только
Текст - новая модель OpenAI, перевод - Claude, озвучка - Elevenlabs, изображение - Flux, ракурсы - новая гемини, которая редактирует картинки промтами ну и видео - Hedra Character 3.
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Так, у нас новая рубрика - подкаст #СкорбнаяПятница с Васей в главной роли.
Первый выпуск о свежих новостях прошедшей недели.
Генерировалось почти полностью автоматически. Единственное, Hedra Charcter 3 не досупна пока через API, потому пришлось использовать вторую.
Сергей Булаев AI 🤖 - об AI и не только
Первый выпуск о свежих новостях прошедшей недели.
Генерировалось почти полностью автоматически. Единственное, Hedra Charcter 3 не досупна пока через API, потому пришлось использовать вторую.
Сергей Булаев AI 🤖 - об AI и не только
Вайб Кодинг (VIBE CODING) 🧠✨
#ИИНЦИКЛОПЕДИЯ
Когда ты не пишешь код, а просто объясняешь свои желания ИИ
История появления: Термин придумал Андрей Карпаты в феврале 2025-го, описывая свой опыт работы с ИИ-ассистентами в программировании. Тогда он сказал, что "полностью поддался вайбу" и "забыл, что код вообще существует".
Почему это важно: Vibe Coding радикально меняет программирование, делая его доступным для всех. Вместо изучения языков и синтаксиса, люди описывают задачи простыми словами, а ИИ превращает их в работающий код.
Ключевые особенности:
Применение на практике: Y Combinator сообщает, что 25% стартапов из зимнего набора 2025 имеют кодовые базы, на 95% сгенерированные искусственным интеллектом. Журналист New York Times Кевин Роуз создал несколько приложений, включая анализатор содержимого холодильника, который предлагает, что приготовить на обед.
Каждый раз, когда я работаю с Cursor Composer, ловлю себя на мысли, что уже не "программирую", а веду диалог. Прошу его рефакторить большие файлы, добавлять новый функционал, починить баги - и он делает это быстрее, чем я вспоминаю правильный синтаксис TypeScript.
Подводные камни: При всех плюсах, vibe coding создаёт риски. Код может работать, но быть неоптимальным или содержать скрытые уязвимости. Как говорят опытные программисты: "всё весело, пока не приходится vibe-дебажить".
Что почитать/посмотреть: моё видео как начать простейший проект с Composer, инструменты Cursor Composer и Replit Agent, статья в Business Insider "Silicon Valley's latest buzzword".
Сергей Булаев AI 🤖 - об AI и не только
#ИИНЦИКЛОПЕДИЯ
Когда ты не пишешь код, а просто объясняешь свои желания ИИ
История появления: Термин придумал Андрей Карпаты в феврале 2025-го, описывая свой опыт работы с ИИ-ассистентами в программировании. Тогда он сказал, что "полностью поддался вайбу" и "забыл, что код вообще существует".
Почему это важно: Vibe Coding радикально меняет программирование, делая его доступным для всех. Вместо изучения языков и синтаксиса, люди описывают задачи простыми словами, а ИИ превращает их в работающий код.
Ключевые особенности:
- Общение с ИИ голосом или текстом, минимальное использование клавиатуры
- Фокус на описании желаемого результата, а не процесса его достижения
- Копипаст ошибок обратно ИИ без объяснений - пусть сам разбирается
- Создание "программ для одного" - персонализированных решений под конкретные нужды
Применение на практике: Y Combinator сообщает, что 25% стартапов из зимнего набора 2025 имеют кодовые базы, на 95% сгенерированные искусственным интеллектом. Журналист New York Times Кевин Роуз создал несколько приложений, включая анализатор содержимого холодильника, который предлагает, что приготовить на обед.
Каждый раз, когда я работаю с Cursor Composer, ловлю себя на мысли, что уже не "программирую", а веду диалог. Прошу его рефакторить большие файлы, добавлять новый функционал, починить баги - и он делает это быстрее, чем я вспоминаю правильный синтаксис TypeScript.
Подводные камни: При всех плюсах, vibe coding создаёт риски. Код может работать, но быть неоптимальным или содержать скрытые уязвимости. Как говорят опытные программисты: "всё весело, пока не приходится vibe-дебажить".
Что почитать/посмотреть: моё видео как начать простейший проект с Composer, инструменты Cursor Composer и Replit Agent, статья в Business Insider "Silicon Valley's latest buzzword".
Сергей Булаев AI 🤖 - об AI и не только