Понял тут что завел небольшой зоопарк агентов. Есть агент который работает с нами как проджект, есть домашний батлер — управляет умным домом, есть агент тьютор — помогает вести учебные группы, еще есть 4 агента, которые делают медиа. Все на моей архитектуре Open PiPi. Теперь нужен агент-менеджер, который будет ими управлять и следить за порядком 😹
@maxrepost👾 👾 👾
@maxrepost
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2
Forwarded from слИИвки (Дмитрий Тихонов)
ByteDance выкатила Bernini — новую систему для генерации и редактирования видео, где MLLM-модель сначала «планирует» сцену на семантическом уровне, а уже потом диффузионная модель рендерит итоговый ролик. По сути, ИИ сначала думает, потом рисует. 🤯
Проект построен на базе WAN 2.2 и дополнительных чекпоинтах от команды ByteDance, а также моделей, указанных авторами в репозитории. Поддерживаются генерация видео, редактирование, работа с референсами и вставка объектов в готовые ролики.
Потестить можно тут:
bernini-ai.github.io
#AI #VideoGeneration #ByteDance #WAN22 #pepewtfa
Проект построен на базе WAN 2.2 и дополнительных чекпоинтах от команды ByteDance, а также моделей, указанных авторами в репозитории. Поддерживаются генерация видео, редактирование, работа с референсами и вставка объектов в готовые ролики.
Потестить можно тут:
bernini-ai.github.io
#AI #VideoGeneration #ByteDance #WAN22 #pepewtfa
Forwarded from Точки над ИИ
Эксперименты 🐱
Вчера мне попалась в ленте стереограмма (magic eye).
У меня в детстве было две такие книжки, это был мой первый опыт дополненной реальности, думаю они сильно повлияли на мой профессиональный путь, и мне стало интересно протестировать Nano Banana 2 и GPT Image 2, и проверить, умеют ли они создавать такие картинки?
1. Сгенерил промпт:
2. Отдал его GPT Image 2 и Nano Banana 2 (последней включил Google поиск grounding)
3. Далее было 3 итерации правок для каждой модели с уточнением контекста, после чего получились вот эти две картинки.
Стерео-эффект есть на каждой, но, как видите, визуально с самой стартовой картинкой одна модель справилась очень плохо. Тут есть явный лидер, хотя даже у него сама стереокартинка выдает нечеткий результат.
Догадаетесь где какая модель поработала?🤖 💬
Вчера мне попалась в ленте стереограмма (magic eye).
У меня в детстве было две такие книжки, это был мой первый опыт дополненной реальности, думаю они сильно повлияли на мой профессиональный путь, и мне стало интересно протестировать Nano Banana 2 и GPT Image 2, и проверить, умеют ли они создавать такие картинки?
1. Сгенерил промпт:
A Magic Eye / SIRDS-style autostereogram. The entire image is filled edge-to-edge with a dense, seamless, uniformly distributed repeating micro-pattern of tiny colorful cartoon dogs, paw prints, bones, and dog collars — all elements must be small, equal in size, and spread with completely uniform density across the whole image. There must be NO visible silhouette, NO dark outline, NO shadow, NO tonal overlay, NO burned-in shape of any dog or bicycle anywhere in the visible image. The pattern must look 100% uniform — no region should be darker, lighter, or different in any way. The hidden 3D object (a dog riding a bicycle) is encoded ONLY through subtle horizontal pixel-shift variations in the repeating pattern, invisible to the naked eye, and only perceivable when the viewer diverges or relaxes their eyes. The background is black. The style is exactly like a 1990s Magic Eye book page. Do not draw any dog or bicycle as a visible element. Do not composite or overlay any shape on top of the pattern.2. Отдал его GPT Image 2 и Nano Banana 2 (последней включил Google поиск grounding)
3. Далее было 3 итерации правок для каждой модели с уточнением контекста, после чего получились вот эти две картинки.
Стерео-эффект есть на каждой, но, как видите, визуально с самой стартовой картинкой одна модель справилась очень плохо. Тут есть явный лидер, хотя даже у него сама стереокартинка выдает нечеткий результат.
Догадаетесь где какая модель поработала?
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Сиолошная
Пару часов назад Anthropic рассказали, что расширяют Project Glasswing с 50 до 200 компаний (это те, кому будет доступен Mythos). Компании будут покрывать более широкий спектр критических организаций, обнаружение уязвимостей в которых может повлиять на десятки и даже сотни миллионов людей. В этом списке представлены компании из более чем 15 стран. Дальше будет ещё больше.
И сразу вслед за этим президент США подписал AI Executive Order, про который ходили слухи с месяц назад. В нём делается упор на кибербезопасность — федеральные агентства США теперь должны за 60 дней сделать приватный бенчмарк😀 для оценки моделей. По нему будут оценивать, насколько далеко продвинулись модели, и сравнивать с некоторой планкой «критического» уровня — за последнее отвечает NSA.
Далее компании в добровольном порядке должны:
1) предоставлять свои модели до релиза, чтобы их оценили
2) если модель хороша во взломах и поисках уязвимостей, то модель может быть предоставлена федеральному правительству в срок до 30 дней до публичного релиза
3) федеральные агентства должны использовать модель чтобы найти и исправить у себя уязвимости в критически важных системах
За всё платит DoD (DoW)😇
Отдельно в приказе прописано, что запрещается трактовать этот указ как введение обязательного государственного лицензирования или разрешительной системы для выпуска ИИ-моделей
И сразу вслед за этим президент США подписал AI Executive Order, про который ходили слухи с месяц назад. В нём делается упор на кибербезопасность — федеральные агентства США теперь должны за 60 дней сделать приватный бенчмарк
Далее компании в добровольном порядке должны:
1) предоставлять свои модели до релиза, чтобы их оценили
2) если модель хороша во взломах и поисках уязвимостей, то модель может быть предоставлена федеральному правительству в срок до 30 дней до публичного релиза
3) федеральные агентства должны использовать модель чтобы найти и исправить у себя уязвимости в критически важных системах
За всё платит DoD (DoW)
Отдельно в приказе прописано, что запрещается трактовать этот указ как введение обязательного государственного лицензирования или разрешительной системы для выпуска ИИ-моделей
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Мысли Рвачева
🧩 UX-паттерны для AI - как встраивать его в продукт, не сводя все к чату.
AI плотно влезает во все инструменты, которые мы используем каждый день. Первый шаг везде - прикрутить чат как у ChatGPT. Очевидно не лучшее решение для большинства задач.
Ребята из shapeof.ai собрали библиотеку UX-паттернов для AI: шесть категорий - от Wayfinders (помочь стартовать без чистого листа) до Trust Builders (watermarks, disclosure, контроль данных).
Несколько примеров, которые мне понравились:
- Inline Action - вместо отдельного окна кнопка "спроси AI" рядом с тем, что уже есть на странице. Контекст подтягивается автоматически, без копипасты в чат.
- Inpainting - выделил кусок картинки или текста, попросил перегенерировать только его. Как в Photoshop, но для любого AI-вывода.
- Madlibs - вместо открытого prompt-а форма с пропусками: "напиши email для [компания] про [боль клиента]". Структурировано, повторяемо, не разваливается на длинной дистанции.
https://www.shapeof.ai/
Строите продукт с AI - обязательно поизучайте.
#ai #ux #design #product
—————————
Мысли Рвачева
—————————
AI плотно влезает во все инструменты, которые мы используем каждый день. Первый шаг везде - прикрутить чат как у ChatGPT. Очевидно не лучшее решение для большинства задач.
Ребята из shapeof.ai собрали библиотеку UX-паттернов для AI: шесть категорий - от Wayfinders (помочь стартовать без чистого листа) до Trust Builders (watermarks, disclosure, контроль данных).
Несколько примеров, которые мне понравились:
- Inline Action - вместо отдельного окна кнопка "спроси AI" рядом с тем, что уже есть на странице. Контекст подтягивается автоматически, без копипасты в чат.
- Inpainting - выделил кусок картинки или текста, попросил перегенерировать только его. Как в Photoshop, но для любого AI-вывода.
- Madlibs - вместо открытого prompt-а форма с пропусками: "напиши email для [компания] про [боль клиента]". Структурировано, повторяемо, не разваливается на длинной дистанции.
https://www.shapeof.ai/
Строите продукт с AI - обязательно поизучайте.
#ai #ux #design #product
—————————
Мысли Рвачева
—————————
✍1
Claude прилег во многих странах. Выдает Error: 529 Overloaded. Видимо газ в пол перед IPO до добра не довел.
Лишнее напоминание — не делайте ставку на одного провайдера AI, делайте фолбеки и держите проекты и контекст переносимыми.
@maxrepost👾
Лишнее напоминание — не делайте ставку на одного провайдера AI, делайте фолбеки и держите проекты и контекст переносимыми.
@maxrepost
Please open Telegram to view this post
VIEW IN TELEGRAM
💯4
Forwarded from AI Product | Igor Akimov
This media is not supported in your browser
VIEW IN TELEGRAM
Codex теперь умеет выкладывать внутренние приложения
OpenAI зашёл на территорию Lovable и Replit, но пока только для внутренних сайтов.
Вчера на стриме «Intelligence at Work» OpenAI выкатил сразу три апдейта для Codex: шесть ролевых плагинов под бизнес-задачи, аннотации и – самое интересное – Sites.
Это плагин + managed-хостинг прямо внутри Codex. Просишь собрать приложение – Codex его строит, прогоняет, деплоит и возвращает ссылку, которую можно расшарить по воркспейсу. Весь цикл в одном треде, без ручной возни с инстансами и регионами (привет всем, кто пытался захостить локально собранное приложение в GCP или AWS).
Целятся во внутренние инструменты: онбординг-дашборды, базы знаний, борды для идей, репортинг-вью, лёгкие воркфлоу-приложения. То есть не «лендинг запилить», а «превратить рутину команды в живое приложение».
Добавили 2 фичи для хранения:
– D1 – SQLite-совместимая база под структурку: состояние чеклистов, закладки, фильтры, конфиги, метаданные файлов
– R2 – объектное хранилище под сами файлы: документы, картинки, ассеты
Любопытная деталь: D1 и R2 – это вообще-то названия продуктов Cloudflare. То есть «хостинг от OpenAI» под капотом едет на Cloudflare – OpenAI не строит инфру сам, а заворачивает чужую под свой бренд и свою авторизацию.
По дефолту приложение видят только владелец и админы воркспейса. Дальше открываешь либо на весь воркспейс (workspace_all), либо точечно на людей и группы (custom). Авторизация – через Sign in with ChatGPT. Пока превью для Business и Enterprise.
В общем, всем ChatGPT, пожираем всех ближайших конкурентов и GPT-врапперы.
https://developers.openai.com/codex/sites
OpenAI зашёл на территорию Lovable и Replit, но пока только для внутренних сайтов.
Вчера на стриме «Intelligence at Work» OpenAI выкатил сразу три апдейта для Codex: шесть ролевых плагинов под бизнес-задачи, аннотации и – самое интересное – Sites.
Это плагин + managed-хостинг прямо внутри Codex. Просишь собрать приложение – Codex его строит, прогоняет, деплоит и возвращает ссылку, которую можно расшарить по воркспейсу. Весь цикл в одном треде, без ручной возни с инстансами и регионами (привет всем, кто пытался захостить локально собранное приложение в GCP или AWS).
Целятся во внутренние инструменты: онбординг-дашборды, базы знаний, борды для идей, репортинг-вью, лёгкие воркфлоу-приложения. То есть не «лендинг запилить», а «превратить рутину команды в живое приложение».
Добавили 2 фичи для хранения:
– D1 – SQLite-совместимая база под структурку: состояние чеклистов, закладки, фильтры, конфиги, метаданные файлов
– R2 – объектное хранилище под сами файлы: документы, картинки, ассеты
Любопытная деталь: D1 и R2 – это вообще-то названия продуктов Cloudflare. То есть «хостинг от OpenAI» под капотом едет на Cloudflare – OpenAI не строит инфру сам, а заворачивает чужую под свой бренд и свою авторизацию.
По дефолту приложение видят только владелец и админы воркспейса. Дальше открываешь либо на весь воркспейс (workspace_all), либо точечно на людей и группы (custom). Авторизация – через Sign in with ChatGPT. Пока превью для Business и Enterprise.
В общем, всем ChatGPT, пожираем всех ближайших конкурентов и GPT-врапперы.
https://developers.openai.com/codex/sites
❤2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Молния! Igeogram 4 опенсорснулся!
По бенчам и аренам теперь это лучший опенсорсный генератор картинок.
"Ideogram 4 — это первая модель с открытыми весами от Ideogram. Это базовая модель, обученная с нуля, а не файнтюн существующей модели. Она имеет новый структурированный интерфейс промптов в формате JSON, лучшую в своем классе многоязычную отрисовку текста, глубокое понимание языка, явное управление цветовой палитрой, а также нативное 2K. Аспекты картинок до 6:1"
Всего 9.3B параметров - должно влезать в слабые видеокарты (Qwen-Image - 20B, FLUX.2 [dev] - 32B)
Две версии весов nf4(Cuda) и fp8. Обещают больше квантизаций.
Для гиков:
It is a flow-matching text-to-image model built on a fully single-stream Diffusion Transformer (DiT) architecture.
Fully single-stream DiT. Text and image tokens are concatenated into one unified sequence and processed through the same 34-layer transformer, with no separate text or image branches.
Vision-language model as text encoder. Instead of a text-only encoder like CLIP or T5, Ideogram 4 uses Qwen3-VL-8B-Instruct, a full vision-language model that provides far richer understanding of visual concepts.
Тренировали на JSON разметке, есть промпт улучшайзер и промпт гайд.
Есть какие-то заморочки с цензурой (использование https://thehive.ai/), но думаю народ сейчас быстро выкусит нужный код, если это вообще нужно.
Лицензия - некомерческая. Какая именно, надо разбирацца.
Очень круто сделан гитхаб - все веса, код, инструкции, гайды - по ссылке:
https://github.com/ideogram-oss/ideogram4
Завтра будем разбираться с анатомией, цензурой, текстом, слоями и пр.
Нелокально можно пробовать как у них на сайте, так и на всех аггрегаторах: фал, креа, комфиАПИ, рунваре, магнифик, репликейт..
Всем бессонной ночи!
P.S. Editable text, movable layers, and full image editing are coming soon.
@cgevent
По бенчам и аренам теперь это лучший опенсорсный генератор картинок.
"Ideogram 4 — это первая модель с открытыми весами от Ideogram. Это базовая модель, обученная с нуля, а не файнтюн существующей модели. Она имеет новый структурированный интерфейс промптов в формате JSON, лучшую в своем классе многоязычную отрисовку текста, глубокое понимание языка, явное управление цветовой палитрой, а также нативное 2K. Аспекты картинок до 6:1"
Всего 9.3B параметров - должно влезать в слабые видеокарты (Qwen-Image - 20B, FLUX.2 [dev] - 32B)
Две версии весов nf4(Cuda) и fp8. Обещают больше квантизаций.
Для гиков:
It is a flow-matching text-to-image model built on a fully single-stream Diffusion Transformer (DiT) architecture.
Fully single-stream DiT. Text and image tokens are concatenated into one unified sequence and processed through the same 34-layer transformer, with no separate text or image branches.
Vision-language model as text encoder. Instead of a text-only encoder like CLIP or T5, Ideogram 4 uses Qwen3-VL-8B-Instruct, a full vision-language model that provides far richer understanding of visual concepts.
Тренировали на JSON разметке, есть промпт улучшайзер и промпт гайд.
Есть какие-то заморочки с цензурой (использование https://thehive.ai/), но думаю народ сейчас быстро выкусит нужный код, если это вообще нужно.
Лицензия - некомерческая. Какая именно, надо разбирацца.
Очень круто сделан гитхаб - все веса, код, инструкции, гайды - по ссылке:
https://github.com/ideogram-oss/ideogram4
Завтра будем разбираться с анатомией, цензурой, текстом, слоями и пр.
Нелокально можно пробовать как у них на сайте, так и на всех аггрегаторах: фал, креа, комфиАПИ, рунваре, магнифик, репликейт..
Всем бессонной ночи!
P.S. Editable text, movable layers, and full image editing are coming soon.
@cgevent
😱1
Forwarded from Анализ данных (Data analysis)
В рамках программы Codex for Open Source можно получить:
• 6 месяцев ChatGPT Pro
• доступ к Codex и GPT-5.5 Pro
• API-кредиты
• Codex Security
Заявка простая: нужно отправить ссылку на свой репозиторий и коротко объяснить, зачем проект важен и как Codex поможет его улучшить.
Больше шансов у тех, у кого есть:
• активный GitHub-профиль
• несколько публичных репозиториев
• звёзды на проектах
• нормальная история коммитов
Если у вас есть живой open-source проект, это один из самых простых способов получить ChatGPT Pro на полгода бесплатно.
https://openai.com/ru-RU/form/codex-for-oss/
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Forwarded from TechSparks
Очередная интересная (и символичная) веха: СЕО Cloudflare Мэтью Принс сообщил, что по данным Cloudflare's Radar dashboard боты уже ответственны за 57,5% всего https-трафика, причем ответственны за такую большую долю не старые добрые поисковые боты и им подобные, а ИИ-агенты. Причем некоторое время назад Принс сам же прогнозировал, что человеческий трафик упадет ниже половины к концу 2027, но, оказывается, сильно недооценил скорость развития агентных сценариев.
Суть происходящего он, однако, описывал точно, отмечая, что в поисках товаров, например, фотокамеры, люди в среднем посещают пять сайтов, а агент в процессе решения той же задачки может посетить и 5000. (Кстати, это одна из причин, почему агенты так полезны: сил человеческих не хватит так прочесать интернет, как это сделает хорошо обученный агент.)
Беда, увы, в том, что интернет под такие сценарии никто не оптимизировал, и происходящий сдвиг сравним, по словам того же Принса, с переходом от десктопного графика к мобильному; только там на это ушло десять лет, а сейчас счет идет на месяцы. Так что интернет ожидает сильная и вынужденно быстрая трансформация; будет интересно наблюдать.
https://www.forbes.com/sites/josipamajic/2026/06/04/bots-now-outnumber-humans-online-and-the-internet-was-never-built-for-this/
"Welp, that happened faster than I predicted. Thought it would be end of 2027, then early 2027, but agentic traffic growing so fast that bots have now passed human traffic online for the first time in the Internet's history."
Суть происходящего он, однако, описывал точно, отмечая, что в поисках товаров, например, фотокамеры, люди в среднем посещают пять сайтов, а агент в процессе решения той же задачки может посетить и 5000. (Кстати, это одна из причин, почему агенты так полезны: сил человеческих не хватит так прочесать интернет, как это сделает хорошо обученный агент.)
Беда, увы, в том, что интернет под такие сценарии никто не оптимизировал, и происходящий сдвиг сравним, по словам того же Принса, с переходом от десктопного графика к мобильному; только там на это ушло десять лет, а сейчас счет идет на месяцы. Так что интернет ожидает сильная и вынужденно быстрая трансформация; будет интересно наблюдать.
https://www.forbes.com/sites/josipamajic/2026/06/04/bots-now-outnumber-humans-online-and-the-internet-was-never-built-for-this/
Forbes
Bots Now Outnumber Humans Online And The Internet Was Never Built For This
Bot traffic has surpassed humans on the Internet. The winners in the next infrastructure cycle are the companies building trust rails for machines: agent identity, intent verification, API-native content delivery.
Forwarded from Мы и Жо / медиа и журналистика
Google потихоньку начал выкатывать в Search Console статистику поиска в ИИ (учитываются показы в AI Overviews и AI Mode)
Пока своими глазами не видел, картинка из их поста
Что бросается в глаза:
1) это первый отчет, где есть только impressions и никаких переходов или (понятное дело) CTR
2) такой же отчет будет у Google Discover, и это немного пугает (Google экспериментировал с чем-то вроде ИИ-пересказов в США, пока не ясно, чем закончилось)
Но зато можно посмотреть, какие странички твоего сайта показывал Google и почувствовать что ты нужен хотя бы искусственному интеллекту
Пока своими глазами не видел, картинка из их поста
Что бросается в глаза:
1) это первый отчет, где есть только impressions и никаких переходов или (понятное дело) CTR
2) такой же отчет будет у Google Discover, и это немного пугает (Google экспериментировал с чем-то вроде ИИ-пересказов в США, пока не ясно, чем закончилось)
Но зато можно посмотреть, какие странички твоего сайта показывал Google и почувствовать что ты нужен хотя бы искусственному интеллекту
Forwarded from Futuris (Anton)
Anthropic выпустили большой текст о том, что Claude уже помогает компании делать следующий Claude. По их данным, больше 80% кода внутри Anthropic сейчас пишет сам Claude, а инженеры мержат примерно в 8 раз больше кода, чем в 2024 году. Это ещё не тот сценарий, где ИИ полностью сам создаёт своего преемника, но направление понятное. Именно поэтому Anthropic уже всерьёз обсуждает recursive self-improvement и пишет, что к таким темпам индустрия может быть не готова.
На этом фоне вокруг Anthropic снова пошли слухи о новой модели. После закрытого Mythos в X заметили название Claude Oceanus, якобы это следующий claude-mythos level, который уже тестируют red team’ы. Официального анонса пока нет, но Anthropic сама недавно писала, что хочет дать Mythos-level модели более широкому кругу клиентов “в ближайшие недели”, когда доделает киберзащиты. Параллельно таймлайн ждёт GPT-5.6 от OpenAI, который тоже пока не подтверждён, но якобы светился в Codex-логах с контекстом до 1.5M токенов. В общем, июнь может стать месяцем новой гонки моделей🍿
И ещё вчера OpenAI выпустили новый апгрейд памяти ChatGPT - Dreaming. Это фоновая переработка прошлых чатов: ChatGPT должен лучше помнить ваши проекты, привычки и контекст, а ещё сам обновлять устаревшие факты.
На этом фоне вокруг Anthropic снова пошли слухи о новой модели. После закрытого Mythos в X заметили название Claude Oceanus, якобы это следующий claude-mythos level, который уже тестируют red team’ы. Официального анонса пока нет, но Anthropic сама недавно писала, что хочет дать Mythos-level модели более широкому кругу клиентов “в ближайшие недели”, когда доделает киберзащиты. Параллельно таймлайн ждёт GPT-5.6 от OpenAI, который тоже пока не подтверждён, но якобы светился в Codex-логах с контекстом до 1.5M токенов. В общем, июнь может стать месяцем новой гонки моделей
И ещё вчера OpenAI выпустили новый апгрейд памяти ChatGPT - Dreaming. Это фоновая переработка прошлых чатов: ChatGPT должен лучше помнить ваши проекты, привычки и контекст, а ещё сам обновлять устаревшие факты.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Сиолошная
В ChatGPT прокачали память — теперь она станет ещё более персонализированной. Обновление уже доступно пользователям тарифов Plus и Pro в США, а в ближайшие недели появится в других странах, и самое главное у бесплатников. Мне кажется это важным потому, что позволяет компании закрепить у себя пользователя и сделать опыт перехода к конкурентам неудобным, мол, «да у них модель тупая и меня не понимает».
Новая память работает на основе «Dreaming» (сновидений?), когда модель в фоновом режиме автоматически формирует и упорядочивает воспоминания, опираясь на историю чатов. Воспоминания можно просмотреть: их сводка доступна на специальной странице управления памятью. Изучив эту страницу, вы сможете быстро понять в общих чертах, что именно ChatGPT знает о вас, добавить или обновить информацию о себе, а также дать инструкции о том, какие темы и в каких ситуациях нейросети следует затрагивать.
Как это может быть полезно обычным юзерам? Представьте, что вы выбираете в ChatGPT новое оборудование для фотосъемки, которое должно быть совместимо с вашей камерой. Если в прошлом вы уже обсуждали свою технику в чате, теперь вы можете просто попросить подобрать товары, совместимые с «моим набором для фотосъемки», и получите рекомендации с учётом фильтра.
Такую память OpenAI оценивают по критерию сохранения контекста (полнота выросла с 42% до 83% за 2 года). Есть ещё два других критерия, там тоже улучшения, но детали писать не буду.
Благодаря dreaming воспоминания автоматически обновляются с течением времени. Это позволяет ChatGPT актуализировать информацию: например, когда ваша поездка завершится, факт в памяти модели изменится с «Вы едете в Сингапур в июле» на «Вы ездили в Сингапур в июле 2026 года».
Решили раскатить только сейчас потому, что раньше было дорого: недавние улучшения снизили объем вычислительных мощностей, необходимых для работы функции dreaming, примерно в 5 раз.
Новая память работает на основе «Dreaming» (сновидений?), когда модель в фоновом режиме автоматически формирует и упорядочивает воспоминания, опираясь на историю чатов. Воспоминания можно просмотреть: их сводка доступна на специальной странице управления памятью. Изучив эту страницу, вы сможете быстро понять в общих чертах, что именно ChatGPT знает о вас, добавить или обновить информацию о себе, а также дать инструкции о том, какие темы и в каких ситуациях нейросети следует затрагивать.
Как это может быть полезно обычным юзерам? Представьте, что вы выбираете в ChatGPT новое оборудование для фотосъемки, которое должно быть совместимо с вашей камерой. Если в прошлом вы уже обсуждали свою технику в чате, теперь вы можете просто попросить подобрать товары, совместимые с «моим набором для фотосъемки», и получите рекомендации с учётом фильтра.
Такую память OpenAI оценивают по критерию сохранения контекста (полнота выросла с 42% до 83% за 2 года). Есть ещё два других критерия, там тоже улучшения, но детали писать не буду.
Благодаря dreaming воспоминания автоматически обновляются с течением времени. Это позволяет ChatGPT актуализировать информацию: например, когда ваша поездка завершится, факт в памяти модели изменится с «Вы едете в Сингапур в июле» на «Вы ездили в Сингапур в июле 2026 года».
Решили раскатить только сейчас потому, что раньше было дорого: недавние улучшения снизили объем вычислительных мощностей, необходимых для работы функции dreaming, примерно в 5 раз.
Forwarded from Анализ данных (Data analysis)
Google Research показали Agentic RAG для Gemini Enterprise Agent Platform - RAG, который не сдаётся после первого поиска.
Обычный RAG часто ломается на корпоративных вопросах, где ответ лежит не в одном документе, а размазан по нескольким базам. Нашёл кусок про проект, увидел только ID сервера, но не пошёл дальше искать характеристики этого сервера в другой системе - и выдал неполный ответ.
У Google идея такая: превратить RAG в многоагентный процесс.
Что внутри:
- Orchestrator понимает, что запрос не решается за один шаг
- Planner разбивает задачу на маршруты поиска
- Query Rewriter переписывает вопрос в несколько точных запросов
- Search Fanout ищет по разным источникам
- Sufficient Context Agent проверяет, хватает ли данных для ответа
Модель проверяет: закрыты ли все части вопроса. Если данных не хватает, она явно пишет, чего именно не хватает, и отправляет систему искать дальше.
На FramesQA такой подход дал до 34% прироста точности по сравнению со стандартным RAG. В cross-corpus сценарии, где нужно выбрать правильный источник из нескольких, система ответила правильно на 90.1% вопросов.
По сути, Google двигает RAG от «поиска + генерации» к маленькому исследовательскому пайплайну, где есть планирование, маршрутизация, проверка контекста и повторный поиск.
Для enterprise это важнее красивых демо: меньше галлюцинаций, больше трассируемости и понятнее, почему система дала именно такой ответ.
research.google/blog/unlocking-dependable-responses-with-gemini-enterprise-agent-platforms-agentic-rag/
Обычный RAG часто ломается на корпоративных вопросах, где ответ лежит не в одном документе, а размазан по нескольким базам. Нашёл кусок про проект, увидел только ID сервера, но не пошёл дальше искать характеристики этого сервера в другой системе - и выдал неполный ответ.
У Google идея такая: превратить RAG в многоагентный процесс.
Что внутри:
- Orchestrator понимает, что запрос не решается за один шаг
- Planner разбивает задачу на маршруты поиска
- Query Rewriter переписывает вопрос в несколько точных запросов
- Search Fanout ищет по разным источникам
- Sufficient Context Agent проверяет, хватает ли данных для ответа
Модель проверяет: закрыты ли все части вопроса. Если данных не хватает, она явно пишет, чего именно не хватает, и отправляет систему искать дальше.
На FramesQA такой подход дал до 34% прироста точности по сравнению со стандартным RAG. В cross-corpus сценарии, где нужно выбрать правильный источник из нескольких, система ответила правильно на 90.1% вопросов.
По сути, Google двигает RAG от «поиска + генерации» к маленькому исследовательскому пайплайну, где есть планирование, маршрутизация, проверка контекста и повторный поиск.
Для enterprise это важнее красивых демо: меньше галлюцинаций, больше трассируемости и понятнее, почему система дала именно такой ответ.
research.google/blog/unlocking-dependable-responses-with-gemini-enterprise-agent-platforms-agentic-rag/
❤1
Forwarded from Denis Sexy IT 🤖
Тут чуваки из компании Ahrefs, наконец-то развеяли мифы о продвижении интернет страниц в АИ ассистентах и оптимизации для роботов, ставя точку в вопросе «а как работает SEO в АИ эпохе»:
За последние 6 месяцев они проанализировали более 1 миллиарда точек данных в рамках 14 исследований:
1. Статьи-подборки формата «Лучшие топ-X» - самый заметный формат страниц, который цитируют АИ-чатботы. На них приходится ~40% всех типов страниц, цитируемых конкретно ChatGPT
2. 67% из топ-1 000 цитирований ChatGPT приходятся на источники, на которые маркетологи и продвигаторы не могут повлиять: Wikipedia - 29,7%, главные страницы сайтов - 23,8%, магазины приложений - 6,6%. Только 32,3% - это контент, на который можно влиять: образовательные страницы, обзоры, новости и посты в блогах
3. У 28,3% самых цитируемых ChatGPT страниц нулевая органическая видимость в Google (!) Эти страницы многократно цитируются ChatGPT, хотя вообще не ранжируются в Google – это совершенно отдельный слой обнаружения контента
4. ChatGPT цитирует только около 50% URL, которые он находит – оно получает десятки страниц по одному запросу, но половину использует как фоновый контекст без указания источника. Это значит, что попасть в выборку и быть процитированным - совсем разные вещи
5. Добавление schema-разметки не оказало сколько-нибудь значимого влияния на цитирования в АИ Ассистентах. В AI Overviews (это в гугле когда АИ быстро ответ пишет) показатель даже снизился на −4,6%, тогда как в AI Mode (+2,4%) и ChatGPT (+2,2%) изменения были практически неотличимы от нуля – можете смеяться в лицо, всем кто продает вам оптимизацию сайта для АИ
6. Упоминания темы в YouTube имеют самую высокую корреляцию - 0,737 - с видимостью бренда в АИ среди всех факторов, которые они изучали, включая все классические SEO-метрики вроде обратных ссылок, количества страниц, DR и так далее. Это подтвердилось как для продуктов Google, так и для продуктов OpenAI
7. AI Overviews в Google снижают клики по первому месту в гугл поиске на 58% – всего 10 месяцев назад этот показатель составлял 34,5%, тренд ускоряется, уводить из гугла стало сложнее
8. 99,9% AI Overviews появляются по запросам с информационным запросом - транзакционные, навигационные и локальные запросы почти полностью свободны от AIO, в поиске покупок AIO срабатывают лишь в 3,2% случаев
9. Для одного и того же поискового запроса Google AI Mode и AI Overviews приходят к одинаковым выводам в 86% случаев, но цитируют почти полностью разные источники: пересечение по цитированиям составляет всего 13,7%
10. Гугловские AI Overviews меняются в среднем каждые 2,15 дня, при этом 70% контента отличается между соседними наблюдениями, семантическое сходство остается на уровне 0,95 – слова, источники и сущности постоянно перемешиваются, но фактический смысл почти не меняется
Короче продвигаться в интернете стало еще сложнее и дороже, спасибо АИ☕️
За последние 6 месяцев они проанализировали более 1 миллиарда точек данных в рамках 14 исследований:
1. Статьи-подборки формата «Лучшие топ-X» - самый заметный формат страниц, который цитируют АИ-чатботы. На них приходится ~40% всех типов страниц, цитируемых конкретно ChatGPT
2. 67% из топ-1 000 цитирований ChatGPT приходятся на источники, на которые маркетологи и продвигаторы не могут повлиять: Wikipedia - 29,7%, главные страницы сайтов - 23,8%, магазины приложений - 6,6%. Только 32,3% - это контент, на который можно влиять: образовательные страницы, обзоры, новости и посты в блогах
3. У 28,3% самых цитируемых ChatGPT страниц нулевая органическая видимость в Google (!) Эти страницы многократно цитируются ChatGPT, хотя вообще не ранжируются в Google – это совершенно отдельный слой обнаружения контента
4. ChatGPT цитирует только около 50% URL, которые он находит – оно получает десятки страниц по одному запросу, но половину использует как фоновый контекст без указания источника. Это значит, что попасть в выборку и быть процитированным - совсем разные вещи
5. Добавление schema-разметки не оказало сколько-нибудь значимого влияния на цитирования в АИ Ассистентах. В AI Overviews (это в гугле когда АИ быстро ответ пишет) показатель даже снизился на −4,6%, тогда как в AI Mode (+2,4%) и ChatGPT (+2,2%) изменения были практически неотличимы от нуля – можете смеяться в лицо, всем кто продает вам оптимизацию сайта для АИ
6. Упоминания темы в YouTube имеют самую высокую корреляцию - 0,737 - с видимостью бренда в АИ среди всех факторов, которые они изучали, включая все классические SEO-метрики вроде обратных ссылок, количества страниц, DR и так далее. Это подтвердилось как для продуктов Google, так и для продуктов OpenAI
7. AI Overviews в Google снижают клики по первому месту в гугл поиске на 58% – всего 10 месяцев назад этот показатель составлял 34,5%, тренд ускоряется, уводить из гугла стало сложнее
8. 99,9% AI Overviews появляются по запросам с информационным запросом - транзакционные, навигационные и локальные запросы почти полностью свободны от AIO, в поиске покупок AIO срабатывают лишь в 3,2% случаев
9. Для одного и того же поискового запроса Google AI Mode и AI Overviews приходят к одинаковым выводам в 86% случаев, но цитируют почти полностью разные источники: пересечение по цитированиям составляет всего 13,7%
10. Гугловские AI Overviews меняются в среднем каждые 2,15 дня, при этом 70% контента отличается между соседними наблюдениями, семантическое сходство остается на уровне 0,95 – слова, источники и сущности постоянно перемешиваются, но фактический смысл почти не меняется
Короче продвигаться в интернете стало еще сложнее и дороже, спасибо АИ
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from TechSparks
Лет десять с хвостиком назад был заметный шум вокруг Sci-Hub. Этот стартап Александры Элбакян довольно успешно пытался решить проблему доступа к научным публикациям за пейволом; для многих исследователей, работающих в не самых богатых заведениях, проблема такого доступа к необходимой по работе информации была и остается довольно болезненной (яркий пример — научная журналистика и популяризация науки; редакции соответствующих изданий редко готовы оплачивать своим авторам доступ к публикациям в журналах какого-нибудь Elsevier).
Пересказывать историю преследования Александры не буду; к счастью, полностью справиться с ней издателям не удалось несмотря на все свои старания.
Но вот новость, которую я пропустил: в духе времени Александра запустила ИИ-бот для поиска по накопленному архиву публикаций; и он знает про науку куда больше, чем многие большие ИИ-модели, которые не могут пробраться за издательские пейволы. Галлюционирует он тоже мало — как любая RAG-система. Приятно, что несмотря на все препятствия система по-настоящему открытого доступа к научному знанию продолжает жить и развиваться:)
https://cen.acs.org/policy/publishing/Sci-Hub-created-new-AI/104/web/2026/04
(Немножко про историю Sci-Hub: https://www.vice.com/en/article/academic-piracy-elsevier-sci-hub/ )
Пересказывать историю преследования Александры не буду; к счастью, полностью справиться с ней издателям не удалось несмотря на все свои старания.
Но вот новость, которую я пропустил: в духе времени Александра запустила ИИ-бот для поиска по накопленному архиву публикаций; и он знает про науку куда больше, чем многие большие ИИ-модели, которые не могут пробраться за издательские пейволы. Галлюционирует он тоже мало — как любая RAG-система. Приятно, что несмотря на все препятствия система по-настоящему открытого доступа к научному знанию продолжает жить и развиваться:)
https://cen.acs.org/policy/publishing/Sci-Hub-created-new-AI/104/web/2026/04
(Немножко про историю Sci-Hub: https://www.vice.com/en/article/academic-piracy-elsevier-sci-hub/ )
Chemical & Engineering News
Sci-Hub has created a new AI chatbot. Is it any good?
Largest illegal database of scientific papers has gaps in recently published literature, but its chatbot can still prove useful—especially for less-timely questions
❤3
Forwarded from TechSparks
Очередное исследование изменений рынка труда от HBR касается не всего ИТ-сегмента, а его специфической, но многочисленной, части: аутсорса. Устоявшаяся и зарекомендовавшая себя модель гласила: если задания жестко определены, стандартизированы и легко поддаются мониторингу, их имеет смысл выполнять там, где стоимость труда ниже.
Но ИИ-агенты ставят под вопрос эту логику, и не только для ИТ-позиций; эта логика ломается и для позиций в финансовых департаментах, HR, поддержке, юридических и аналитических подразделениях. The bargain that built the modern outsourcing industry no longer holds.
ИИ не уничтожит аутсорсинг как класс, но сильно его трансформирует:
Пока это сильно почувствовала Индия; там компании, оказывающие ИТ услуги, потеряли только за февраль более 10 млрд капитализации.
При этом то, что советуют для сохранения бизнеса аутсорсерами, подозрительно похоже на то, что рекомендуется и традиционным компаниям:
https://hbr.org/2026/06/ai-is-rewriting-the-economics-of-outsourcing
Но ИИ-агенты ставят под вопрос эту логику, и не только для ИТ-позиций; эта логика ломается и для позиций в финансовых департаментах, HR, поддержке, юридических и аналитических подразделениях. The bargain that built the modern outsourcing industry no longer holds.
ИИ не уничтожит аутсорсинг как класс, но сильно его трансформирует:
AI will destroy the old model of outsourcing, the one built on labor arbitrage, offshore scale, rate cards, and long-duration contracts measured largely by headcount and service levels.
Пока это сильно почувствовала Индия; там компании, оказывающие ИТ услуги, потеряли только за февраль более 10 млрд капитализации.
При этом то, что советуют для сохранения бизнеса аутсорсерами, подозрительно похоже на то, что рекомендуется и традиционным компаниям:
Reshape the talent pyramid: The old model depended on large junior delivery teams. The new one will require more domain experts, engineers, architects, product owners, governance leaders, and change managers.
https://hbr.org/2026/06/ai-is-rewriting-the-economics-of-outsourcing
Harvard Business Review
AI Is Rewriting the Economics of Outsourcing
Generative AI is changing the economics that fueled decades of outsourcing growth by automating many routine, rules-based tasks that companies once sent offshore for labor savings. Rather than deciding whether entire functions like finance, HR, or IT should…
Может кто-то наигрался и хочет продать dgx spark, mac studio (32-64gb) или RS PI 4/5 8/16gb?
😁2🤔1😭1