299K subscribers
5.02K photos
1.13K videos
17 files
5.38K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
NVIDIA выкатили Nemotron 3 Ultra (550B-A55B) - свою самую сильную open-weight модель на сегодня, причём вместе с полной схемой обучения.

Главный фокус на эффективность инференса в реальных long-context agentic сценариях, где модель долго держит контекст, работает с инструментами и выполняет многошаговые задачи.

Открыли почти всё:

• base-модель
• post-trained версии
• reward checkpoints
• NVFP4-квантованные версии
• тренировочные данные
• рецепты обучения

Технически внутри тоже интересно:

• 550B параметров всего, 55B активных
• гибридная архитектура Mamba2 + Transformer
• примерно 4:1 в пользу Mamba относительно Attention
• претрейн в NVFP4 на 20T токенов
• LatentMoE-архитектура
• двухэтапный MOPD post-training
• нативная поддержка MTP

🤗BF16 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16
🤗NVFP4 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4
📜Technical Report: https://research.nvidia.com/labs/nemotron/files/NVIDIA-Nemotron-3-Ultra-Technical-Report.pdf

@ai_machinelearning_big_data
👍7263🔥34🌚3😈3🤔1💘1
Media is too big
VIEW IN TELEGRAM
✔️ ChatGPT получил динамическое обновление контекста

OpenAI начала развертывание автоматической фоновой памяти для ChatGPT в США на тарифах Plus и Pro. В основе системы лежит механизм фоновой организации данных Dreaming.

Модель самостоятельно извлекает контекст, детали рабочих проектов и предпочтения из множества сессий без прямых команд на запоминание. Главное отличие новой архитектуры - динамическое обновление фактов.

Алгоритм актуализирует информацию со временем, понижая значимость устаревших данных. Прежняя реализация памяти полагалась на статичные факты, требовавшие ручного управления.

В ближайшие недели OpenAI расширит географию доступа и откроет функцию для пользователей бесплатных аккаунтов.
openai.com

✔️ xAI открыла API модели Grok Imagine Video 1.5

Компания выпустила превью-версию модели Grok Imagine Video 1.5 для генерации 720p-видео по картинке. Релиз позиционируется как конкурент Seedance и Google Veo.

Модель анимирует изображение по текстовым промптам: задается направление движения камеры, динамика и атмосфера сцены. Алгоритм сохраняет оригинальную детализацию и схему освещения исходника.

Также поддерживается склейка нескольких планов в длинные ролики с сохранением визуальной консистентности. Доступ к новинке открыт через API.
x.ai

✔️ Nvidia купила ИИ-стартап Kumo

Сделка оценивается в 400 млн долларов. Наработки Kumo интегрируют в платформу Nvidia AI Foundry, где корпоративные клиенты смогут обучать кастомные модели на внутренних реляционных базах.

Стек Kumo адаптирован для анализа сложных структур из множества связанных таблиц, которые тяжело обрабатывать классическими LLM. Алгоритмы комбинируют графовое машинное обучение и генерацию синтетических данных. Платформа решает задачи предиктивной аналитики: от прогнозирования оттока пользователей до оценки вероятности финансовых дефолтов.

В рамках сделки в Nvidia перейдет команда стартапа. Среди действующих клиентов Kumo - DoorDash, Reddit, Databricks и Snowflake. Актуальная модель стартапа вышла в апреле этого года.
theinformation.com

✔️ Релиз Reve 2.0: генерация 4K-изображений через редактируемые макеты

Reve представила новый генератор картинок на архитектуре Large Layout Model. Система отходит от классической генерации по тексту и работает через макеты: каждый визуальный элемент получает точные координаты, размер и описание.

Модель прошла дополнительный пространственный претрейн на базе Qwen. Изображение представляется как код, что позволяет управлять результатом через промпт или точечно редактировать JSON-структуру макета.

По заявлению авторов, на обучение ушло в 10 раз меньше вычислительных мощностей по сравнению с корпоративными аналогами. Модель занимает вторую строчку в бенчмарке Text-to-Image ArenaAi, обходя Nano Banana 2 и GPT-Image-1.5.
blog.reve.com

✔️ Трафик ботов и ИИ-агентов впервые превысил активность людей

По данным Cloudflare, доля машинного веб-трафика достигла 57,5%, превысив активность людей (42,5%). По словам гендиректора компании Мэттью Принса, рубеж пройден на несколько лет раньше прогнозируемого 2027 года.

Рост обусловлен не классическими скриптами (краулеры, спам, DDoS-сети), а автономными ИИ-агентами. Алгоритмы парсят контент для обучения нейросетей и выполняют многошаговые задачи от лица пользователей: мониторят цены, взаимодействуют со службами поддержки и оформляют заказы.

Cloudflare классифицирует трафик верифицированных ботов и ИИ-агентов отдельно с прошлого года. Точную дату превышения машинного трафика над человеческим определить сложно из-за специфики метрик.
CEO CloudFlare в сети Х

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
45👍17🥰7🔥2👏1😢1🤣1🙈1
📌ИИ уже ускоряет разработку новых моделей

Anthropic опубликовала аналитический материал, в котором утверждает, что системы искусственного интеллекта всё активнее участвуют в создании следующих поколений ИИ.

Материал подготовлен исследовательским подразделением Anthropic Institute. Его авторы - Марина Фаваро и сооснователь компании, глава отдела политики Джек Кларк.


Отрасль приближается к рекурсивному самоулучшению

Это состояние, когда ИИ способен самостоятельно проектировать и совершенствовать собственного преемника быстрее, чем к этому будут готовы правительства и институты.


При этом Anthropic оговаривается, что до полностью автономной разработки ещё далеко и что такой сценарий не является неизбежным, люди по-прежнему нужны. Они ставят цели, оценивают результаты и решают, какие направления важны.

🟡Внутренние данные

На май 2026 года Claude написал более 80% кода, добавляемого в кодовую базу Anthropic.

До запуска Claude Code этот показатель измерялся единицами процентов.


Во втором квартале 2026 года типичный инженер вносил в проекты примерно в 8 раз больше кода в день, чем в 2024-м.

🟡Публичные тесты

Время выполнения задач, которые модели способны надёжно решать без участия человека, удваивается примерно каждые 4 месяца.

В начале 2024 года Opus 3 справлялся с задачами длиной в несколько минут, годом позже Sonnet 3.7 примерно за полтора часа, а Opus 4.6 - до 12 часов.


На SWE-bench, проверяющем исправление реальных ошибок в коде, передовые модели за два года прошли путь от низких результатов до почти предельных.

Джек Кларк говорит, что компания хочет, чтобы законодатели и институты понимали, что может произойти дальше.

По его словам, цель Anthropic - "заранее обозначить концепцию и дать людям представление о том, что приближается".


Прогресс ИИ, по его оценке, скорее ускоряется, чем замедляется, и может принести значительные результаты в медицине и науке, но требует инструментов для проверки и подтверждения работы, выполненной ИИ.

Anthropic выступает за то, чтобы у мира оставалась возможность при необходимости замедлить или временно приостановить разработку передовых моделей, но понимает, что это потребует согласованных всех игроков индустрии в разных странах и механизмов взаимной проверки.

В ближайшие месяцы компания обсудит эти вопросы с законодателями, исследователями и другими участниками отрасли.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔11074👍37🔥14👌14👏8😁5🤩4🤝4👨‍💻2🥰1
📌 Фэй-Фэй Ли предлагает разделить модели мира на 3 функции

Крёстная мать ИИ и сооснователь World Labs вместе с командой опубликовала эссе, продолжающее её более ранний текст о пространственном интеллекте.

На этот раз авторы пытаются навести порядок в одном из самых перегруженных терминов индустрии - "модели мира".

LLM прекрасно овладели понятиями, лексикой и рассуждением, но они изучают статистическую структуру текста.

Модель мира должна изучать совокупность пространства и времени - как свет падает на поверхность, как предметы реагируют на силу, как всё это подчиняется законам физики.

Проблема в том, что термином "модель мира" пользуются CV, робототехника, RL и генеративный ИИ, каждый вкладывая в него своё.

Чтобы развести значения, Ли предлагает опираться на классическую схему из учебников по RL: цикл "агент-действие-состояние-наблюдение".

Формально - частично наблюдаемый марковский процесс принятия решений.


Разные системы, которые сегодня называют моделями мира, авторы предлагают рассматривать как разные проекции этого одного цикла.

🟡 Разделение на функции

Рендерер выдаёт наблюдения в виде пикселей, и главное для него - визуальная достоверность (3D структуры он по-настоящему не понимает).

Симулятор выдаёт состояние (геометрически и физически корректное описание мира, на котором могут работать и люди, и алгоритмы).

Планировщик по наблюдению и цели выдаёт действие, замыкая петлю "восприятие -действие".

🟡Доводы

Из 3-х категорий именно симулятор привлекает меньше всего внимания публики, но он самый значимый.

Рендереры коммерчески наиболее развиты (Google Nano Banana и другие генераторы), но оптимизированы под правдоподобную картинку, а не под физику - красивый кадр нельзя использовать, чтобы спроектировать здание или обучить робота.

Планировщики, наоборот, самые перспективные и самые сырые. Робототехнические демо последних лет почти всегда ограничены лабораторными условиями и далеки от реалий в реальном мире.

Симулятор описан как мост между ними и структурный каркас, из которого выводятся и внешний вид (для рендерера), и последствия действий (для планировщика).

Логическим итогом Ли называет одну базовую модель, которая в зависимости от запроса переключается между режимами: рендерит, симулирует или планирует.

В качестве первого шага в эту сторону Ли считает платформу Marble (разработка World Labs), которая генерирует 3D-сцены и выдает в рамках одной модели и гауссовы сплаты для визуального осмотра, и коллизионные сетки, с которыми может работать физический движок.


#AI #ML #WorldModels #WorldLabs
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2🤔6337👏22👍11🤓4👨‍💻4🔥2😁1🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ Mythos все-таки стала инструментом для наступательных киберопераций США

АНБ США начало применять модель Mythos для взлома зарубежных сетей, предположительно в Китае и Иране. Для адаптации системы под задачи спецслужбы Anthropic направила в агентство команду из 6 инженеров.

Сотрудничество с АНБ стало исключением на фоне конфликта стартапа с Пентагоном. В правилах безопасности Anthropic жесткие ограничения на военное использование ИИ касаются слежки за гражданами США, но формально оставляют спецслужбам свободу действий в операциях против зарубежных целей.

Степень вовлеченности разработчиков Anthropic в активные фазы атак не раскрывается.
ft.com

✔️ Власти Флориды подали в суд на OpenAI и Сэма Альтмана

В 83-страничном документе прокуратура штата требует признать ChatGPT дефектным товаром и общественной угрозой из-за выдачи опасного контента несовершеннолетним.

Часть обвинений строится на внутренних утечках. По версии властей, Альтман намеренно сократил сроки тестирования безопасности GPT-4o перед релизом. Утверждается, что на выявление рисков OpenAI выделила 1–2% вычислительных мощностей вместо публично обещанных 20%.

Дополнительные претензии касаются приватности. В иске указано, что в бесплатной версии ChatGPT нет верификации возраста, а сбор пользовательских данных начинается до принятия Terms of Service.
myfloridalegal.com

✔️ В мобильном клиенте LM Studio появилась поддержка удаленного инференса

Обновлённый клиент для iPhone и iPad объединил локальный инференс на смартфоне и удаленный доступ к десктопным моделям.

Офлайн-режим построен на фреймворке Apple MLX и оптимизирован под чипы Apple Silicon. Приложение поддерживает загрузку весов в формате GGUF.

Запуск тяжелых моделей стал возможен благодаря функции LM Link. Она направляет запросы к десктопному хосту LM Studio через mesh-сеть на базе Tailscale. Интеграция обеспечивает сквозное шифрование трафика без проброса портов в интернет.
lmstudio.ai

✔️ Учёные Кембриджа отчитались о тестировании спроектированной ИИ вакцины

Университет завершил первую фазу клинических испытаний pEVAC-PS, вакцины против коронавирусов, архитектуру которой спроектировала ИИ-модель. Препарат подтвердил безопасность и вызвал перекрестный иммунный ответ к нескольким видам вирусов у 39 добровольцев.

Модель обучали на генетических данных сарбековирусов, включая SARS-CoV-2 и вирус атипичной пневмонии. Алгоритм вычислил общую для родственных патогенов мишень, уязвимую для человеческих антител.

Клиническую эффективность pEVAC-PS проверят на втором этапе исследований. Технологию планируют применять для разработки вакцин против гриппа и вируса Эбола. Для коммерциализации платформы команда Кембриджа основала компанию DIOSynVax.
cam.ac.uk

✔️ Человеческий контроль мешает бизнесу экономить на внедрении ИИ

По данным опроса Bain & Company среди 951 компании, постоянное вмешательство людей в работу алгоритмов снижает финансовую отдачу от внедрения ИИ. Почти 40% корпораций сократили издержки менее чем на 10%, не достигнув целевых показателей в 11–20%.

Лишь 7% респондентов используют полностью автономных агентов. В 38% случаев системы требуют обязательного подтверждения каждого действия со стороны человека. Это ломает исходные бизнес-кейсы, рассчитанные на автоматизации.

Вторым барьером для интеграции моделей 41% опрошенных назвали проблемы с доступом к корпоративным данным. Несмотря на отставание от финансовых планов, 90% компаний намерены наращивать инвестиции в ИИ.
bain.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🤔5325🤨25🤬9🔥6😐4👌1💘1
Минимальные требования к Вайбкодеру в 2026
😁258🤔53🤣31👌10🤨75💯5🥱4🤬2🙊2😐1
⚡️ Nvidia анонсировала систему на чипе RTX Spark Superchip для Windows 11

Архитектура рассчитана на локальный запуск ИИ-моделей размером до 120 млрд параметров.

В основе - 20-ядерный CPU линейки Grace и графическое ядро Blackwell с 6144 ядрами CUDA. Компоненты соединены шиной NVLink и используют до 128 ГБ объединенной памяти LPDDR5X.

При теплопакете 80 Вт мощность видеоядра сопоставима с мобильной GeForce RTX 5070. Чип поддерживает DLSS 4.5.

Ноутбуки на базе RTX Spark поступят в продажу осенью по цене от 2700 евро.

Для корпоративной разработки Nvidia готовит рабочую станцию DGX Station for Windows на базе GB300 Grace Blackwell Ultra с 750 ГБ памяти.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6664🤔27🔥15👏14🥱6😍43
📌 Р. Саттон: ИИ без оценки результатов в процессе работы не способен к научным открытиям

Ричард Саттон, один из основоположников RL и лауреат премии Тьюринга, записал видео, в котором раскритиковал нынешние генеративные модели.

Современные генеративные модели (LLM, генераторы изображений и видео) по своей природе лишь имитируют и не способны к настоящему творчеству и открытиям.

Основной ограничитель - отсутствие механизма, который оценивал бы их результаты непосредственно во время работы.

Свой довод Саттон построил вокруг известной шутки об отзыве на научную работу: она "и новая, и хорошая, но хорошие части не новы, а новые - не хороши".


Это описание точно подходит к генеративному ИИ: его вывод бывает либо новым (за счёт случайности при генерации), либо качественным (за счёт обучающих данных), но не тем и другим сразу.

Для большинства задач это несущественно: имитация и есть назначение обучения с учителем, а генеративный ИИ остаётся полезной технологией, если он быстрее, дешевле или удобнее воспроизводимого образца. Проблема возникает там, где требуются открытие и творчество, то есть в науке и математике.

Научное открытие складывается из 3 шагов: вариативности, оценки и избирательного сохранения удачного. Этой способности нет в чистом предсказании и обучении с учителем, но она есть в RL, планировании и комбинаторном поиске.

Саттон привёл в пример системы, которые, по его оценке, нашли одновременно новые и качественные решения: AlphaGo, AlphaZero, AlphaFold и AlphaProof.

Сам трёхчастный принцип, кстати, не нов. На близкие идеи указывали ещё Дональд Кэмпбелл и Дэниел Деннет.


🟡 Генеративным моделям недостаёт шага оценки

Из-за предобучения, они не имеют способа оценивать собственный вывод в момент работы, а без оценки нет и отбора лучшего. Оценку может давать человек, выбирающий результат, но важнее кейс, когда критерий задан явной целью (например, ходом, ведущим к мату, или шагом, ведущим к доказательству).

Ограничение Саттон распространил и на сам метод обучения. Алгоритм обратного распространения ошибки лишён случайности, она вносится лишь однажды при инициализации весов, из-за чего сеть со временем теряет пластичность.

В качестве решения он напомнил о предложенном его группой алгоритме Continual Backprop, который периодически заново инициализирует редко используемые нейроны, поддерживая способность сети меняться.

🟡Вывод

Чтобы добиться полностью автономного ИИ-учёного, инженерам следует делиться с моделями измеримыми целями, по которым те могли бы самостоятельно проходить весь цикл: порождать варианты, оценивать их и сохранять лучшие, не полагаясь на человека в роли арбитра.

Тезисы Саттона перекликаются с его эссе "Горький урок", где он отстаивал ставку на поиск и обучение, масштабируемые вместе с вычислительными мощностями, в противовес встраиванию готовых человеческих знаний.


🔜 Послушать лекцию на Youtube


@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
1🤔61👍4628👏13🤣3💯2🤓2
Онлайн-магистратура — вариант для тех, кто хочет получить высшее образование, но не готов ставить жизнь на паузу.

УрФУ и Нетология предлагают три технологические программы, которые можно проходить онлайн и совмещать с работой:
1) Прикладной искусственный интеллект — чтобы научиться применять ИИ и нейросети для задач бизнеса.
2) Инженерия машинного обучения — чтобы разбираться в полном цикле работы с моделями: от данных до внедрения.
3) Программная инженерия цифровых решений — чтобы развиваться в бэкенде, архитектуре и создании цифровых сервисов.

На программах вас ждут прикладные задачи, проекты для портфолио, поддержка кураторов и экспертов. После выпуска — диплом магистра УрФУ и дополнительный диплом Нетологии.

На все программы действует образовательный кредит с господдержкой под 3%, а также акция: при оформлении кредита платежи за первый семестр возьмёт на себя Нетология.

Посмотреть программы

Реклама. ООО “Нетология” ОГРН 1207700135884 Erid:2VSb5yUEePU
🤣16👍12👨‍💻12🔥74😐3🗿3
✔️ Лидеры по найму среди стартапов Кремниевой долины

Руководитель по развитию Cursor Бен Ланг опубликовал список из 35 технологических стартапов с самыми высокими темпами найма за последние 90 дней.

Рейтинг учитывает соотношение числа новых сотрудников к изначальному размеру команды.


Около 85% списка заняли проекты в сфере ИИ и автономных систем. Основной рост пришелся на 2 направления:

🟢ИИ-безопасность: Jazz, Tenzai, Straiker, Gray Swan и Native.

🟠Embodied AI и робототехника: разработчик моделей Skild AI, провайдер датасетов для машинного зрения Mecka AI и создатель систем управления Allen Control Systems.

Также в список вошли сам Cursor, платформа предиктивных рынков Polymarket и разработчик RL-сред Fleet. По данным Бена, последний сейчас привлекает инвестиции при оценке в $750 млн.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍39👏13🔥106😁5🤩1