299K subscribers
5.02K photos
1.13K videos
17 files
5.38K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
📌ИИ уже ускоряет разработку новых моделей

Anthropic опубликовала аналитический материал, в котором утверждает, что системы искусственного интеллекта всё активнее участвуют в создании следующих поколений ИИ.

Материал подготовлен исследовательским подразделением Anthropic Institute. Его авторы - Марина Фаваро и сооснователь компании, глава отдела политики Джек Кларк.


Отрасль приближается к рекурсивному самоулучшению

Это состояние, когда ИИ способен самостоятельно проектировать и совершенствовать собственного преемника быстрее, чем к этому будут готовы правительства и институты.


При этом Anthropic оговаривается, что до полностью автономной разработки ещё далеко и что такой сценарий не является неизбежным, люди по-прежнему нужны. Они ставят цели, оценивают результаты и решают, какие направления важны.

🟡Внутренние данные

На май 2026 года Claude написал более 80% кода, добавляемого в кодовую базу Anthropic.

До запуска Claude Code этот показатель измерялся единицами процентов.


Во втором квартале 2026 года типичный инженер вносил в проекты примерно в 8 раз больше кода в день, чем в 2024-м.

🟡Публичные тесты

Время выполнения задач, которые модели способны надёжно решать без участия человека, удваивается примерно каждые 4 месяца.

В начале 2024 года Opus 3 справлялся с задачами длиной в несколько минут, годом позже Sonnet 3.7 примерно за полтора часа, а Opus 4.6 - до 12 часов.


На SWE-bench, проверяющем исправление реальных ошибок в коде, передовые модели за два года прошли путь от низких результатов до почти предельных.

Джек Кларк говорит, что компания хочет, чтобы законодатели и институты понимали, что может произойти дальше.

По его словам, цель Anthropic - "заранее обозначить концепцию и дать людям представление о том, что приближается".


Прогресс ИИ, по его оценке, скорее ускоряется, чем замедляется, и может принести значительные результаты в медицине и науке, но требует инструментов для проверки и подтверждения работы, выполненной ИИ.

Anthropic выступает за то, чтобы у мира оставалась возможность при необходимости замедлить или временно приостановить разработку передовых моделей, но понимает, что это потребует согласованных всех игроков индустрии в разных странах и механизмов взаимной проверки.

В ближайшие месяцы компания обсудит эти вопросы с законодателями, исследователями и другими участниками отрасли.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔11074👍37🔥14👌14👏8😁5🤩4🤝4👨‍💻2🥰1
📌 Фэй-Фэй Ли предлагает разделить модели мира на 3 функции

Крёстная мать ИИ и сооснователь World Labs вместе с командой опубликовала эссе, продолжающее её более ранний текст о пространственном интеллекте.

На этот раз авторы пытаются навести порядок в одном из самых перегруженных терминов индустрии - "модели мира".

LLM прекрасно овладели понятиями, лексикой и рассуждением, но они изучают статистическую структуру текста.

Модель мира должна изучать совокупность пространства и времени - как свет падает на поверхность, как предметы реагируют на силу, как всё это подчиняется законам физики.

Проблема в том, что термином "модель мира" пользуются CV, робототехника, RL и генеративный ИИ, каждый вкладывая в него своё.

Чтобы развести значения, Ли предлагает опираться на классическую схему из учебников по RL: цикл "агент-действие-состояние-наблюдение".

Формально - частично наблюдаемый марковский процесс принятия решений.


Разные системы, которые сегодня называют моделями мира, авторы предлагают рассматривать как разные проекции этого одного цикла.

🟡 Разделение на функции

Рендерер выдаёт наблюдения в виде пикселей, и главное для него - визуальная достоверность (3D структуры он по-настоящему не понимает).

Симулятор выдаёт состояние (геометрически и физически корректное описание мира, на котором могут работать и люди, и алгоритмы).

Планировщик по наблюдению и цели выдаёт действие, замыкая петлю "восприятие -действие".

🟡Доводы

Из 3-х категорий именно симулятор привлекает меньше всего внимания публики, но он самый значимый.

Рендереры коммерчески наиболее развиты (Google Nano Banana и другие генераторы), но оптимизированы под правдоподобную картинку, а не под физику - красивый кадр нельзя использовать, чтобы спроектировать здание или обучить робота.

Планировщики, наоборот, самые перспективные и самые сырые. Робототехнические демо последних лет почти всегда ограничены лабораторными условиями и далеки от реалий в реальном мире.

Симулятор описан как мост между ними и структурный каркас, из которого выводятся и внешний вид (для рендерера), и последствия действий (для планировщика).

Логическим итогом Ли называет одну базовую модель, которая в зависимости от запроса переключается между режимами: рендерит, симулирует или планирует.

В качестве первого шага в эту сторону Ли считает платформу Marble (разработка World Labs), которая генерирует 3D-сцены и выдает в рамках одной модели и гауссовы сплаты для визуального осмотра, и коллизионные сетки, с которыми может работать физический движок.


#AI #ML #WorldModels #WorldLabs
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2🤔6338👏22👍11🤓4👨‍💻4🔥2😁1🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ Mythos все-таки стала инструментом для наступательных киберопераций США

АНБ США начало применять модель Mythos для взлома зарубежных сетей, предположительно в Китае и Иране. Для адаптации системы под задачи спецслужбы Anthropic направила в агентство команду из 6 инженеров.

Сотрудничество с АНБ стало исключением на фоне конфликта стартапа с Пентагоном. В правилах безопасности Anthropic жесткие ограничения на военное использование ИИ касаются слежки за гражданами США, но формально оставляют спецслужбам свободу действий в операциях против зарубежных целей.

Степень вовлеченности разработчиков Anthropic в активные фазы атак не раскрывается.
ft.com

✔️ Власти Флориды подали в суд на OpenAI и Сэма Альтмана

В 83-страничном документе прокуратура штата требует признать ChatGPT дефектным товаром и общественной угрозой из-за выдачи опасного контента несовершеннолетним.

Часть обвинений строится на внутренних утечках. По версии властей, Альтман намеренно сократил сроки тестирования безопасности GPT-4o перед релизом. Утверждается, что на выявление рисков OpenAI выделила 1–2% вычислительных мощностей вместо публично обещанных 20%.

Дополнительные претензии касаются приватности. В иске указано, что в бесплатной версии ChatGPT нет верификации возраста, а сбор пользовательских данных начинается до принятия Terms of Service.
myfloridalegal.com

✔️ В мобильном клиенте LM Studio появилась поддержка удаленного инференса

Обновлённый клиент для iPhone и iPad объединил локальный инференс на смартфоне и удаленный доступ к десктопным моделям.

Офлайн-режим построен на фреймворке Apple MLX и оптимизирован под чипы Apple Silicon. Приложение поддерживает загрузку весов в формате GGUF.

Запуск тяжелых моделей стал возможен благодаря функции LM Link. Она направляет запросы к десктопному хосту LM Studio через mesh-сеть на базе Tailscale. Интеграция обеспечивает сквозное шифрование трафика без проброса портов в интернет.
lmstudio.ai

✔️ Учёные Кембриджа отчитались о тестировании спроектированной ИИ вакцины

Университет завершил первую фазу клинических испытаний pEVAC-PS, вакцины против коронавирусов, архитектуру которой спроектировала ИИ-модель. Препарат подтвердил безопасность и вызвал перекрестный иммунный ответ к нескольким видам вирусов у 39 добровольцев.

Модель обучали на генетических данных сарбековирусов, включая SARS-CoV-2 и вирус атипичной пневмонии. Алгоритм вычислил общую для родственных патогенов мишень, уязвимую для человеческих антител.

Клиническую эффективность pEVAC-PS проверят на втором этапе исследований. Технологию планируют применять для разработки вакцин против гриппа и вируса Эбола. Для коммерциализации платформы команда Кембриджа основала компанию DIOSynVax.
cam.ac.uk

✔️ Человеческий контроль мешает бизнесу экономить на внедрении ИИ

По данным опроса Bain & Company среди 951 компании, постоянное вмешательство людей в работу алгоритмов снижает финансовую отдачу от внедрения ИИ. Почти 40% корпораций сократили издержки менее чем на 10%, не достигнув целевых показателей в 11–20%.

Лишь 7% респондентов используют полностью автономных агентов. В 38% случаев системы требуют обязательного подтверждения каждого действия со стороны человека. Это ломает исходные бизнес-кейсы, рассчитанные на автоматизации.

Вторым барьером для интеграции моделей 41% опрошенных назвали проблемы с доступом к корпоративным данным. Несмотря на отставание от финансовых планов, 90% компаний намерены наращивать инвестиции в ИИ.
bain.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🤔5325🤨25🤬9🔥6😐4👌1💘1
Минимальные требования к Вайбкодеру в 2026
😁260🤔53🤣31👌10🤨75💯5🥱4🤬2🙊2😐1
⚡️ Nvidia анонсировала систему на чипе RTX Spark Superchip для Windows 11

Архитектура рассчитана на локальный запуск ИИ-моделей размером до 120 млрд параметров.

В основе - 20-ядерный CPU линейки Grace и графическое ядро Blackwell с 6144 ядрами CUDA. Компоненты соединены шиной NVLink и используют до 128 ГБ объединенной памяти LPDDR5X.

При теплопакете 80 Вт мощность видеоядра сопоставима с мобильной GeForce RTX 5070. Чип поддерживает DLSS 4.5.

Ноутбуки на базе RTX Spark поступят в продажу осенью по цене от 2700 евро.

Для корпоративной разработки Nvidia готовит рабочую станцию DGX Station for Windows на базе GB300 Grace Blackwell Ultra с 750 ГБ памяти.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
69👍66🤔28🔥15👏14🥱64😍4
📌 Р. Саттон: ИИ без оценки результатов в процессе работы не способен к научным открытиям

Ричард Саттон, один из основоположников RL и лауреат премии Тьюринга, записал видео, в котором раскритиковал нынешние генеративные модели.

Современные генеративные модели (LLM, генераторы изображений и видео) по своей природе лишь имитируют и не способны к настоящему творчеству и открытиям.

Основной ограничитель - отсутствие механизма, который оценивал бы их результаты непосредственно во время работы.

Свой довод Саттон построил вокруг известной шутки об отзыве на научную работу: она "и новая, и хорошая, но хорошие части не новы, а новые - не хороши".


Это описание точно подходит к генеративному ИИ: его вывод бывает либо новым (за счёт случайности при генерации), либо качественным (за счёт обучающих данных), но не тем и другим сразу.

Для большинства задач это несущественно: имитация и есть назначение обучения с учителем, а генеративный ИИ остаётся полезной технологией, если он быстрее, дешевле или удобнее воспроизводимого образца. Проблема возникает там, где требуются открытие и творчество, то есть в науке и математике.

Научное открытие складывается из 3 шагов: вариативности, оценки и избирательного сохранения удачного. Этой способности нет в чистом предсказании и обучении с учителем, но она есть в RL, планировании и комбинаторном поиске.

Саттон привёл в пример системы, которые, по его оценке, нашли одновременно новые и качественные решения: AlphaGo, AlphaZero, AlphaFold и AlphaProof.

Сам трёхчастный принцип, кстати, не нов. На близкие идеи указывали ещё Дональд Кэмпбелл и Дэниел Деннет.


🟡 Генеративным моделям недостаёт шага оценки

Из-за предобучения, они не имеют способа оценивать собственный вывод в момент работы, а без оценки нет и отбора лучшего. Оценку может давать человек, выбирающий результат, но важнее кейс, когда критерий задан явной целью (например, ходом, ведущим к мату, или шагом, ведущим к доказательству).

Ограничение Саттон распространил и на сам метод обучения. Алгоритм обратного распространения ошибки лишён случайности, она вносится лишь однажды при инициализации весов, из-за чего сеть со временем теряет пластичность.

В качестве решения он напомнил о предложенном его группой алгоритме Continual Backprop, который периодически заново инициализирует редко используемые нейроны, поддерживая способность сети меняться.

🟡Вывод

Чтобы добиться полностью автономного ИИ-учёного, инженерам следует делиться с моделями измеримыми целями, по которым те могли бы самостоятельно проходить весь цикл: порождать варианты, оценивать их и сохранять лучшие, не полагаясь на человека в роли арбитра.

Тезисы Саттона перекликаются с его эссе "Горький урок", где он отстаивал ставку на поиск и обучение, масштабируемые вместе с вычислительными мощностями, в противовес встраиванию готовых человеческих знаний.


🔜 Послушать лекцию на Youtube


@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
2🤔69👍5131👏13💯3🤣3🤓2🥰1👌1
Онлайн-магистратура — вариант для тех, кто хочет получить высшее образование, но не готов ставить жизнь на паузу.

УрФУ и Нетология предлагают три технологические программы, которые можно проходить онлайн и совмещать с работой:
1) Прикладной искусственный интеллект — чтобы научиться применять ИИ и нейросети для задач бизнеса.
2) Инженерия машинного обучения — чтобы разбираться в полном цикле работы с моделями: от данных до внедрения.
3) Программная инженерия цифровых решений — чтобы развиваться в бэкенде, архитектуре и создании цифровых сервисов.

На программах вас ждут прикладные задачи, проекты для портфолио, поддержка кураторов и экспертов. После выпуска — диплом магистра УрФУ и дополнительный диплом Нетологии.

На все программы действует образовательный кредит с господдержкой под 3%, а также акция: при оформлении кредита платежи за первый семестр возьмёт на себя Нетология.

Посмотреть программы

Реклама. ООО “Нетология” ОГРН 1207700135884 Erid:2VSb5yUEePU
🤣19👨‍💻16👍13🔥75🗿4😐3
✔️ Лидеры по найму среди стартапов Кремниевой долины

Руководитель по развитию Cursor Бен Ланг опубликовал список из 35 технологических стартапов с самыми высокими темпами найма за последние 90 дней.

Рейтинг учитывает соотношение числа новых сотрудников к изначальному размеру команды.


Около 85% списка заняли проекты в сфере ИИ и автономных систем. Основной рост пришелся на 2 направления:

🟢ИИ-безопасность: Jazz, Tenzai, Straiker, Gray Swan и Native.

🟠Embodied AI и робототехника: разработчик моделей Skild AI, провайдер датасетов для машинного зрения Mecka AI и создатель систем управления Allen Control Systems.

Также в список вошли сам Cursor, платформа предиктивных рынков Polymarket и разработчик RL-сред Fleet. По данным Бена, последний сейчас привлекает инвестиции при оценке в $750 млн.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52👏16🔥106😁5🤩1
TechLead в DevClub в Городские сервисы Яндекса

Dev Club — команда инженеров, которая решает сложные технические задачи для бизнеса. Нужно быстро подключаться к проектам, вникать в контекст, добиваться результата и переходить к новым задачам. Каждые несколько месяцев — новый контекст и новая задача.

Стек зависит от проекта. Чаще всего мы работаем с C++, Go, Java, Python.

Какие задачи вас ждут
● Запускать новые проекты для конечных пользователей
● Проектировать архитектуру продуктов с отказоустойчивостью 99,99%
● Внедрять инновационные продукты: прорабатывать идею, архитектуру и процессы вокруг новой функциональности
● Расширять возможности продукта и проектировать гибкую архитектуру для развития.

Мы ждем, что вы
● Любите С++ и считаете язык инструментом в своих руках
● Отлично знаете алгоритмы и структуры данных
● Понимаете жизненный цикл разработки проектов.

Откликайтесь на yandex.jobs.ru
👍36👏13❤‍🔥7🤔7🤣4🔥2🗿1
📌LEAP: система, которая помогла LLM решить все задачи олимпиады Putnam 2025

Google опубликовала интересный пейпер о системе LEAP, предназначенной для автодоказательства теорем. Она позволяет языковым моделям строить формальные, машинно проверяемые доказательства на языке Lean.

Доказательство на естественном языке трудно проверить автоматически - оно почти всегда содержит логические пробелы.

Формальное доказательство записывается на машинном языке и проверяется компилятором, что даёт гарантию корректности, но писать его значительно сложнее.


В этой области лидируют специализированные модели, заточенные в обучении именно под Lean. LEAP, работая как агентный фреймворк, использует общие модели, разбивая задачу на части и исправляя ошибки рекурсивно по подсказкам компилятора.

Главная исследовательская победа проекта - олимпиада Putnam 2025, ежегодное соревнование по математике для студентов в США.

LEAP формально решила все 12 задач, тогда как ни Gemini 3.1 Pro сама по себе, ни открытый специализированный прувер Goedel-Prover-V2 не решили ни одной.

Закрытую систему Aristotle, получившую на математической олимпиаде IMO 2025 результат уровня золотой медали, авторы в собственных тестах оценили в 9 решённых задач из 12.


В рамках работы также представлен набор IMO-LeanProofBench из 60 формализованных в Lean задач олимпиадного уровня, требующих весьма нестандартных выводов и структурно сложных доказательств.

На нём LEAP, что неудивительно, достигает в среднем по basic и advanced сэтам около 70% против примерно 48% у Aristotle.


Попутное достижение - LEAP формально проверила вспомогательную часть одной из комбинаторных задач, восходящих к математику Дональду Кнуту, сгенерировав более 5000 строк кода на Lean 4.

🟡Стоит отметить иронию

В статье авторы критикуют закрытые системы-конкуренты (Axiom3, Numina, Aristotle) за то, что те недоступны для научной проверки. При этом код самого LEAN тоже не опубликован.

Открытие итоговых доказательств это частично смягчает (их можно перепроверить компилятором Lean), но полная воспроизводимость гугловского проекта пока невозможна.


@ai_machinelearning_big_data

#AI #ML #LLM #LEAP #Research #Google
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24🤔15👏10🔥76😁6🎉2
✔️ Яндекс подвёл итоги грантовой программы Yandex Open Source

Компания выбрала 18 open source-проектов в направлениях AI, data и developer tools. Среди победителей — инструменты для локальных LLM, GraphRAG, E2E-тестирования, Docker и embedded-баз данных.

🟡Auto AI Router

Прокси-роутер для работы с OpenAI, Gemini, Anthropic и другими моделями через единую точку входа.

Поддерживает:
• балансировку нагрузки
• rate limiting
• каскадную маршрутизацию
• защиту от подозрительных запросов по аналогии с Fail2Ban

🟡RAGU

GraphRAG-движок для построения графов знаний по документам.

Система:
• извлекает сущности и связи
• дедуплицирует узлы
• кластеризует граф
• комбинирует локальный, глобальный и векторный поиск

Поддерживаются как облачные API, так и локальные модели Hugging Face.

🟡langchain-localai

Пакет для работы с LocalAI и LangChain в закрытых контурах.

Разработчики:
• перевели библиотеку на OpenAI SDK v1
• добавили полноценную асинхронность
• ускорили batch-генерацию эмбеддингов
• встроили поддержку reranking внутри RAG-систем

🟡Playwright Labs

Набор инструментов для E2E-тестирования на базе Playwright.

Включает:
• observability через OTLP
• генерацию моков
• Docker orchestration
• поддержку Angular / React / Vue селекторов

@ai_machinelearning_big_data

#opensource #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26👏87🔥7🎉3🤣2❤‍🔥1
🌟 LangChain сделала модуль самопроверки для ИИ-агентов

Компания выпустила RubricMiddleware, компонент для своего фреймворка Deep Agents, который заставляет ИИ-агента проверять собственный результат по заранее заданным критериям и при необходимости переделывать работу.

Инструмент позиционируется как решение типичной проблемы, когда агент выполняет задачу почти целиком, но упускает формат, тесты или обязательные разделы.

Механизм наиболее полезен для задач с чёткими и проверяемыми критериями приёмки.


🟡 Принцип работы

Разработчик задаёт список требований (рубрику) к выполненной задаче: например, код должен проходить тесты, а отчёт содержать определённые разделы.

Перед тем как агент завершит работу, отдельный проверяющий агент (грэйдер) оценивает результат по каждому пункту. Если что-то не выполнено, его замечания возвращаются основному агенту, и тот делает новую попытку.

Цикл останавливается, когда все критерии выполнены либо когда достигнут заданный лимит итераций.

По словам LangChain, проверяющий агент может не только рассуждать о качестве ответа, но и вызывать внешние инструменты, чтобы опираться на фактические данные, а не только на текст.

LangChain сравнивают подход с функцией /goal в Claude Code и Codex, но утверждают, что их реализация пластичнее за счёт выделенного агента-оценщика, который видит весь ход выполнения задачи.

RubricMiddleware пока в бете, но к нему есть документация, а посмотреть пример трейса можно тут.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤓5👍4💯21🔥1👏1🤔1🍾1