Анализ данных (Data analysis)

⚡️ AgentField: попытка сделать AI-агентов нормальными backend-сервисами

Большинство agent-фреймворков помогает написать логику агента. AgentField пытается закрыть другой слой: как запускать агентов в проде, как API и микросервисы. Репозиторий уже набрал около 2.4K звёзд.

Идея такая: ты пишешь обычные функции на Python, Go или TypeScript, а AgentField превращает их в REST endpoints, добавляет routing, retries, async execution, memory, observability и coordination.

Что обещают из коробки:

* один агент на ноутбуке → тысячи агентов в workflow
* fan-out запросов через control plane
* очереди и retry без ручной сборки инфраструктуры
* traces, DAGs, metrics и audit trails
* memory scopes: global, actor, session, workflow
* human approval для критичных решений
* SDK для Python, Go и TypeScript
* деплой через Docker Compose, Kubernetes и production setups

AgentField можно использовать прямо из coding agents: Claude Code, Codex, Gemini CLI, OpenCode, Aider, Windsurf и Cursor. По README, ты описываешь систему одной строкой, а получаешь Docker Compose stack с агентом, control plane и REST API.

Технически control plane — stateless Go-сервис, который масштабируется горизонтально, а durable очередь работает через PostgreSQL с lease-based processing, чтобы задачи не терялись при падениях и рестартах.

https://github.com/Agent-Field/agentfield

❤7👍5🔥2

3.61K viewsedited 12:13

700+ страниц алгебры, после которых слово “абстрактная” перестаёт пугать

Есть бесплатная PDF-версия Basic Algebra Энтони Кнаппа — большой учебник для сильных студентов старших курсов и первого года магистратуры. Digital Second Edition доступна для личного образовательного использования.

Внутри почти весь фундамент современной алгебры:

* целые числа, многочлены, матрицы
* векторные и евклидовы пространства
* группы и действия групп
* линейные операторы и жорданова форма
* тензоры и внешняя алгебра
* кольца, модули, поля
* теория Галуа
* категории и функторы

Особенно ценно, что это не «конспект на 100 страниц», а полноценный маршрут: от конкретных вычислительных примеров к общей теории. Сам Кнапп пишет, что читателям нравились именно широта книги, раннее введение линейной алгебры и большое количество задач.

Для новичка без опыта доказательств будет тяжеловато. Но если уже умеешь читать строгую математику и хочешь собрать мощную базу по алгебре — это прям серьёзная находка.

PDF: https://math.stonybrook.edu/~aknapp/download/b2-alg-coverandinside.pdf

❤18🔥8👍6

3.94K views14:04

Анализ данных (Data analysis)

ИИ-агенты часто ломаются ещё до того, как начинает ошибаться модель

В работе “AI Agents Do Not Fail Alone: The Context Fails First” исследователи показали: будущий сбой агента можно предсказать по его окружению ещё до завершения задачи.

Причина часто находится в том, что ей дали:

- расплывчатую роль и инструкции
- плохо описанные инструменты
- недостаточно фактов и доказательств
- противоречивые правила
- слабую память
- уязвимые защитные ограничения
- неудачно распределённый контекст

Авторы оценивали среду агента отдельно от его итогового результата. Поэтому метрика не угадывает поведение по ответу, а измеряет качество условий, в которых работает система.

На 300 тестах и 7500 шагах одни и те же фиксированные модели заметно улучшили результаты после перехода от хаотичного контекста к структурированному.

Больше фактических данных снижало число галлюцинаций. Чёткое описание инструментов улучшало tool use. Сильные guardrails повышали устойчивость к манипуляциям.

Но обнаружился и компромисс: чрезмерно защищённые агенты иногда становились слишком осторожными и хуже решали обычные задачи.

Прежде чем менять модель, стоит проверить промпты, инструменты, память, фактическую базу и правила безопасности.

https://arxiv.org/abs/2607.14275

#ai #agents #llm #research

🔥8👍5❤4😁2

3.87K views08:33

Анализ данных (Data analysis)

Fugu-Cyber: ИИ-оркестратор для задач киберзащиты

Sakana AI представила обновление своей системы Fugu - специализированную модель Fugu-Cyber для анализа реальных задач информационной безопасности.

По данным компании, модель показала:

- 86,9% успешных решений на CyberGym
- 72,1% на CTI-REALM
- результаты на уровне GPT-5.5-Cyber и Mythos Preview

CyberGym проверяет способность находить и подтверждать уязвимости в сложных кодовых базах, а CTI-REALM — превращать отчёты об угрозах в рабочие правила обнаружения.

Fugu-Cyber работает как одна модель, но внутри динамически координирует несколько специализированных ИИ-агентов. Пользователь отправляет запрос в единый API, а система сама распределяет многоэтапную задачу между агентами.

При этом Sakana AI подчёркивает: высокая оценка на бенчмарке ещё не делает модель готовой системой защиты. Для работы в реальной инфраструктуре нужны эксперты, интеграция с внутренним кодом и обязательная проверка результатов человеком.

https://sakana.ai/fugu-cyber-release

#ai #cybersecurity #llm #agents #sakanaai

❤8🔥6👍3⚡1

7.33K views10:41

Анализ данных (Data analysis)

Китай, похоже, заканчивает эпоху “берите наши open-weight модели и делайте что хотите”

Пекин обсуждает новые экспортные ограничения для AI и чипов. По данным FT/Reuters, Минкоммерции Китая уже консультировалось с Alibaba, ByteDance и Zhipu: как ограничить вывод training data за рубеж и стоит ли дальше разрешать иностранцам скачивать веса самых сильных моделей.

Причина - китайские frontier-модели всё чаще выходят open-weight. После Kimi K3 это стало особенно чувствительно: Moonshot представила 2.8T-модель и заявила, что она приближается к уровню американских frontier-систем.

Когда Китай догонял, открытость была оружием: раздать веса, ускорить adoption, ударить по закрытым западным моделям.

Теперь, когда разрыв с США уменьшился, те же веса выглядят уже не как маркетинг, а как стратегический актив.

И ограничения могут коснуться не только моделей. Обсуждаются меры, которые не дадут зарубежным производителям вроде Qualcomm и TSMC делать продвинутые чипы по дизайнам Huawei, Alibaba и ByteDance. Также возможны ограничения на зарубежные покупки стратегических AI-стартапов, включая agentic AI.

Китай начинает охранять AI так же жёстко, как редкоземы, чипы и другие рычаги технологической власти.

Open-source был стратегией андердога.

Похоже, Пекин уже не считает себя андердогом.

https://www.reuters.com/world/asia-pacific/china-considers-tighter-export-controls-ai-models-chips-ft-reports-2026-07-21/

👍14❤6🔥5😢2😁1💔1

3.48K views13:02

Анализ данных (Data analysis)

0:28

This media is not supported in your browser

VIEW IN TELEGRAM

The thing Anthropic didn’t see coming 😂

👍16🔥10😁9❤3🤯2

3.21K views14:06

Анализ данных (Data analysis)

Forwarded from Machinelearning

⚡️

Google представила 3 новые модели Gemini

Cемейство Gemini пополнилось моделями 3.6 Flash, 3.5 Flash-Lite и специализированной 3.5 Flash Cyber.

🟡

Gemini 3.6 Flash

Модель расходует на 17% меньше выходных токенов, чем предыдущая версия 3.5 Flash. Говорят, что подтянули у неё кодинг и офисные задачи.

Стоимость - 1,5 доллара за миллион входных и 7,5 доллара за миллион выходных токенов.

🟡

Gemini 3.5 Flash-Lite

Ориентирована на массовые и быстрые задачи. Заявленная скорость - 350 токенов в секунду при цене 30 центов за миллион входных токенов.

🟡

Gemini 3.5 Flash Cyber

Модель, натасканная на поиск и исправления уязвимостей в коде, которая не поступит в открытый доступ - её получат только правительства и доверенные партнёры в рамках ограниченной пилотной программы.

Google также сообщила о планах - 3.5 Pro тестируется с партнёрами, а команда уже начала обучение Gemini 4, которое в компании называют самым масштабным на сегодняшний день. Сроки выхода не названы.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5👍3

2.22K views18:46

Анализ данных (Data analysis)

Machinelearning

⚡️ Google представила 3 новые модели Gemini Cемейство Gemini пополнилось моделями 3.6 Flash, 3.5 Flash-Lite и специализированной 3.5 Flash Cyber. 🟡Gemini 3.6 Flash Модель расходует на 17% меньше выходных токенов, чем предыдущая версия 3.5 Flash. Говорят…

Google уже начала обучение Gemini 4 и это будет не просто очередное обновление

Google DeepMind официально подтвердила запуск предварительного обучения Gemini 4, назвав его самым масштабным pre-training-процессом в истории компании.

Это важный сигнал: речь, вероятно, идёт о новом поколении базовой архитектуры, а не о доработке существующей линейки Gemini 3.x.

Параллельно Google продолжает тестировать Gemini 3.5 Pro с партнёрами и обещает выпустить модель, когда она будет полностью готова. Поэтому предположение, что разработку Gemini 4 начали из-за неудачных результатов 3.5 Pro, пока ничем официально не подтверждено.

Что потенциально может измениться в Gemini 4:

- базовая архитектура и подход к обучению;
- качество рассуждений и программирования;
- эффективность работы с длинным контекстом;
- мультимодальность и агентные возможности;
- соотношение производительности, скорости и стоимости.

Сроки релиза Google пока не раскрывает. Но крупнейший тренировочный запуск уже идёт — значит, следующая большая гонка моделей фактически началась.

#google #gemini #ai #llm #deepmind

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-6-flash-3-5-flash-lite-3-5-flash-cyber/

❤17🔥10👍7😁2

3.32K views18:48

Анализ данных (Data analysis)

UnMaskFork: несколько диффузионных моделей вместе решают одну задачу

Статья от Sakana UnMaskFork, принятая на ICML 2026, предлагает новый способ масштабирования вычислений во время вывода для маскированных диффузионных языковых моделей.

Обычные LLM генерируют текст последовательно - токен за токеном. Маскированные диффузионные модели начинают с полностью скрытого текста и постепенно восстанавливают его части, причём могут заполнять несколько фрагментов параллельно.

Но привычный подход к test-time scaling - повысить температуру и сгенерировать много разных ответов, для таких моделей работает не слишком эффективно.

UnMaskFork решает проблему иначе:

- несколько диффузионных моделей работают над одним ответом;
- каждая по очереди раскрывает те участки, в которых наиболее уверена;
- промежуточный результат передаётся следующей модели;
- поиск по дереву Монте-Карло выбирает наиболее перспективную последовательность действий.

Разнообразие создаётся не случайностью, а переключением между моделями с разными сильными сторонами.

В экспериментах подход улучшил результаты Dream-Coder на задачах по программированию и показал стабильный рост качества на математических бенчмарках при увеличении вычислений во время вывода.

При этом UnMaskFork:

- не требует дополнительного обучения;
- не меняет внутреннюю архитектуру моделей;
- работает как отдельный алгоритм координации;
- позволяет комбинировать модели, обученные на разных данных и разными методами.

Работа продолжает исследования Sakana AI в области «коллективного разума» моделей - систем, где результат достигается не одной большой LLM, а координацией нескольких разных моделей.

Блог: https://pub.sakana.ai/umf
Статья: https://arxiv.org/abs/2602.04344

#AI #LLM #DiffusionModels #ICML2026 #MachineLearning #SakanaAI

❤7🔥5👍3

2.89K views08:15

Анализ данных (Data analysis)

😁38🔥23👍9❤3💯1

3.74K views12:36

Анализ данных (Data analysis)

Матричная факторизация с планированием на несколько шагов вперед

Исследователи AI VK предложили объединить ALS и Monte Carlo Tree Search.

Обычная матричная факторизация выбирает top-K айтемов по текущей близости эмбеддингов, а новый подход учитывает, как каждая рекомендация изменит профиль пользователя и повлияет на следующие показы.

Процесс представили как RL-среду:

- состояние — эмбеддинг пользователя;
- действие — показ айтема;
- награда — близость к релевантным объектам;
- переход — обновление эмбеддинга по формулам ALS в допущении оптимистичной среды

Эксперименты на MovieLens-1M, KuaiRec, Yambda и VK-LSVD показали прирост относительно статического top-K. На отдельных срезах VK-LSVD Recall@10 вырос ~ в 1,5 раза.

#aivkhub #rl #mcts #als

❤7🔥5👍4

2.59K views14:45

Анализ данных (Data analysis)

SpaceXAI строит ещё один гигантский дата-центр

По данным The Information, компания рассматривает несколько площадок в Техасе. Мощность нового комплекса может составить не менее 1 ГВт, то есть быть сопоставимой или даже превосходить инфраструктуру SpaceXAI в Мемфисе. Среди вариантов: строительство с нуля или переоборудование существующего склада. Компания уже нанимает специалистов по дата-центрам в Остине, Бастропе и Конро.

CEO Supermicro Чарльз Лян также заявил, что компания поможет SpaceXAI запустить «ещё один гигаваттный AI-дата-центр» менее чем за год. Место он не раскрыл.

SpaceXAI ускоренно превращается в полноценного AI-гиперскейлера: собственные модели, вычислительные кластеры, энергетическая инфраструктура, спутниковая связь и в перспективе орбитальные дата-центры. Новый проект в Техасе станет ещё одной заявкой на лидерство в гонке вычислительных мощностей.

http://theinformation.com/articles/spacexai-explores-major-data-center-expansion-texas

🔥6❤4👍2🤣1

2.48K views16:03

Анализ данных (Data analysis)

🏁До старта обработки миллиарда записей 3… 2… 1… клик

Выбирайте не просто СУБД, а гоночный болид для работы с данными.
ClickHouse® в облаке Selectel — машина, адаптированная под предельные нагрузки и сложные трассы. Отлично работает с векторными типами данных, эффективна в запросах для задач поиска семантического сходства, кластеризации или RAG.

Под капотом — SSD-накопители стандарта NVMe, оперативная память DDR5 и процессоры Intel® Xeon®Gold и AMD EPYC™. Мощное железо для максимальной производительности вашей баз данных.

Пройдемся по базе. Что вас ждет после запуска кластера ClickHouse в облаке Selectel?

⚡Скорость. Кластеры рассчитаны на хранение и быструю обработку даже петабайтов данных и обработку тяжелых аналитических запросов.

⚡Надежность. В Multi-AZ кластерах ноды размещены в разных дата-центрах, чтобы инфраструктура продолжила работу даже при отключении одного из узлов.

⚡Экономичный расход. Может выполнять запросы к данным, хранящимся в S3 в формате Iceberg, без их копирования. Это позволяет сократить расходы более чем в два раза по сравнению с использованием только локальных дисков.

На вас — пилотирование, а обслуживание кластера забирает на себя Selectel.

Ускорьте работу с базами данных в облаке Selectel: https://slc.tl/x3zec

Реклама. АО "Селектел". erid:2W5zFJJ3EKT

❤2🔥2💔2

1.33K views09:03

Анализ данных (Data analysis)

Google Cloud вырос на 82% за год

Выручка облачного подразделения Alphabet достигла $24,8 млрд за квартал. В пересчёте на год это почти $100 млрд. Контрактные обязательства Google Cloud выросли до $514 млрд, превысив прогноз аналитиков в $488 млрд.

Рост всё сильнее связан с ИИ-инфраструктурой: облачными GPU, собственными TPU и доступом к моделям через Vertex AI. Результаты Alphabet стали первой серьёзной проверкой того, окупается ли гонка капитальных затрат на дата-центры. Только в 2026 году крупнейшие технологические компании собираются потратить на инфраструктуру более $700 млрд.

Одним из драйверов Google Cloud, вероятно, стала Anthropic. Компания заказала до миллиона TPU стоимостью в десятки миллиардов долларов, которые должны добавить более 1 ГВт мощности в течение 2026 года. С 2027 года партнёрство с Google и Broadcom расширится ещё на несколько гигаватт вычислений.

Google уже показывает, что огромные расходы на ИИ способны превращаться в реальную облачную выручку. Теперь главный вопрос: хватит ли темпов роста, чтобы оправдать сотни миллиардов новых инвестиций.

👍2❤1🔥1

445 views10:35

About

Blog

Apps

Platform