Data Science. SQL hub
35.8K subscribers
1.12K photos
93 videos
37 files
1.14K links
По всем вопросам- @workakkk

@itchannels_telegram - 🔥лучшие ит-каналы

@ai_machinelearning_big_data - Machine learning

@pythonl - Python

@pythonlbooks- python книги📚

@datascienceiot - ml книги📚

РКН: https://vk.cc/cIi9vo

#VRHSZ
Download Telegram
Media is too big
VIEW IN TELEGRAM
✔️ IPO OpenAI произойдет в 2027 году

Сэм Альтман сообщил сотрудникам, что выход на биржу откладывается на год. Поданный проспект эмиссии он назвал маневром для сохранения тактической свободы. В качестве альтернативы сотрудникам предложили выкупить их акции по цене $687,69 за штуку.

Задержка объясняется прогрессом в разработке самообучающегося ИИ. По мнению главы OpenAI, в период непредсказуемого развития технологий компании безопаснее оставаться непубличной.

Дополнительный фактор переноса - размещение акций Anthropic. Конкурент показывает лучшие метрики роста, тогда как OpenAI сжигает капитал.

В июне компания планирует выпустить новую модель с индексом 5.6, которую внутри оценивают как серьезный шаг вперед по сравнению с GPT-5.5.
theinformation.com

✔️ Arcee AI переезжает из AWS на Hugging Face

Данные компании разместят в сервисе Hugging Face Buckets, который оснащен встроенной CDN и оптимизирован для работы с весами моделей.

Главная причина миграции в отсутствии платы за исходящий трафик. Единое хранилище позволит Arcee AI избежать вендор-лока и запускать обучающие кластеры у любых облачных провайдеров без затрат на перенос данных.

На Hugging Face лаборатория поддерживает более 200 проектов. Среди них - файнтюн SuperNova на базе Llama 3.1, семейство моделей Trinity и открытый датасет The-Tome, включающий 1,75 млн образцов для обучения ИИ-агентов.
huggingface.co

✔️ NotebookLM получил среду для запуска кода, агентов и модель Gemini 3.5

Google обновила платформу NotebookLM. Система перешла на Gemini 3.5 и движок Antigravity, получила поддержку автономных агентов и возможность запуска кода.

Каждый блокнот теперь оснащается облачным инстансом, который включает более 100 скиллов для выполнения кода и анализа данных. В тестах новая архитектура превосходит предыдущую в 65% случаев по 5 ключевым метрикам.

В сервисе появилась возможность начинать исследования без загрузки данных через агентный поиск релевантных материалов. Результаты попадают в базу с сохранением атрибуции.

Расширились форматы экспорта: PDF-отчеты с графиками, структурированные данные, таблицы Excel, презентации PowerPoint, а также изображения с помощью Nano Banana.

Обновление доступно пользователям с подпиской AI Ultra и корпоративным клиентам.
blog.google

✔️ Cohere выпустила свою первую открытую кодинг-модель

North Mini Code - open-source модель для программирования и координации агентов, построена на архитектуре MoE с 30 млрд общих и 3 млрд активных параметров. Модель обучена управлять субагентами, проектировать архитектуру систем и проводить код-ревью.

В бенчмарке Artificial Analysis Coding Index новинка набрала 33,4 балла. В сравнении с Devstral Small 2 на аналогичной аппаратной нагрузке пропускная способность генерации текста выше в 2,8 раза. Задержка между токенами ниже на 30% при сопоставимом времени до вывода первого токена.

Веса опубликованы на Hugging Face. Тестовый доступ открыт через API и платформу Model Vault.
cohere.com

✔️ Warner Music Group приобрела разработчика цифровых отпечатков Sureel AI

Технология Sureel AI создает цифровые отпечатки аудиозаписей, декомпозируя их на базовые элементы. Алгоритмы определяют, попал ли контент артиста в тренировочный датасет ИИ-модели или использовался при генерации нового трека.

Дополнительный модуль системы выявляет дипфейки, клонирование голоса и копирование визуального стиля. Архитектура платформы поддерживает работу с видео и изображениями, в базе стартапа проиндексированы миллионы цифровых активов.

Лейбл сохранит проект как независимую платформу, рассчитывая сделать ее стандартом для музыкальной индустрии.
wmg.com


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍2🔥2🤬1
OptimizerDuck - open-source утилита, после которой CCleaner уже не нужен

OptimizerDuck собирает в одном приложении 30+ твиков системы: от отключения телеметрии, Copilot, Cortana и рекламного ID до тонкой настройки автозагрузки, служб, питания и задержек ввода.

Укаждой настройки есть рейтинг риска. То есть вы заранее видите, что безопасно применить, а где лучше подумать, вместо классического сценария «нажал всё подряд и потом откатываешь систему».

Что умеет:

* отключать телеметрию Windows, Cortana, Copilot и рекламный ID
* управлять автозагрузкой приложений
* настраивать службы хоста под объём RAM
* включать кастомный план питания для высокой производительности
* снижать задержку клавиатуры для игр
* применять GPU-твики, которые обычно правят вручную через реестр

Все изменения обратимы. Не понравилось, можно откатить назад. можно откатить назад.

https://github.com/itsfatduck/optimizerDuck
👍85🔥2🥰1
📚 Библиотека для работы с SQLite в C++26 с использованием рефлексии

Reflite — это библиотека на C++26, которая упрощает взаимодействие с SQLite, позволяя использовать обычные структуры как основу для выполнения запросов. Она поддерживает основные операции: вставка, удаление, выборка и обновление, избавляя от лишнего шаблона кода.

🚀 Основные моменты:
- Легковесная библиотека в одном файле
- Поддержка операций INSERT, DELETE, SELECT, UPDATE
- Использует рефлексию для работы с типами структур
- Не требует полной реализации SQL, фокус на простоте
- Совместима с современными компиляторами C++26

📌 GitHub: https://github.com/KaruroChori/reflite

#cpp
8👍3🔥3
Google Research представила Gemini-SQL2 - новую систему text-to-SQL на базе Gemini 3.1 Pro.

Она превращает вопросы на обычном языке в исполняемые SQL-запросы, позволяя получать данные из баз без ручного написания кода.

На бенчмарке BIRD система показала state-of-the-art результат - 80,04% execution accuracy.

BIRD реально запускает запрос и проверяет, возвращает ли он правильный результат.

https://x.com/GoogleResearch/status/2065475343205740911
8🔥3👍2
Команда Tongyi Lab из Alibaba представила LOGOS, большую модель для всей естественной науки сразу.

Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции.

Разные научные объекты записываются одним общим языком токенов.

Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками.

По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.

🤗 HuggingFace: https://huggingface.co/LOGOS-Hub
💻 GitHub: https://github.com/LOGOS-Hub/LOGOS
📄 Paper: https://arxiv.org/abs/2606.16905
4👍2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Разберем математику бесконечности Сатору Годжо, которая работает не как обычный щит.

Он не просто останавливает удар в последний момент. Идея в том, что пространство между атакой и Годжо как будто делится на всё более маленькие отрезки.

Сначала объект проходит половину расстояния. Потом половину оставшегося. Потом ещё половину. И так снова и снова.

Математически это похоже на бесконечную сумму: одна вторая, одна четвёртая, одна восьмая, одна шестнадцатая.

Объект всё ближе, но до контакта так и не доходит.

На практике атака как будто замедляется почти до нуля. Чем ближе она к Годжо, тем сильнее падает её эффективная скорость.

Поэтому Бесконечность — это не просто барьер. Это контроль пространства, где противник застревает в бесконечном приближении.
11👍2👎1
QuestDB - это open-source база данных для time-series данных, созданная для высокоскоростной записи и SQL-запросов с низкой задержкой.

Внутри у неё многоуровневый storage engine и SIMD-ускоренное выполнение.

Что важно:

- Колоночное хранение данных

Параллельное векторное выполнение запросов и использование SIMD-инструкций для ускорения обработки.

- Многоуровневое хранение

От WAL до нативного колоночного формата и Parquet в object storage.

- SQL-расширения для time-series

Поддержка ASOF JOIN, SAMPLE BY и LATEST ON.

- Интеграции

Поддерживает Postgres wire protocol и REST API, поэтому её проще подключать к существующей инфраструктуре.

https://github.com/questdb/questdb
2
This media is not supported in your browser
VIEW IN TELEGRAM
Вы можете выучить SQL по «Тетради смерти»

О времена, о нравы)
👍135😁5🔥3👎2
OpenAI выпустила полную версию GPT-5.5-Cyber - своей самой продвинутой модели для авторизованной защитной кибербезопасности.

Новая модель набрала 85,6% на CyberGym и обошла:

• Mythos 5 — 83,8%

• раннюю версию GPT-5.5-Cyber — 81,9%

• GPT-5.5 — 81,8%

• GPT-5.4 — 79,0%

• Claude Opus 4.7 — 73,1%

https://x.com/sama/status/2069121360744550796
3👍2🔥2🤔2🤯1
Мы вообще понимаем, насколько Месси статистически ненормален?

Я наткнулся на цифру: по голам + ассистам за 90 минут он почти на 6 стандартных отклонений выше среднего нападающего из топ-лиг.

Для контекста: это уже не «очень сильный игрок».

Это уровень, который статистика почти не ожидает увидеть при жизни одного поколения.

Вот почему спор про Месси часто ломается: его сравнивают как футболиста, а он по цифрам ближе к аномалии.

Мы реально застали сбой системы.

Или всё ещё есть сомневающиеся?
🔥28👍5🥰21
Как называется роль (пользователь) в PostgreSQL, которая обладает всеми правами доступа и может обходить любые проверки разрешений?
Anonymous Quiz
22%
Admin
25%
Root
15%
Owner
38%
Superuser
👍11🔥4😁31
⚡️ SQL-трюк, который редко используют: `IS DISTINCT FROM`

Проблема обычного сравнения:


NULL <> 'new value'


не возвращает true. В SQL NULL ломает привычную логику сравнений.

Вместо этого можно писать так:


UPDATE users
SET email = :new_email
WHERE id = :id
AND email IS DISTINCT FROM :new_email;


Зачем это нужно:

1. обновляешь строку только если значение реально изменилось
2. корректно работаешь с NULL
3. не плодишь лишние записи в WAL
4. не триггеришь лишние updated_at, triggers и replication events

Особенно полезно в API, где фронт постоянно присылает одни и те же данные.

Маленький оператор, который делает SQL сильно аккуратнее.
👍175🤯1
Media is too big
VIEW IN TELEGRAM
SQL-инъекция за 40 секунд: Лайт против L

Разбираем SQL-инъекцию на пальцах в формате Лайт против L. Что это такое, как обычная строка ввода меняет логику запроса, к чему это приводит и какими способами реально закрыть дыру. Коротко, по делу и так, чтобы запомнилось.

Больше таких видео: https://www.youtube.com/shorts/c4gBi094jkU

@sqlhub
👍75🔥4
Глобальный дефицит RAM может начать ослабевать к 2028 году.

Об этом заявил CEO Micron Санджай Мехротра на earnings call за Q3 2026.

Но важная деталь: речь не о том, что цены резко вернутся к прежним уровням.

Micron говорит осторожнее.

Поставки могут улучшиться в 2028 году, но спрос тоже продолжит расти. Особенно со стороны дата-центров, AI-инфраструктуры и серверного рынка.

То есть новая мощность может прийти, но её сразу начнут съедать hyperscalers, облака и AI-кластеры.

Для потребителей это означает простую вещь: облегчение возможно, но дешёвая память не гарантирована.

RAM становится не просто компонентом для ПК, а частью глобальной гонки за compute.
6👍1🔥1🤯1
tracesage добавляет локальный tracing без инфраструктуры для LangChain/LangGraph-агентов всего в две строки.

Он записывает каждый chain, tool call и LLM call в SQLite, а затем показывает запуск в браузере как live graph и timeline.

Open source, установка через pip install, лицензия MIT.

https://github.com/kjgpta/tracesage
This media is not supported in your browser
VIEW IN TELEGRAM
Когда баз много, администрирование превращается в ручное управление хаосом: серверы, кластеры, бэкапы, мониторинг и диагностика.

🐘 Postgres Professional на бесплатном вебинаре покажет, как управлять множеством баз через единый веб-интерфейс Postgres Pro Enterprise Manager.

📊 Это графическая платформа для DBA, DevOps, архитекторов и технических лидеров. Она входит во все редакции Postgres Pro и решает задачи администрирования без ручного написания SQL-команд.

На вебинаре покажут, как с помощью PPEM:

Мониторить инфраструктуру

Управлять экземплярами БД

Работать с бэкапами

Искать проблемы и ускорять диагностику

🤖 Отдельно покажут ИИ-ассистента в новой версии платформы: он обращается к документации и помогает быстрее решать типовые задачи.

📅 30 июня, вторник, 11:00 по Москве, продолжительность — 2 часа с Q&A.

Регистрируйтесь и приходите посмотреть PPEM в деле. Участие бесплатное.

Реклама ООО «ППГ» Инн: 7707083893 Erid: 2VtzqwfUQwK
1👍1🔥1
Postgres 19 получил хорошие улучшения в управлении I/O.

В Postgres 18 появились три режима: io_uring, worker и sync - поведение как в 17-й версии.

Мне очень понравилась производительность и контроль, которые io_method=worker принёс в Postgres. Вместе с ним можно было задать io_workers=X, то есть количество background workers, выделенных под I/O. Бенчмарки 17 vs 18 - на картинке ниже.

В 19-й версии это расширили: теперь пул может динамически расти через четыре настройки:

io_min_workers - минимальный размер пула I/O workers

io_max_workers - максимальный размер пула

io_worker_idle_timeout - скорость уменьшения пула

io_worker_launch_interval - скорость увеличения пула

По сути, теперь это больше похоже на I/O connection pool, а не на простую статическую настройку.

Мне нравится это направление. Жду бенчмарки. Скоро?
2👍1🔥1
Как называется специальная схема в PostgreSQL, где хранятся временные таблицы, созданные в рамках текущей сессии?
Anonymous Quiz
38%
temp_schema
42%
pg_temp_NNN
5%
public
15%
pg_catalog
🎥 Вебинар: Архитектурные паттерны AI-агентов: как проектировать автономные решения для бизнес-задач

На уроке рассмотрим:
• Как создавать архитектуру автономных AI-агентов, способных принимать решения и выполнять задачи;
• Какие архитектурные паттерны применяются при проектировании агентных решений;
• Как использовать агентные циклы, такие как ReAct и Plan-and-Execute, в прикладных сценариях;
• Как спроектировать AI-архитектуру для автоматизации бизнес-процесса на практическом примере.

После занятия вы будете знать:
• Как проектировать архитектуру AI-агентов под реальные бизнес-задачи;
• Как документировать и проверять архитектурные решения на разных уровнях детализации;
• Как применять профессиональные подходы и инструменты для разработки AI-решений;

Открытый урок проходит в преддверии старта курса «ИИ-архитектор».

👉 Для участия зарегистрируйтесь: https://otus.pw/zuvm/?erid=2W5zFGXnRLD


Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
1