Retour au feed
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> facebookresearch /</span> sam3

Signal
85
Hype
15
En 3 lignesMeta publie le code et les checkpoints de SAM 3 (Segment Anything Model 3). Le repo inclut l'inférence, le fine-tuning et des notebooks d'exemple pour la segmentation d'images.

## SAM 3 : Meta ouvre le code de sa troisième génération de segmentation universelle

### Ce qui est publié

Meta Research publie sur GitHub le repo `facebookresearch/sam3`, contenant le code d'inférence, les scripts de fine-tuning, les checkpoints entraînés et des notebooks d'exemple pour SAM 3 (Segment Anything Model 3). C'est une publication open-source complète — pas un accès API fermé, pas un modèle derrière une licence commerciale restrictive — ce qui place SAM 3 directement dans les mains des praticiens CV et MLOps.

### Contexte : la trajectoire SAM

SAM 1 (avril 2023) a posé le cadre : un modèle de segmentation promptable (point, boîte, masque) entraîné sur SA-1B, 1 milliard de masques, 11 millions d'images. Il a immédiatement déplacé les pipelines de segmentation semi-automatique dans les domaines médical, satellite, robotique et e-commerce. SAM 2 (août 2024) a étendu la capacité aux vidéos avec un mécanisme de mémoire streaming, atteignant des performances supérieures aux méthodes supervisées sur DAVIS et MOSE tout en tournant en temps quasi-réel sur GPU. SAM 3 représente la troisième itération — les détails architecturaux précis du repo n'étant pas encore entièrement documentés publiquement au moment de cette publication, mais la progression de la série indique des améliorations sur la précision des masques fins, la robustesse aux prompts ambigus et potentiellement une meilleure généralisation zero-shot sur des domaines spécialisés (imagerie médicale, télédétection).

### Pourquoi le signal est à 85

Trois raisons structurelles :

**1. Le fine-tuning inclus change l'équation d'adoption.** SAM 1 et SAM 2 nécessitaient des adaptations tierces (MedSAM, EfficientSAM, SAM-HQ) pour être compétitifs sur des domaines spécifiques. Intégrer le fine-tuning directement dans le repo officiel signifie que les équipes peuvent adapter SAM 3 à leurs données propriétaires sans reconstruire l'infrastructure d'entraînement depuis zéro. C'est un raccourcissement du cycle d'intégration de plusieurs semaines.

**2. Les checkpoints téléchargeables éliminent la barrière de calcul.** Reproduire les poids depuis zéro sur SA-1B est hors de portée pour 99% des équipes. La mise à disposition directe des checkpoints transforme SAM 3 en composant plug-and-play pour les pipelines de production.

**3. La temporalité concurrentielle.** Segment Anything de Meta reste la référence de facto en segmentation fondationnelle open-source. Google, Stability AI et les acteurs open-source (Grounded-SAM, FastSAM, EfficientViT-SAM) ont tous construit autour ou contre SAM 1/2. SAM 3 remet le compteur à zéro sur les benchmarks de comparaison.

### Perdants potentiels

- **Les wrappers et forks spécialisés** (MedSAM, SAM-HQ, Grounded-SAM) voient leur avantage différentiel se réduire si SAM 3 intègre nativement de meilleures performances sur les cas limites qu'ils adressaient. - **Les solutions de segmentation commerciales** (Scale AI, Labelbox, V7 Labs pour l'annotation assistée) subissent une pression tarifaire supplémentaire : un modèle fondationnel open-source de qualité supérieure réduit la valeur perçue des couches d'annotation propriétaires. - **Les équipes ayant investi dans des pipelines SAM 2 fine-tunés** devront évaluer le coût de migration versus le gain de performance — un arbitrage non trivial si les checkpoints SAM 2 sont déjà en production.

### Ce qu'il faut surveiller immédiatement

Les benchmarks comparatifs sur COCO panoptic, ADE20K et les datasets médicaux (REFUGE, PolypPVT) arriveront dans les 2-3 semaines suivant la publication — c'est le délai habituel de la communauté pour produire des évaluations indépendantes. Les chiffres sur la latence d'inférence (ms/image sur A100 et sur hardware edge) seront déterminants pour les cas d'usage temps réel. La licence d'utilisation commerciale mérite également une lecture attentive : SAM 1 et SAM 2 utilisaient Apache 2.0, toute restriction sur SAM 3 changerait significativement le calcul d'adoption en production.

Lire la source
Ton avis ?
Meta AIVisionOpen source

Résumé généré par Claude — vérifié par l'humain