Topic

#Robotique

La robotique combine mécanique, électronique et IA pour concevoir des machines capables d'agir dans le monde physique. Boston Dynamics, avec son robot Atlas, illustre l'intégration de la locomotion avancée et du contrôle par apprentissage.

40Articles
11Sources
63Signal moyen
arXiv cs.AI·

AURA: Action-Gated Memory for Robot Policies at Constant VRAM

AURA-Mem propose une mémoire récurrente de taille constante (4,224 bytes) pour les politiques robotiques, avec une porte apprise qui n'écrit en mémoire que si l'observation change l'action suivante. Sur LIBERO-Long avec OpenVLA-OFT 7B, elle égale la politique de base (0.233 de succès) tout en réduisant les écritures mémoire de 7× et la consommation VRAM de 6,061× vs KV-cache.

RobotiqueAgents IARaisonnement
SIG
78
HYP
00
arXiv cs.AI·

Closed-Loop Neural Activation Control in Vision-Language-Action Models

CTRL-STEER propose un cadre de contrôle en boucle fermée pour les modèles Vision-Language-Action (VLA). Au lieu d'utiliser un coefficient de direction fixe, la méthode adapte dynamiquement la force d'intervention via des contrôleurs PID ou par apprentissage par renforcement. Tests sur OpenVLA et LIBERO montrent une meilleure stabilité et un meilleur compromis entre direction et succès de tâche.

VisionAgents IAReinforcement learning
SIG
72
HYP
00
arXiv cs.AI·

From Noise to Control: Parameterized Diffusion Policies

Parameterized Diffusion Policy (PDP) conditionne les politiques de diffusion sur des paramètres continus dans une variété de comportements apprise. Cette approche permet l'interpolation fluide entre stratégies et l'adaptation efficace à de nouvelles contraintes sans mise à jour des poids. Résultats améliorés sur benchmarks multimodaux en simulation et robots réels.

RobotiqueReinforcement learningPapers
SIG
72
HYP
00
arXiv cs.AI·

Uncertainty-Aware and Temporally Regulated Expert Advice in Reinforcement Learning for Autonomous Driving

Framework d'apprentissage par renforcement pour la conduite autonome qui utilise des conseils d'experts régulés par l'incertitude. Les seuils adaptatifs d'incertitude épistémique/aléatoire déclenchent l'intervention d'experts, tandis qu'une stratégie de commitment-cooldown limite la dépendance. Testé sur CARLA : +5-7% de succès vs baseline IQN.

Reinforcement learningRobotiqueSécurité IA
SIG
72
HYP
00
Reddit r/MachineLearning·

Before we spend months processing open-source robotics datasets, tell us why this is a bad idea [D]

Deux étudiants ML questionnent l'hypothèse que la robotique souffre d'une pénurie de données. Après normalisation de datasets publics, ils suspectent que le vrai problème est l'interopérabilité : schémas hétérogènes, capteurs différents, cadres de coordonnées incompatibles. Ils demandent aux équipes robotique si elles utiliseraient réellement des données d'autres équipes via une API unifiée.

RobotiqueRAGOpen source
SIG
35
HYP
00
arXiv cs.AI·

Ultra-Reduced-Impact-Encased-Logging (URIEL): propose a new method for selective sustainable logging and post-harvest silvicultural treatment in tropical forest using airborne robotics systems

URIEL propose une méthode de coupe sélective en forêt tropicale combinant hélicoptères, robotique et IA pour minimiser les dégâts collatéraux. Simulation numérique et analyse économique montrent la viabilité du concept, mais sa mise en œuvre dépend de l'intégration des parties prenantes (industrie, gouvernements, entreprises certifiées, populations autochtones).

RobotiqueAgents IAPapers
SIG
35
HYP
00
Reddit r/MachineLearning·

Wall-OSS-0.5: 4B VLA with open training code and zero-shot real-robot evaluation[D]

Wall-OSS-0.5 est un VLA de 4B paramètres d'X Square Robot avec code d'entraînement ouvert. Évaluation zéro-shot sur 17 tâches robotiques réelles : 4 tâches >80% de progrès, dont Rope Tightening (82%). Après fine-tuning : 60.5% de progrès moyen (+17.5pp vs pi0.5). Architecture Mixture-of-Transformers avec tokenizer RVQ aligné vision et optimiseur DMuon distribué.

RobotiqueVisionGénération de code
SIG
78
HYP
00
arXiv cs.LG·

Bayesian Deployment Approval for Learned Landing Controllers under Finite Rollout Validation

Framework bayésien pour valider le déploiement de contrôleurs d'atterrissage autonomes entraînés par RL. Utilise l'inférence bayésienne pour quantifier l'incertitude sur la capacité réelle des politiques, au-delà des métriques empiriques (reward, taux de succès). Expériences avec PPO et SAC montrent que l'optimisation empirique surconfiance, tandis que l'inférence bayésienne calibre mieux la confiance de déploiement.

Reinforcement learningSécurité IARobotique
SIG
72
HYP
00
arXiv cs.LG·

Faster Thermal Profiling of a Lunar Rover with Machine Learning Adapted Finite Difference Model

Un framework de machine learning informé par la physique (PIML) pour modéliser thermiquement un rover lunaire. Un réseau de neurones adaptatif détermine le maillage 3D en différences finies selon les charges thermiques, améliorant la précision de 50% vs modèles coarse-mesh et 39% vs ANN pur, tout en étant 3x plus rapide que les simulations haute-fidélité.

RaisonnementBenchmarksRobotique
SIG
72
HYP
00
arXiv cs.LG·

Transferable Reinforcement Learning via Probabilistic Latent Embeddings and Dynamic Policy Adaptation for Sim-to-Real Deployment

Framework RL pour transfert de politique sim-to-real via embeddings latents probabilistes et adaptation dynamique. Utilise meta-RL et CMDPs pour inférer la représentation latente de l'environnement, avec formulation distributional RL ajustant dynamiquement les niveaux de risque selon la précision d'estimation du contexte latent.

Reinforcement learningRobotiqueSécurité IA
SIG
72
HYP
00
arXiv cs.LG·

Planning Neural Dynamics with Lie Group Embedding through Supervised Projective Manifold Learning

LieEDNN propose des réseaux de neurones dynamiques intégrant les groupes de Lie pour modéliser les symétries continues. L'approche résout l'incompatibilité entre l'arithmétique additive des réseaux et la géométrie non-euclidienne via des actions adjointes sur l'algèbre de Lie. Application testée sur SE(3) pour manipulateurs télescopiques.

RaisonnementRobotiquePapers
SIG
72
HYP
00
arXiv cs.AI·

Neuro-Inspired Inverse Learning for Planning and Control

Framework neuro-inspiré pour la planification et le contrôle embodié. L'Inverter utilise l'Inverse Learning (IL) pour générer des séquences d'actions multi-étapes. Améliore les baselines offline-RL et diffusion-planner sur D4RL (+24.2% en moyenne) avec 100-1000x moins de calcul à l'inférence. Application : synthèse de portes quantiques avec fidélité GRAPE en 1000x plus rapide.

RaisonnementReinforcement learningRobotique
SIG
72
HYP
00
arXiv cs.AI·

Beyond Predefined Learning Objects: A Thinking-Learning Interaction Model for Up-to-Date Autonomous Robot Learning

Modèle d'interaction pensée-apprentissage pour robots autonomes en environnements changeants. La pensée guide l'apprentissage (identification de changements, sélection d'évidences, planification), l'apprentissage améliore la pensée (mise à jour des connaissances, stratégies d'action). Résultats : précision de reconnaissance 0.419→0.845, longueur d'action 13.0→4.0, taux de sélection d'évidences 0.272→0.965.

RobotiqueReinforcement learningRaisonnement
SIG
72
HYP
00
arXiv cs.CL·

Fast-dDrive: Efficient Block-Diffusion VLM for Autonomous Driving

Fast-dDrive est un modèle VLA (Vision-Language-Action) basé sur la diffusion par blocs pour la conduite autonome. Il combine raffinement bidirectionnel au sein d'unités sémantiques avec un ordre causal strict, gère les sorties JSON structurées et atteint 12× d'accélération de débit avec SGLang. Sur nuScenes, erreur L2 réduite à 0,32m (amélioration 22%), SOTA sur WOD-E2E.

VisionGénération de codeRaisonnement
SIG
78
HYP
00
arXiv cs.AI·

ScenePilot: Controllable Boundary-Driven Critical Scenario Generation for Autonomous Driving

ScenePilot génère des scénarios critiques pour tester les systèmes de conduite autonome via apprentissage par renforcement multi-objectif. Le framework combine une mesure de faisabilité physique (RSS) avec un prédicteur de risque pour cibler les scénarios à la limite : physiquement possibles mais causant des défaillances. Résultats : +6,2 points de collision sur SafeBench tout en préservant la validité physique.

Reinforcement learningSécurité IAÉvaluations
SIG
78
HYP
00
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> rerun-io /</span> rerun

Rerun est un outil open-source pour visualiser, interroger et streamer des données robotiques multimodales destinées à l'entraînement. Plateforme de visualisation et de gestion de données pour projets robotiques complexes.

RobotiqueOpen sourceOutils
SIG
65
HYP
00