Page 94 sur 192

ToutHaut signalRécent

7679 articles

Sapient Intelligence releases HRM-Text 1B: 40B tokens, ~$1k pretrain, beats Llama3.2 3B on MATH and DROP

Sapient Intelligence publie HRM-Text 1B : 1B paramètres entraîné sur 40B tokens en 1,9 jours avec ~$1k de budget. Surpasse Llama3.2 3B sur MATH (56.2 vs 48.0) et DROP (82.2 vs 45.2), mais reste en retrait sur MMLU (60.7 vs 64.7 pour Qwen3.5 2B). Modèle spécialisé en raisonnement multi-étapes.

Llama Raisonnement Benchmarks

SIG

HYP

OpenAI Blog·19 mai

Advancing content provenance for a safer, more transparent AI ecosystem

OpenAI déploie des outils de provenance de contenu : Content Credentials, SynthID et un vérificateur pour identifier et valider les médias générés par IA.

OpenAI Sécurité IA Outils

SIG

HYP

Vercel AI Blog·19 mai

Gemini 3.5 Flash on AI Gateway

Gemini 3.5 Flash est disponible sur Vercel AI Gateway avec amélioration de la compétence en code, exécution parallèle d'agents, et raisonnement renforcé. Le modèle utilise par défaut le niveau de thinking « medium » pour équilibrer qualité et coût. Intégration via SDK avec support observabilité et routage intelligent.

Gemini Agents IA Génération de code

SIG

HYP

Page 94 sur 192

Sapient Intelligence releases HRM-Text 1B: 40B tokens, ~$1k pretrain, beats Llama3.2 3B on MATH and DROP

Advancing content provenance for a safer, more transparent AI ecosystem

Gemini 3.5 Flash on AI Gateway

Resource-Element Energy Difference for Noncoherent Over-the-Air Federated Learning

Answer Only as Precisely as Justified: Calibrated Claim-Level Specificity Control for Agentic Systems

A Machine with Short-Term, Episodic, and Semantic Memory Systems

The Loupe: A Plug-and-Play Attention Module for Amplifying Discriminative Features in Vision Transformers

Lost or Hidden? A Concept-Level Forgetting in Supervised Continual Learning

SSL4RL: Revisiting Self-supervised Learning as Intrinsic Reward for Visual-Language Reasoning

Unlocking the Potential of Diffusion Language Models through Template Infilling

Geometry-aware 4D Video Generation for Robot Manipulation

Needles in the Landscape: Semi-Supervised Pseudolabeling for Archaeological Site Discovery under Label Scarcity

Spatially Aware Linear Transformer (SAL-T) for Particle Jet Tagging

LEAF: A Living Benchmark for Event-Augmented Forecasting

EmergentBridge: Improving Zero-Shot Cross-Modal Transfer in Unified Multimodal Embedding Models

Two-Dimensional Quantization for Geometry-Aware Audio Coding

GPU-Accelerated Deep Learning for Heatwave Prediction and Urban Heat Risk Assessment

Double-Calibration: Towards Reliable LLMs via Calibrating Knowledge and Reasoning Confidence

Watching, Reasoning, and Searching: A Video Deep Research Benchmark on Open Web for Agentic Video Reasoning

Speech-Hands: A Self-Reflection Voice Agentic Approach to Speech Recognition and Audio Reasoning with Omni Perception

"The Whole Is Greater Than the Sum of Its Parts": A Compatibility-Aware Multi-Teacher CoT Distillation Framework

MiniGPT: Rebuilding GPT from First Principles

SuReNav: Superpixel Graph-based Constraint Relaxation for Navigation in Over-constrained Environments

GRAFT: Decoupling Ranking and Calibration for Survival Analysis

Can Heterogeneous Language Models Be Fused?

Empowering VLMs for Few-Shot Multimodal Time Series Classification via Tailored Agentic Reasoning

Perception-based Image Denoising via Generative Compression

Unleashing the Potential of Diffusion Models for End-to-End Autonomous Driving

PersonaDual: Balancing Personalization and Objectivity via Adaptive Reasoning

Forgetting is Competition: Rethinking Unlearning as Representation Interference in Diffusion Models

Self-Play Only Evolves When Self-Synthetic Pipeline Ensures Learnable Information Gain

Spatiotemporal Robustness of Temporal Logic Tasks using Multi-Objective Reasoning

Explicit Logic Channel for Validation and Enhancement of MLLMs on Zero-Shot Tasks

ARROW: Augmented Replay for RObust World models

Early Pruning for Public Transport Routing

Permutation-Consensus Listwise Judging for Robust Factuality Evaluation

Limitations of Sequence-Based Protein Representations for Parkinson's Disease Classification: A Leakage-Free Benchmark

Black-Box Optimization From Small Offline Datasets via Meta Learning with Synthetic Tasks

PriHA: A RAG-Enhanced LLM Framework for Primary Healthcare Assistant in Hong Kong

A Lightweight Transformer for Pain Recognition from Brain Activity