Le signal de l'IA, pas le bruit.

Value-and-Structure Alignment for Routing-Consistent Quantization of Mixture-of-Experts Models

VSRAQ, une méthode de quantification post-entraînement pour modèles Mixture-of-Experts, préserve la sélection d'experts lors de la quantification en alignant les valeurs de routage et la structure des décisions top-k. Réduit la dégradation sans surcoût d'inférence.

Benchmarks

SIG

72

HYP

15

arXiv cs.CL·5 juin

Multilingual Coreference Resolution via Cycle-Consistent Machine Translation

Méthode de résolution de coréférence multilingue utilisant la traduction automatique cyclique (anglais → langue cible → anglais) pour générer des données d'entraînement. La qualité des traductions est validée via similarité cosinus en espace latent BERT. Gains significatifs sur 4 langues peu dotées en ressources.

Benchmarks Embeddings Papers

SIG

72

HYP

15

arXiv cs.CL·5 juin

Bootstrapping Semantic Layer from Execution for Text-to-SQL

GATE (Grounding After Test from Execution) bootstrappe les groundings manquants en text-to-SQL via feedback d'exécution. Le système maintient plusieurs hypothèses de grounding ouvertes, exécute les parties déjà groundées pour obtenir des observations, puis valide et mémorise les hypothèses confirmées. Cette mémoire d'exécution s'accumule et améliore les performances sur benchmarks réels et contrôlés.

Génération de code Raisonnement Benchmarks

SIG

72

HYP

18

arXiv cs.CL·5 juin

A Model of Multi-turn Human Persuadability Using Probabilistic Belief Tracing

PERSUASIONTRACE est un framework pour étudier la persuasion dans les interactions humain-LLM. Il enregistre les changements de croyances multi-tours, annote les stratégies rhétoriques (logos/pathos/ethos), et évalue les simulateurs par fidélité aux dynamiques humaines réelles. Un modèle bayésien maintenant un état de croyance latent explicite atteint 81/100 en ressemblance humaine vs 64 pour les LLMs vanilla.

Raisonnement Évaluations Sécurité IA

SIG

72

HYP

28

arXiv cs.CL·5 juin

Multilingual Detection of Alzheimer's Disease from Speech: A Cross-Linguistic Transfer Learning Approach

Détection multilingue de la maladie d'Alzheimer à partir de la parole via apprentissage par transfert cross-linguistique. Modèles transformer entraînés sur l'anglais, le chinois, l'arabe et l'hindi atteignent 82% F1 avec généralisation cross-linguistique. Inférence en 0,5s pour dépistage temps réel.

Papers Benchmarks Voix

SIG

72

HYP

25

arXiv cs.LG·5 juin

Data-efficient flood depth prediction through domain-aware coreset selection and tabular foundation models

Pipeline de sélection de coreset sensible au domaine pour prédiction de profondeur de crue en temps quasi-réel. Utilise un modèle fondation tabulaire conditionné à l'inférence. Atteint R²=0.663 sur 9 bassins versants de Houston avec 0.7% des données d'entraînement, sans réentraînement par bassin.

Benchmarks Fine-tuning RAG

SIG

72

HYP

15

arXiv cs.LG·5 juin

Differentiable Efficient Operator Search

Efficient Operator Search propose un cadre différentiable pour optimiser automatiquement les opérateurs de réduction de tokens dans les modèles multimodaux. Le framework recherche où réduire les tokens, combien en conserver, et comment traiter l'information réduite. Les expériences montrent des compromis accuracy-efficacité compétitifs, notamment sous réduction agressive de tokens visuels.

Vision Benchmarks Papers

SIG

72

HYP

18

arXiv cs.LG·5 juin

DP-MacAdam: Differentially Private Mechanism with Adaptive Clipping and Adaptive Momentum

DP-MacAdam combine le clipping adaptatif et le momentum adaptatif en DP-SGD. L'algorithme réutilise les mêmes estimations de moyenne et variance pour ajuster le seuil de clipping et accélérer l'entraînement. Évaluation empirique montre amélioration d'utilité du modèle vs DP-SGD, AdaClip, DP-Adam sans tuning manuel.

Reinforcement learning Sécurité IA Papers

SIG

72

HYP

15

arXiv cs.CL·5 juin

When New Generators Arrive: Lifelong Machine-Generated Text Attribution via Ridge Feature Transfer

RidgeFT, un framework d'apprentissage continu sans rejeu d'exemplaires, attribue les textes générés par IA à leurs modèles sources. La méthode gèle un encodeur entraîné initialement, stocke des statistiques suffisantes par classe, et utilise la régression ridge en forme fermée pour adapter les nouveaux générateurs tout en conservant les anciens.

Benchmarks Sécurité IA Alignement

SIG

72

HYP

15

arXiv cs.CL·5 juin

An ERP Study on Recursive Locative Processing in Mandarin-Speaking Children with Autism

Étude ERP sur 24 enfants (12 autistes, 12 contrôles) examinant le traitement des constructions locatives récursives en mandarin. Les enfants autistes montrent une prédiction structurale réduite (P200 atténué), une intégration sémantique accrue (N400 augmenté) et une réanalyse syntaxique diminuée (P600 réduit), avec variabilité inter-individuelle accrue en latéralisation hémisphérique.

Raisonnement Sécurité IA

SIG

72

HYP

08

arXiv cs.LG·5 juin

CausalPOI: Spatio-Temporal Graph-Based Causal Modeling for Cold-Start POI Check-in Forecasting

CausalPOI propose un framework de causal representation learning pour prédire les patterns de check-in de nouveaux Points of Interest (POI) en milieu urbain. Le modèle utilise des graphes spatio-temporels fonctionnels et simule des scénarios contrefactuels pour capturer les effets causaux des interventions urbaines, surpassant les baselines sur les données SafeGraph.

Papers Raisonnement Benchmarks

SIG

72

HYP

25

arXiv cs.LG·5 juin

Mamba-Assisted Non-Markovian Closure for Reduced-Order Modeling

Framework Mamba-Assisted Closure (MAC) pour la modélisation d'ordre réduit de systèmes dynamiques haute dimension. Utilise Mamba comme modèle de séquence pour prédire le terme de fermeture non-Markovien inspiré du formalisme Mori-Zwanzig. Surpasse GRU et méthode Wilks sur équation Burgers visqueuse et système Lorenz '96 chaotique.

Papers Benchmarks Raisonnement

SIG

72

HYP

15

arXiv cs.LG·5 juin

Learned Subspace Compression for Communication-Efficient Pipeline Parallelism

MAPL (Manifold Aware Projection Learning) compresse les activations inter-étages en pipeline parallelism via projections orthogonales apprises sur variété de Stiefel. Testé sur LLaMA 150M-1B, la méthode réduit la communication sans dégradation significative vs. Subspace Networks.

Llama Infrastructure Papers

SIG

72

HYP

15

arXiv cs.CL·5 juin

Efficient Punctuation Restoration via Weighted Lookahead Scoring Method for Streaming ASR Systems

Méthode de restauration de ponctuation pour ASR streaming basée sur un scoring non-autorégressif avec lookahead limité. Préserve la transcription et décide à chaque limite de mot via comparaison d'hypothèses. Sur IWSLT 2017 : F1 macro 0.893 sans fine-tuning (K=2) et 0.937 avec fine-tuning, surpassant baselines prompt et ELECTRA.

Génération de code Benchmarks Évaluations

SIG

72

HYP

15

arXiv cs.CL·5 juin

Using Large Language Models to Support High Volume Application Review for an Undergraduate Research Program

Purdue University utilise GPT-4o, GPT-5-mini et GPT-5.2 pour évaluer 1 200 candidatures au programme SURF 2026. Les modèles notent les déclarations d'intention sur 6 critères (0-3 points), générant scores et justifications en 4,6 heures. GPT-5.2 adhère mieux à la grille d'évaluation. La révision finale par coordinateur prend 4 heures au lieu de plusieurs semaines.

GPT OpenAI Évaluations

SIG

72

HYP

25

arXiv cs.LG·5 juin

Generalized TV--$\ell_p$ Structured Priors for Bayesian $T_1$ Mapping

Nouvelle famille de priors bayésiens structurés combinant variation totale (TV) et normes ℓp pour l'imagerie T₁ médicale. Inférence via NUTS, évaluation sur données cérébrales, cardiaques et mammaires synthétiques/réelles. Réduit l'incertitude et le biais comparé aux approches ML et priors alternatifs.

Papers Benchmarks

SIG

72

HYP

15

arXiv cs.CL·5 juin

Domain-Aware Mispronunciation Detection and Diagnosis Using Language-Specific Statistical Graphs

Méthode de détection et diagnostic des erreurs de prononciation utilisant des graphes statistiques spécifiques à la langue. Approche capture les confusions phonémiques et les différences systématiques selon la langue maternelle (L1). F1-score de 59,52% sur le benchmark L2-ARCTIC.

Voix Benchmarks Papers

SIG

72

HYP

15

arXiv cs.LG·5 juin

A prism hierarchy of learning regimes in large linear autoencoders

Étude théorique des régimes d'apprentissage extrêmes dans les autoencodeurs linéaires de grande taille. Les auteurs identifient cinq régimes fondamentaux (large-data, small-data, mean-field, narrow-latent, free) associés aux faces d'un prisme triangulaire. Expressions explicites dérivées pour l'évolution de la perte en gradient flow.

Papers Raisonnement Benchmarks

SIG

72

HYP

15

arXiv cs.LG·5 juin

Staged Factorial Screening for Budget-Constrained Micro-Pretraining

Étude de screening factoriel par étapes pour l'optimisation d'hyperparamètres en micro-préentraînement sur GPU unique avec budget limité. 613 expériences testent l'effet de batch, profondeur et largeur du modèle sur 2-24h. Les facteurs D, A, B, C restent significatifs après correction statistique; la recherche aléatoire converge vers des régions similaires sans attribution causale.

Fine-tuning Benchmarks Infrastructure

SIG

72

HYP

15

arXiv cs.CL·5 juin

PEFT of SLM for Telecommunications Customer Support: A Comparative Study of LoRA Configurations with Energy Consumption Analysis

Étude systématique du fine-tuning efficace (LoRA) sur Qwen2.5-3B pour l'assistance client télécoms. 16 configurations LoRA évaluées sur 30 000 exemples synthétiques générés via Gemini 2.0 Flash. Résultat clé : la perte de validation (0.5024) ne corrèle pas avec la qualité jugée par GPT-5.2 et Claude 4.5 Sonnet. Analyse énergétique incluse.

Qwen Fine-tuning Évaluations

SIG

72

HYP

15

arXiv cs.CL·5 juin

Multi-Granularity Reasoning for Natural Language Inference

Nouvelle architecture MGRN pour l'inférence en langage naturel exploitant des représentations multi-granularité (lexicales, phrasales, contextuelles) dans un espace de raisonnement interactif. Surpasse les baselines sur plusieurs benchmarks publics.

Raisonnement Benchmarks Papers

SIG

72

HYP

28

arXiv cs.CL·5 juin

MCBench: A Multicontext Safety Assessment Benchmark for Omni Large Language Models

MCBench est un benchmark de sécurité pour modèles omnimodaux (vision, audio, texte) contenant 1196 scénarios répartis en 4 catégories. Les évaluations montrent que les LLMs omnimodaux actuels peinent à intégrer les indices multimodaux pour les jugements de sécurité, notamment sur les risques subtils.

Benchmarks Sécurité IA Vision

SIG

72

HYP

18

arXiv cs.LG·5 juin

Learning Manifold and It\^o Dynamics with Branched Neural Rough Differential Equations

Les équations différentielles neurales branchées (B-NRDEs) étendent les NRDEs pour capturer les dynamiques Itô sur variétés. Elles utilisent une structure Hopf-algébrique basée sur les arbres racinés de Grossman-Larson et Munthe-Kaas-Wright, préservant exactement les contraintes de variété. Validation sur volatilité Bergomi, dynamiques SO(3) et matrices SPD.

Papers Raisonnement Reinforcement learning

SIG

72

HYP

15

arXiv cs.CL·5 juin

What's in a Name? Morphological Shortcuts by LLMs in Pharmacology

Les LLMs s'appuient excessivement sur les affixes morphologiques pour raisonner sur les médicaments, générant du contenu clinique plausible pour des noms fictifs (ex: wugcillin). Une étude sur 653 médicaments montre que les modèles induisent le sens principalement via les affixes sans l'indiquer explicitement, créant un risque de sécurité en domaine médical.

Sécurité IA Alignement Évaluations

SIG

72

HYP

15

arXiv cs.CL·5 juin

QueryAgent-R1: Bridging Query Generation and Product Retrieval for E-Commerce Query Recommendation

QueryAgent-R1 est un framework multi-agent pour la recommandation de requêtes e-commerce. Il optimise l'alignement entre requêtes générées et produits récupérés via une boucle de validation basée sur l'inventaire réel. Avec RL et une récompense de cohérence, il améliore CTR de 2,9% et CVR de 3,1% en production.

Agents IA Reinforcement learning RAG

SIG

72

HYP

25

arXiv cs.LG·5 juin

Selective-Advantage Entropy-Adaptive Horizon GRPO: Asymmetric Token-Level Discounting for Efficient Reinforcement Learning of Language Models

SA-AH-GRPO, extension de GRPO, applique un discount asymétrique basé sur l'entropie aux tokens pour l'RL des LLMs. Sur GSM8K, le modèle Qwen 2.5-3B atteint Pass@1=0.858 avec variance réduite 3.6× vs GRPO standard, tout en préservant les gradients sur les trajectoires correctes.

Reinforcement learning Raisonnement Benchmarks

SIG

72

HYP

18

arXiv cs.LG·5 juin

Anomaly Detection for Electro-Hydrostatic Actuators using LSTM Autoencoder

Détection d'anomalies pour actionneurs électro-hydrostatiques (EHA) via LSTM autoencoder. Le modèle atteint 99,0% de précision moyenne, 100% de précision et F1-scores de 93,1–99,8% sur données de température et pression. Surpasse méthodes classiques (Z-score, Isolation Forest, k-means) en capturant dépendances temporelles.

Benchmarks Évaluations

SIG

72

HYP

15

arXiv cs.LG·5 juin

PyCC.id: A package for hypothesis-driven equation discovery with structural identifiability

PyCC.id est une bibliothèque Python pour la découverte d'équations différentielles guidée par hypothèses. Elle utilise des « squelettes » structurels inspirés par les courbes caractéristiques pour réduire l'espace de recherche et vérifier l'identifiabilité structurelle des modèles candidats. Supporte réseaux de neurones, régression symbolique et régression sparse.

Génération de code Papers Open source

SIG

72

HYP

15

arXiv cs.LG·5 juin

PJ-RoPE: A Fourier-Jet-Affine Position Space for Relative Attention

PJ-RoPE unifie les approches RoPE (phase de Fourier), Jordan-RoPE (jets finis) et ALiBi (récence affine) dans un espace de position relative unique et apprenable. Le cadre sépare les noyaux de biais scalaires des transformations de features rotatoires exactes, avec diagnostics adaptatifs et coordonnées LC/rapidité pour stabiliser les jets d'ordre élevé.

Raisonnement Benchmarks Papers

SIG

72

HYP

15

arXiv cs.CL·5 juin

Predict and Reconstruct: Joint Objectives for Self-Supervised Language Representation Learning

Nouvelle approche de pré-entraînement combinant MLM (Masked Language Modeling) et JEPA (Joint Embedding Predictive Architecture) pour les encodeurs texte. Modèle hybride entraîné sur Wikipedia anglais avec budget identique. Résultats : embeddings plus uniformes (-0.16 vs -0.05), géométrie spectrale riche, meilleur équilibre sémantique-lexical sur benchmarks GLUE.

Papers Fine-tuning Embeddings

SIG

72

HYP

18

Vercel AI Blog·5 juin

The skills.sh API is now available

Vercel lance l'API skills.sh, permettant d'interroger 600 000+ compétences de l'écosystème open-source. Authentification via token OIDC court terme, limite de 600 req/min par projet, accès aux audits de sécurité.

Outils Open source Infrastructure

SIG

72

HYP

25

Reddit r/LocalLLaMA·4 juin

BeeLlama v0.3.1 – latest llama.cpp with extras! DFlash, MTP, q6_0 cache, TurboQuant. Single RTX 3090: Qwen 3.6 27B & Gemma 4 31B up to 177.8 tps (4.93x over baseline)

BeeLlama v0.3.1 met à jour llama.cpp avec MTP, support Gemma 4 12B, DFlash multi-GPU et nouvelles options de cache (q6_0, TQ3_1S, TQ4_1S). Sur RTX 3090, Qwen 3.6 27B atteint 177.8 tps (4.93x baseline), Gemma 4 31B aussi optimisé. Binaires précompilés et images Docker fournis.

Llama Open source Génération de code

SIG

72

HYP

35

Reddit r/MachineLearning·4 juin

Building a Native 1-Bit LLM Engine in Pure Rust: Achieving 150+ TPS and 350MB Memory Footprint on Edge CPUs. [P]

Ingénieur développe un moteur d'inférence LLM 1-bit natif en Rust pur, sans PyTorch ni CUDA. Démontre 150+ tokens/sec et 350MB RAM sur CPU edge avec TinyLlama quantifié. Introduit algorithme propriétaire pour récupération d'erreur résiduelle et compression 16x tout en préservant la fluidité.

Génération de code Open source Benchmarks

SIG

72

HYP

58

The Decoder·4 juin

ChatGPT now saves narrative dossiers about you sorted by work, hobbies, and travel preferences

ChatGPT améliore son système de mémoire « Dreaming » en construisant des profils utilisateur cohérents à partir des conversations, organisés par thèmes (travail, loisirs, voyages). Le taux de succès pour maintenir les informations à jour passe de 52,2 % à 75,1 %.

GPT OpenAI

SIG

72

HYP

35

Reddit r/LocalLLaMA·4 juin

I accidentally crippled my 4x RTX 3090 LLM rig with a hidden PCIe 2.0 x4 slot and fixing it doubled Mistral 128B performance

Un utilisateur a découvert qu'une RTX 3090 était connectée à un slot PCIe 2.0 x4 caché sur sa carte mère Gigabyte X399, limitant les performances à 11 tok/s sur Mistral 128B. Après réorganisation des GPUs et configuration correcte du tensor-split, les performances ont doublé à 24,7 tok/s. Avertissement pour les builds multi-GPU sur cartes HEDT anciennes.

Mistral Llama Infrastructure

SIG

72

HYP

15

The Decoder·4 juin

Bain study finds companies miss AI savings targets because humans keep getting in the way

Étude Bain sur 951 entreprises : 40% réalisent moins de 10% d'économies IA alors qu'elles visaient 11-20%. Seules 7% déploient des agents IA entièrement autonomes, contrairement aux hypothèses de leurs business cases.

Agents IA Business

SIG

72

HYP

35

Reddit r/MachineLearning·4 juin

On-policy distillation: one of the hottest terms on PapersWithCode [R]

On-policy distillation (OPD) est une technique post-training clé utilisée par Qwen 3.6/3.7, GLM-5.1 et DeepSeek-V4. La méthode utilise un modèle auxiliaire pour identifier les erreurs dans les trajectoires et injecter des tokens de correction, permettant au modèle principal d'apprendre sans régénérer de nouveaux rollouts.

Fine-tuning Reinforcement learning Qwen

SIG

72

HYP

35

GitHub Trending·4 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> yvgude /</span> lean-ctx

LeanCTX est un système d'exploitation de contexte local pour le développement IA. Un binaire unique compresse, mémorise, route et vérifie les tokens entre le code et le modèle. 63 outils MCP, 10 modes de lecture, jusqu'à 99% d'économies de tokens. Compatible Cursor, Claude Code, Copilot, Windsurf, Gemini.

MCP Génération de code Outils

SIG

72

HYP

45

The Decoder·4 juin

AI can now coach amateur virologists, and top tech leaders want Congress to act on DNA security

Sam Altman, Dario Amodei et Demis Hassabis demandent au Congrès américain d'imposer le contrôle légal des commandes d'ADN synthétique. Les systèmes IA surpassent déjà les virologues PhD sur les procédures de laboratoire, créant un risque de détournement pour les armes biologiques.

Sécurité IA Régulation Business

SIG

72

HYP

45

The Decoder·4 juin

xAI updates Grok Imagine to 1.5 with image-to-video generation at 720p resolution

xAI lance grok-imagine-video-1.5-preview, un modèle image-vers-vidéo générant des vidéos cinématiques jusqu'à 720p à partir d'images fixes et de prompts texte. Plusieurs clips peuvent être assemblés en scènes plus longues.

Génération de vidéos Génération d'images

SIG

72

HYP

25

Page 74 sur 192

Value-and-Structure Alignment for Routing-Consistent Quantization of Mixture-of-Experts Models

Multilingual Coreference Resolution via Cycle-Consistent Machine Translation

Bootstrapping Semantic Layer from Execution for Text-to-SQL

A Model of Multi-turn Human Persuadability Using Probabilistic Belief Tracing

Multilingual Detection of Alzheimer's Disease from Speech: A Cross-Linguistic Transfer Learning Approach

Data-efficient flood depth prediction through domain-aware coreset selection and tabular foundation models

Differentiable Efficient Operator Search

DP-MacAdam: Differentially Private Mechanism with Adaptive Clipping and Adaptive Momentum

When New Generators Arrive: Lifelong Machine-Generated Text Attribution via Ridge Feature Transfer

An ERP Study on Recursive Locative Processing in Mandarin-Speaking Children with Autism

CausalPOI: Spatio-Temporal Graph-Based Causal Modeling for Cold-Start POI Check-in Forecasting

Mamba-Assisted Non-Markovian Closure for Reduced-Order Modeling

Learned Subspace Compression for Communication-Efficient Pipeline Parallelism

Efficient Punctuation Restoration via Weighted Lookahead Scoring Method for Streaming ASR Systems

Using Large Language Models to Support High Volume Application Review for an Undergraduate Research Program

Generalized TV--$\ell_p$ Structured Priors for Bayesian $T_1$ Mapping

Domain-Aware Mispronunciation Detection and Diagnosis Using Language-Specific Statistical Graphs

A prism hierarchy of learning regimes in large linear autoencoders

Staged Factorial Screening for Budget-Constrained Micro-Pretraining

PEFT of SLM for Telecommunications Customer Support: A Comparative Study of LoRA Configurations with Energy Consumption Analysis

Multi-Granularity Reasoning for Natural Language Inference

MCBench: A Multicontext Safety Assessment Benchmark for Omni Large Language Models

Learning Manifold and It\^o Dynamics with Branched Neural Rough Differential Equations

What's in a Name? Morphological Shortcuts by LLMs in Pharmacology

QueryAgent-R1: Bridging Query Generation and Product Retrieval for E-Commerce Query Recommendation

Selective-Advantage Entropy-Adaptive Horizon GRPO: Asymmetric Token-Level Discounting for Efficient Reinforcement Learning of Language Models

Anomaly Detection for Electro-Hydrostatic Actuators using LSTM Autoencoder

PyCC.id: A package for hypothesis-driven equation discovery with structural identifiability

PJ-RoPE: A Fourier-Jet-Affine Position Space for Relative Attention

Predict and Reconstruct: Joint Objectives for Self-Supervised Language Representation Learning

The skills.sh API is now available

BeeLlama v0.3.1 – latest llama.cpp with extras! DFlash, MTP, q6_0 cache, TurboQuant. Single RTX 3090: Qwen 3.6 27B & Gemma 4 31B up to 177.8 tps (4.93x over baseline)

Building a Native 1-Bit LLM Engine in Pure Rust: Achieving 150+ TPS and 350MB Memory Footprint on Edge CPUs. [P]

ChatGPT now saves narrative dossiers about you sorted by work, hobbies, and travel preferences

I accidentally crippled my 4x RTX 3090 LLM rig with a hidden PCIe 2.0 x4 slot and fixing it doubled Mistral 128B performance

Bain study finds companies miss AI savings targets because humans keep getting in the way

On-policy distillation: one of the hottest terms on PapersWithCode [R]

AI can now coach amateur virologists, and top tech leaders want Congress to act on DNA security

xAI updates Grok Imagine to 1.5 with image-to-video generation at 720p resolution