décembre 2023

14 articles

Speculative Decoding for 2x Faster Whisper Inference

Hugging Face implémente le speculative decoding pour accélérer Whisper de 2x. La technique utilise un modèle léger pour générer des tokens candidats, validés par le modèle complet en parallèle, réduisant la latence sans perte de qualité.

Génération de code Infrastructure Open source

SIG

HYP

Hugging Face Blog·18 déc.

2023, year of open LLMs

2023 a marqué l'émergence des LLMs open-source comme alternative viable aux modèles propriétaires. Llama, Mistral et d'autres ont démocratisé l'accès aux grands modèles de langage, réduisant la dépendance envers OpenAI et Google.

Open source Llama Mistral

SIG

HYP

OpenAI Blog·14 déc.

Practices for Governing Agentic AI Systems

OpenAI publie des recommandations pour gouverner les systèmes IA agentiques, couvrant la surveillance, les limites opérationnelles et les mécanismes de contrôle. Le document propose des cadres pour déployer des agents autonomes de manière sécurisée en production.

Agents IA Sécurité IA Alignement

SIG

HYP

OpenAI Blog·14 déc.

Superalignment Fast Grants

OpenAI lance 10 millions de dollars en subventions pour la recherche technique sur l'alignement et la sécurité des systèmes IA surhumains, couvrant la généralisation faible-à-forte, l'interprétabilité et la supervision à l'échelle.

OpenAI Alignement Sécurité IA

SIG

HYP

OpenAI Blog·14 déc.

Increasing accuracy of pediatric visit notes

Summer Health utilise GPT d'OpenAI pour améliorer la précision des notes de consultation pédiatrique. Le système automatise la documentation médicale lors des visites chez le pédiatre, réduisant les erreurs et le temps administratif.

GPT OpenAI Business

SIG

HYP

OpenAI Blog·14 déc.

Weak-to-strong generalization

OpenAI explore comment utiliser les propriétés de généralisation du deep learning pour contrôler des modèles forts avec des superviseurs faibles. Nouvelle direction de recherche pour la superalignment avec résultats initiaux prometteurs.

OpenAI Alignement Raisonnement

SIG

HYP

OpenAI Blog·13 déc.

Partnership with Axel Springer to deepen beneficial use of AI in journalism

OpenAI et Axel Springer annoncent un partenariat pour intégrer le journalisme dans les technologies IA. Axel Springer devient le premier groupe éditorial mondial à conclure un accord de ce type avec OpenAI.

OpenAI Business

SIG

HYP

Hugging Face Blog·11 déc.

Mixture of Experts Explained

Hugging Face explique l'architecture Mixture of Experts (MoE) : un mécanisme où un routeur dirige les entrées vers des experts spécialisés plutôt que d'utiliser tous les paramètres. Réduit la latence et augmente la capacité du modèle sans surcharge computationnelle proportionnelle.

Open source Infrastructure Benchmarks

SIG

HYP

Hugging Face Blog·11 déc.

Welcome Mixtral - a SOTA Mixture of Experts on Hugging Face

Mixtral, un modèle Mixture of Experts (MoE) state-of-the-art, est désormais disponible sur Hugging Face. Le modèle offre des performances supérieures avec une efficacité computationnelle améliorée grâce à son architecture d'experts spécialisés.

Open source Benchmarks Infrastructure

SIG

HYP

Hugging Face Blog·6 déc.

SetFitABSA: Few-Shot Aspect Based Sentiment Analysis using SetFit

Hugging Face présente SetFitABSA, une méthode few-shot pour l'analyse de sentiment basée sur les aspects. SetFit permet d'entraîner des modèles efficaces avec peu d'exemples, sans ajustement des poids du modèle de base.

Fine-tuning Prompt engineering Open source

SIG

HYP

Hugging Face Blog·5 déc.

AMD + 🤗: Large Language Models Out-of-the-Box Acceleration with AMD GPU

Hugging Face et AMD annoncent une intégration native pour accélérer les LLM sur GPU AMD. Les modèles tournent directement sans optimisation manuelle, avec support des architectures RDNA et CDNA.

Outils Infrastructure Open source

SIG

HYP

Hugging Face Blog·5 déc.

Optimum-NVIDIA Unlocking blazingly fast LLM inference in just 1 line of code

Hugging Face et NVIDIA lancent Optimum-NVIDIA, une bibliothèque qui accélère l'inférence LLM via une seule ligne de code. Intégration native des optimisations NVIDIA (TensorRT-LLM, cuDNN) pour réduire latence et augmenter throughput sans modification du code utilisateur.

Outils Infrastructure Génération de code

SIG

HYP

Hugging Face Blog·5 déc.

Goodbye cold boot - how we made LoRA Inference 300% faster

Hugging Face a optimisé l'inférence LoRA pour atteindre 300% de gain de vitesse. Les améliorations ciblent le démarrage à froid et réduisent la latence globale des adaptateurs de rang faible.

Fine-tuning

SIG

HYP

Hugging Face Blog·1 déc.

Open LLM Leaderboard: DROP deep dive

Hugging Face analyse en détail le benchmark DROP du Open LLM Leaderboard, qui évalue la compréhension de lecture et l'extraction d'informations. L'article examine les performances des modèles sur cette tâche spécifique et les défis qu'elle pose.

Benchmarks Évaluations Open source

SIG

HYP