Page 119 sur 152

ToutHaut signalRécent
6041 articles
Reddit r/LocalLLaMA·

Stop traumatizing AI into loops and turn hallucinations into an honest "I don't know!" by being NICE to them (Proof of Concept, Research, I don't want to sell anything)

Un chercheur teste l'hypothèse que les prompts « autoritaires » (« expert IQ 200 ») déclenchent des boucles de pensée similaires au stress chronique chez les modèles IA, tandis que des prompts « bienveillants » (« c'est ok d'échouer ») réduisent la latence et augmentent les réponses honnêtes « je ne sais pas ». Résultats sur Gemini, Mistral, Claude Haiku 4.5 : moins de confabulation, réponses plus rapides.

Prompt engineeringRaisonnementSécurité IA
SIG
45
HYP
65
Reddit r/LocalLLaMA·

Small comparison on full compute performance (Anima) of 5090 (600,475 and 400W) vs 6000 PRO MaxQ (325W), and 6000 PRO WS/SE (600W).

Benchmark de performance en compute (diffusion texte-image) comparant RTX 5090 (400-600W) vs RTX 6000 PRO MaxQ (325W) et 6000 PRO WS (600W). Tests sur Forge Neo avec SageAttention 2.1, résolution 896x1088, batch size 4. 5090 undervolté/overclocké (2930MHz, +4400MHz VRAM), 6000 PRO MaxQ modifié (+550MHz core).

Génération d'imagesBenchmarksInfrastructure
SIG
45
HYP
15
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> thedotmack /</span> claude-mem

claude-mem ajoute une mémoire persistante aux agents IA en capturant les actions de session, les compressant par IA, et réinjectant le contexte pertinent dans les futures sessions. Compatible Claude Code, OpenClaw, Codex, Gemini, Hermes, Copilot et autres.

Agents IAClaudeClaude Code
SIG
45
HYP
65
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> Hmbown /</span> CodeWhale

CodeWhale est un terminal de codage agentique utilisant DeepSeek en priorité, avec support multi-fournisseurs, optimisation du cache, interface en 5 langues et endpoints régionaux CN.

Agents IAGénération de codeDeepSeek
SIG
45
HYP
35
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> vas3k /</span> TaxHacker

TaxHacker est une application comptable auto-hébergée utilisant des LLM pour analyser reçus, factures et transactions avec prompts personnalisés et catégories configurables.

Open sourceOutilsRAG
SIG
45
HYP
25
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> thedotmack /</span> claude-mem

claude-mem ajoute une mémoire persistante aux agents IA en capturant les actions de session, les compressant par IA, et réinjectant le contexte pertinent dans les futures sessions. Compatible Claude Code, OpenClaw, Codex, Gemini, Hermes, Copilot et autres.

Agents IAClaudeClaude Code
SIG
45
HYP
65
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> alpic-ai /</span> skybridge

Skybridge est un framework TypeScript full-stack pour applications MCP et ChatGPT. Type-safe, basé sur React, agnostique de plateforme.

MCPGénération de codeOutils
SIG
45
HYP
35
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> shareAI-lab /</span> learn-claude-code

Un harness d'agent minimaliste inspiré de Claude Code, construit en Bash. Démontre l'exécution d'agents sans dépendances lourdes.

Claude CodeAgents IAOpen source
SIG
45
HYP
55
Reddit r/LocalLLaMA·

Are local LLM users testing prompt injection before connecting models to tools?

Discussion sur la sécurité des LLM locaux connectés à des outils. L'auteur soulève que si l'exécution locale protège les données, l'injection de prompts devient critique une fois le modèle relié à des fichiers, commandes shell, APIs ou RAG. Peu de setups locaux testent la robustesse face aux instructions malveillantes avant de donner accès aux outils.

Agents IASécurité IAPrompt engineering
SIG
45
HYP
25
Reddit r/LocalLLaMA·

Qwen3.5 27B Uncensored Heretic Native MTP Preserved is Out Now With the Full 15 MTPs Preserved and Retained, Available in Safetensors, GGUFs, NVFP4, NVFP4 GGUFs and GPTQ-Int4 Formats!

Qwen3.5 27B uncensored en version MTP Preserved (15 MTPs conservés) disponible en Safetensors, GGUF, NVFP4 et GPTQ-Int4. Modèle optimisé pour assistance IA généraliste, contrairement à Qwen3.6 orienté agents et coding. Même architecture qwen35 mais comportements différents.

QwenOpen sourceGénération de code
SIG
45
HYP
65
Reddit r/LocalLLaMA·

Qwen3.5 35B A3B uncensored heretic Native MTP Preserved is Out Now With the Full 785 MTPs Preserved and Retained, Available in Safetensors, GGUFs. NVFP4, NVFP4 GGUFs and GPTQ-Int4 Formats

Qwen3.5 35B uncensored v2 avec 785 MTPs préservés disponible en Safetensors, GGUF, NVFP4 et GPTQ-Int4. Modèle optimisé pour assistance IA généraliste contrairement à Qwen3.6 orienté agents et coding, malgré une architecture qwen35 commune.

QwenOpen sourceGénération de code
SIG
45
HYP
55
Reddit r/MachineLearning·

Aiki my local Wikipedia Retrieval-Augmented Generation system [R]

Aiki est un outil léger de RAG local permettant de discuter avec Wikipedia hors ligne. Il télécharge et segmente les articles Wikipedia, utilise un retriever TF-IDF + cosine similarity personnalisé, supporte l'expansion de requêtes via liens Wikipedia, et génération optionnelle de réponses par LLM. Dépendances minimales, exécution entièrement locale.

RAGRecherche vectorielleOpen source
SIG
45
HYP
25