promptfoo vs RAG Failure Diagnostics Clinic

Side-by-side comparison with live GitHub signals. Last updated June 30, 2026.

promptfoo

Test and evaluate LLM prompts and agents — 11K+ stars

OSSFree

22.8Ktoday300

Visit GitHub

RAG Failure Diagnostics Clinic

Diagnose and fix common RAG pipeline failure modes

OSSFree

116.1K2w ago80

Visit GitHub

Metric	promptfoo	RAG Failure Diagnostics Clinic
GitHub Stars	22.8K	116.1K
Contributors	300	80
Last Commit	Jun 30, 2026	Jun 15, 2026
Open Issues	368	8
License	open-source	open-source
Pricing	open-source	open-source
Free Tier	Yes	Yes
Category	dev-tools	dev-tools
Trending	No	No

Shared Tags

evaluation

Only in promptfoo

testingred-teamingsecurityci-cdopen-source

Only in RAG Failure Diagnostics Clinic

ragdebuggingdiagnosticspython

About promptfoo

promptfoo is an open-source tool for testing, evaluating, and red-teaming LLM applications. Run automated evaluations across multiple models and prompts, compare outputs side-by-side, detect regressions, and test for security vulnerabilities. Supports custom assertions, CI/CD integration, and model-graded evaluations.

View full listing

About RAG Failure Diagnostics Clinic

A diagnostic tool that identifies why RAG pipelines produce poor results. It tests for common failure modes: irrelevant retrieval, missing context, hallucination over context, chunking issues, and embedding quality problems. Provides a structured report with specific fix recommendations for each detected issue. Essential for debugging production RAG systems. Part of the awesome-llm-apps collection.

View full listing

Also Compare

Crawl4AIvsRAG Failure Diagnostics Clinic Crawl4AIvspromptfoo FirecrawlvsRAG Failure Diagnostics Clinic Firecrawlvspromptfoo Headroom Context OptimizationvsRAG Failure Diagnostics Clinic Headroom Context Optimizationvspromptfoo