Introduction

Relari Blog: Useful articles on how to evaluate LLM applications link
Discord: Join our community of LLM developers Discord
Reach out to founders: Email or Schedule a chat

What is continuous-eval?

continuous-eval is an open-source package created for granular and holistic evaluation of GenAI application pipelines.

Modularized Evaluation: Measure each module in the pipeline with tailored metrics.
Comprehensive Metric Library: Covers Retrieval-Augmented Generation (RAG), Code Generation, Agent Tool Use, Classification and a variety of other LLM use cases. Mix and match Deterministic, Semantic and LLM-based metrics.