25-12-09 19:53 微博认证:科技博主

做了个RAG评估小框架开源

做RAG时发现,麻烦的往往是数据处理到评估的那条流水线。所以顺手写了个工具,用中文数据集做基准,内置标准流程,方便快速试不同的检索和生成方案

平时主要用它两件事,一是快速验证新想法,不用重复写脚本,二是在同一套指标下对比不同策略,看问题出在哪#rag# ​

发布于 福建