相信有不少小伙伴正在学习AI Agent、MCP、RAG的开发和商业用例吧。虽然Github、Hugging Face有海量开源项目,但想找出经典又实用的并不容易。
所以,「AIGC开放社区」就为大家介绍一个精选的开源大合集,包括入门级AI Agent、高级Agent、多层级智能体、语音智能体、多类型RAG等非常好用的项目。不仅适合新手,开发老鸟也可以学习借鉴下启发灵感。
目前,这个合集在Github已经超过58000颗星,并且拿下过Github每日最佳趋势第一名。不用担心质量,已经过超过10万开发者的认证了。

开源地址:https://github.com/Shubhamsaboo/awesome-llm-apps/?tab=readme-ov-file
下面就为大家简单的介绍这个开源库的主要内容。
入门级AI Agent
这些智能体是为初学者设计的,功能较为基础,易于理解和上手。涵盖了多种常见的应用场景。例如,将博客内容转换为播客智能体,能够提取博客中的关键信息,生成适合音频传播的脚本,并结合语音合成技术将文字转化为自然流畅的音频内容,让用户可以通过听觉方式获取博客信息,丰富内容的传播形式。
医疗影像智能体,具备对医学影像如X光、CT扫描、核磁共振等的识别和解读能力,能够辅助医疗人员更准确地判断影像中的异常情况,为疾病的诊断提供支持。
浏览器智能体,结合了多个大模型的能力和自动化浏览器交互,通过直接操作网站,根据文本提示生成meme。

音乐智能体,可以根据用户的需求,如音乐风格、节奏、情绪等,生成原创的音乐作品。集成了音乐理论知识和生成模型,能够创作旋律、和声甚至编曲,为音乐爱好者、创作者提供灵感和创作辅助,降低音乐创作的入门难度。
高级AI Agent
高级AI Agent是面向更繁琐、跨平台、业务流程的智能体,通常需要结合多模型协作或领域知识,以解决高精度、复杂度的自动化需求。
例如,AI系统架构师智能体会调用DeepSeek+ Claude双模型,分析系统架构的安全性、可扩展性,覆盖医疗数据平台、实时事件处理系统等专业场景。
AI深度研究智能体能自动爬取学术论文、行业报告,整合量子计算、可再生能源等前沿领域信息,生成结构化研究结论。
实时商业策略顾问智能体,基于Google ADK的框架,同时集成了Perplexity AI搜索工具,实时获取最新行业动态、竞品数据及政策变化。

个性化财务规划智能体,整合YFinance等实时金融数据接口。能分析用户收入结构与支出习惯,针对购房、养老等需求制定分阶段储蓄投资方案,并结合风险承受能力推荐低、中、高风险金融产品组合。
电影制作智能体,可评估剧本的情节逻辑与市场适配性,拆分拍摄、后期等环节的预算,建议导演、演员等团队配置,规划避开竞品的档期,通过数据分析降低制作风险、优化资源分配。
商业投资智能体,整合市场历史数据、实时行情及宏观经济指标,通过AI模型预测资产价格趋势,推荐股票、基金等投资标的并附风险评级,支持自定义短期投机或长期价值投资周期,输出可视化收益预期与止损建议。
健康管理智能体,基于用户体重、体脂率等身体数据及增肌、减脂等目标,生成定制化方案:包括分日、周的运动类型、强度安排,热量摄入与营养素配比的饮食建议。
产品发布智能体,采用Firecrawl异步爬取数据,Agno Team负责多智能体协作,Streamlit提供交互UI。能抓取竞品功能与用户评价以识别市场空白,建议发布时间、渠道组合及促销方案,还能预测用户反馈等风险并提供应对措施。
基于MCP的AI Agent
这些是基于MCP服务的智能体,能够同时处理多个上下文信息,提供更加智能和灵活的服务。
例如,浏览器MCP Agent,是一款基于Streamlit的应用,核心功能是允许用户通过自然语言命令浏览和交互网站。
支持全浏览器导航,包括访问网站、页面跳转,还能与页面元素交互,如点击按钮、填写表单、滚动内容,同时提供视觉反馈网页元素截图和信息提取能力,可从网页中提取并总结内容并完成多步骤浏览任务,如“进入博客找到最新文章并总结要点”。
GitHub MCP智能体,可实时对对Github开源库进行全面分析。涵盖查询仓库的issues、拉取请求、活动记录和代码统计等。同时提供用户友好的界面,包含示例查询和自定义输入选项,能实时返回仓库活动等。

Notion MCP智能体是一款终端- based工具,能帮助用户通过自然语言与Notion页面交互,依托Notion MCP服务器实现对Notion内容的操作。它支持多种页面交互功能,包括更新、插入、检索内容,创建和编辑块、列表、表格等Notion结构,添加评论,搜索特定信息,且能记住对话上下文以支持多轮交互,同时提供会话管理确保对话的持久性。
多类型RAG
RAG作为大模型必备功能之一,通过检索大量数据来增强生成内容的准确性和相关性。这种强大的能力同样可以应用在AI Agent领域。
Agentic RAG是一款基于GPT-4o构建的检索增强生成系统,核心在于整合PDF知识库与DuckDuckGo网页搜索能力,采用LanceDB作为向量数据库实现高效的相似性检索,并提供直观的交互界面,让用户能便捷地与结合文档知识和网络信息的AI助手互动,仅需15行Python代码即可实现基础功能。
Agentic RAG with Reasoning则更强调推理过程的透明度,结合Claude 3.5进行语言处理和OpenAI嵌入模型实现向量搜索,支持文档上传与URL动态添加,通过LanceDB实现向量数据的持久化存储。
其主要技术特点是实时展示智能体的思考步骤,采用左右分栏视图呈现推理过程与最终答案,同时清晰标注信息来源,让用户能直观了解RAG流程的每一步,从文档加载、文本分块、嵌入生成到检索匹配的全链路都可追溯。

博客RAG,专注于AI领域博客内容的精准检索,基于LangChain和LangGraph构建,集成Google Gemini模型处理查询与生成结果,以Qdrant作为向量数据库存储博客内容嵌入。
具备智能查询处理能力,能判断查询是否需要重写、直接回答或进一步检索,还通过Gemini模型实现相关性自动评估,优化检索结果。
Hybrid搜索RAG,主要提供混合搜索能力融合语义匹配与关键词检索提升文档召回率,支持PDF文档上传处理,自动完成文本分块与嵌入,当文档信息不足时会调用Claude的通用知识补充,通过Streamlit提供直观的聊天界面,平衡了文档特定知识与通用智能的优势。
RAG-as-a-Service偏向于将RAG能力封装为服务,便于集成到各类应用中,提供标准化的文档处理、检索与生成接口,降低开发者构建RAG系统的门槛,包含向量存储管理、模型调用、检索优化等核心功能,支持按需扩展以应对不同规模的知识处理需求。
数据库RAG具备智能查询路由能力,通过Agno智能体将用户查询分发到最相关的专业数据库包括产品信息、客户支持与FAQ、财务信息三类,采用Langchain编排RAG流程,Qdrant管理各数据库的文档嵌入。
当数据库中无相关信息时,触发LangGraph智能体调用DuckDuckGo进行网页搜索作为fallback。支持多PDF上传分类存储,并通过Streamlit界面实现自然语言查询交互,确保查询能精准匹配到最相关的知识源。
上面只是介绍了一小部分,目前这个开源库仍在持续更新,估计以后还会加入更多好用的智能体和相关的技术。