发布了文章6 月 10 日
事情是这样的,老板丢来一个任务:“去研究下怎么训模型。”作为一个行动派,我火速在社区挖出一套宝藏教程——《From-Data-To-LLM》(☞[[链接]/])。28课时,从预训练、SFT、RLHF到RAG全链路覆盖,脚本管够,堪称大模型训练的“九阴真经”。教程非常棒,但我好像已经过了...
发布了文章5 月 25 日
不是 RAG 过时了,是你用的 RAG 还停在 2024 年。当别人的知识库能自己改代码、自己跑 A/B 测试、自己进化的时候,你的团队还在手工造问答对和调 topK。两者看起来都叫“知识库”。但中间隔着的,已经不是一点优化,而是一代系统的差距;这差距,只会越来越大。
发布了文章5 月 7 日
你可能也遇到过这种场景:RAG Demo 跑得挺顺,一上真实数据量就开始“喘气”了。CPU 飙高、延迟抖动、吞吐不稳,最后大家开始怀疑人生:到底是模型慢,还是框架本身在拖后腿?这次我们在 LazyLLM 做的事情,就是把 RAG 里最容易“卡脖子”的底层路径,用 C++ 扩展重新打...
发布了文章4 月 28 日
本文将深入探讨在多模型工程落地中,一个看似不起眼却极度影响开发体验的问题——模型入口的统一与类型识别,并详细解析 LazyLLM 是如何通过优雅的机制解决它的。
发布了文章4 月 22 日
最近大家用Claude Code,OpenClaw这类AI助手爽写Agent,三天起高楼,五天宴宾客——不需要后端经验,甚至不需要理解什么是"并发"。本地测试时,多轮对话丝滑得像德芙,检索精准得像狙击枪,你觉得稳了,准备迎接人生第一笔被动收入。
发布了文章4 月 14 日
公司内部,可能同时维护着多套集群;不同团队用着不同的调度系统;业务一调整,平台就升级、迁移,甚至整体更换。而一旦对外部署或交付给客户,运行环境的不确定性只会更高。不同平台之间,往往在这些地方差异明显:
发布了文章4 月 7 日
LazyLLM黑科技 | 一条 pipeline 为什么能自己把服务全拉起来?聊聊 Flow 的设计之道很多 AI 应用在原型阶段都很顺:模型能调通,RAG 能跑起来,Agent 也能串起来。但一旦进入工程化部署,问题就变了。真正麻烦的,往往不是“某个模块能不能工作”,而是:多个模块怎么...
发布了文章4 月 3 日
问题:调用主体不明在工程框架里,有一类很隐蔽但很常见的问题:同一个方法,看起来一样,结果却完全不同。å为什么?因为方法的语义,不只取决于“做了什么”,还取决于——谁在调用。很多操作天然分两种:类级操作:影响全局实例级操作:只影响当前对象但问题在于,这两...
发布了文章3 月 18 日
在开源 LazyLLM 的过程中,我们遇到了一个非常棘手,但又极具代表性的架构挑战。假设你基于 LazyLLM 开发了一个高大上的 AI 框架,叫 MyWork。 当你的用户使用它时,却发生了尴尬的一幕:这个问题看起来只是"面子"问题,但本质上暴露了两个深层的架构挑战:1. 配置体...
发布了文章3 月 10 日
在较为复杂的 Python 项目中,常见问题是:代码尚未进入核心逻辑,运行环境会因为依赖冲突、缺失或版本不兼容而失败;不同模块往往依赖不同的第三方库。若将所有依赖统一安装,环境会迅速膨胀;若仅安装部分依赖,又容易在执行过程中因缺少依赖而中断。更进一步,即...
发布了文章2 月 28 日
在 LLM 工程里,功能一旦开始往上叠,模块数量几乎是不可避免地往上涨。这时候,真正摆在你面前的,不是“还能不能加功能”,而是——这些模块到底怎么统一管理。问题通常会从两个方向同时冒出来:
发布了文章2 月 24 日
很多团队做 Agent 都会经历同一个阶段:Demo 很快,落地很慢。新需求一来,就要重写 Prompt、重配工具、重测流程;场景一变,之前的能力几乎无法直接复用。看起来 Agent 已经能对话、能执行,但距离稳定交付,还缺一套可沉淀、可复用、可协作的能力组织方式。
发布了文章2 月 2 日
当大模型真正进入工程系统后,麻烦往往不是一点点。模块越来越多,却越来越难管;配置在不同环境里反复出问题;流程一复杂就不敢动;换个平台几乎等于重来;性能问题总是卡在最不想碰的地方。
发布了文章1 月 26 日
近日,LazyLLM正式与PPIO达成深度合作,通过LazyLLM的统一接口和灵活的编排能力,配合PPIO提供的稳定、低延迟、高性价比的API支持,开发者可以轻松构建具备长程记忆、能自主调用外部工具的智能体。
发布了文章1 月 26 日
1月15日,商汤大装置事业群算法工程师陈家豪带来 「LazyLLMAgentic应用开发快速上手从一行代码说起」 直播,用一行代码解锁大模型应用开发新姿势,现在就为大家梳理这场 直播的核心亮点,错过直播的同学速码收藏吧~
发布了文章2025-12-31
本次发布通过支持新型存储供应商(Elasticsearch、OceanBase)扩展了生态系统,并整合了更多在线模型提供商(SiliconFlow、MiniMax)。全新引入的综合缓存系统有效提升了性能表现。智能体模块、文档处理器及启动系统均进行了重大重构,显著提升了代码可维护性与清晰度。
发布了文章2025-12-15
在本文中,我们将从基础概念出发,首先解析知识图谱的本质——它如何以『实体-关系-属性』的形式组织海量信息,使机器能够像人类一样理解世界的关联性。
发布了文章2025-12-08
前面教程中,我们学习到了如何构建 RAG 系统,以及对 RAG 系统进行效果提升、速度优化、功能扩展等等方面。本教程我们将在此基础上进一步介绍最近很火的Agentic RAG,它是RAG的变种,但更加智能,让我们开始吧!
发布了文章2025-12-03
商汤自主研发的UniParse智能文档解析工具现已全面升级,并正式对外开放企业级API接口!UniParse基于先进的大模型和智能Agent技术,不再止步于基础OCR识别,而是专注于复杂文档与票证的深度理解和信息提取,为企业提供“全维度、高精度、流畅化”的智能文档处理解决方案。
发布了文章2025-12-03
在大模型全面走向工程落地的当下,LazyLLM正式与硅基流动(SiliconFlow) 达成深度合作,共同打造面向开发者的下一代智能应用底座。借助LazyLLM的一键接入线上模型API能力,硅基流动的大语言模型、多模态模型、向量与Embedding模型、文生图模型等已经完整接入,同一...