庖丁科技

获赞数

关注数

粉丝数

paodingai.com

IP 属地北京

2024-02-02 加入

浏览 1.9k

主页回答提问文章16

庖丁科技是聚焦文档的人工智能公司，提供从基座、审核、撰写到问答的全流程文档处理 SaaS 服务和企业级应用。从金融行业出发，解决金融行业在文档处理方面的风控和质量问题；并依托文档智能的开发工具，打造全行业的应用生态。

4 声望

llm

深度学习

人工智能

后端

数据库

黄金勋章

暂未获得该勋章

如何获得

白银勋章

暂未获得该勋章

如何获得

3 青铜勋章

长文达人

博客新秀

个人动态

发布了文章2025-12-11
让RAG像人类一样“扫视全文”：上下文检索技术详解
 庖丁科技
尽管大语言模型本身的能力在快速演进，但它依然无法凭空获取训练数据之外最新或专有知识。检索增强生成（RAG, Retrieval-Augmented Generation）正是为解决这一问题而生：在回答问题前，先从知识库中检索相关资料，再让模型参考这些资料生成答案。换言之，RAG让大模...
发布了文章2025-03-07
为什么「上下文检索」是提升 RAG 系统问答准确度的关键？
庖丁科技
为什么明明答案就在知识库里，但 AI 却无法准确回答？原因之一是由于 RAG 系统处理文档的方式。“文档切块”步骤导致丢失语义缺失、语义歧义或全局结构缺失，AI可能只看到了“局部信息”，却忽略了“全局意义”。这正印证了莫拉维克悖论——对人类而言是基于直觉的语义衔接，...
发布了文章2024-08-16
831披露倒计时，AI 帮你10分钟搞定债券半年报
 庖丁科技
庖丁智能撰写系统（以下简称“Glazer”）为债券年报/半年报的编制提供了高效解决方案，仅需10 分钟即可生成完成度高达80%~90%的报告。
发布了文章2024-08-13
如果AI犯错无法避免，我们该如何有效复核？
庖丁科技
大语言模型的迅速发展正在重塑各行各业的工作方式，然而其生成内容的准确性和可靠性仍然是影响技术在实际应用中有效落地的关键因素。现有的溯源功能往往存在粒度过粗或溯源不准确等局限性，难以有效验证大模型输出的可靠性。
发布了文章2024-08-13
AutoDoc重磅升级，借助大模型自动复核上市公司年报财务数据
 庖丁科技
自2017年创立以来，庖丁科技一直在研究如何来帮助从业人员高效、准确审核金融文档。近期，我们针对债券募集说明书的自动审核技术实现突破，并正在逐步应用到其他类型的投行金融文档审核工作中。
发布了文章2024-07-31
为了追踪AI领域最前沿的研究成果，我们做了这个小工具
 庖丁科技
有很多昨天还在困扰着的问题，可能在世界上的某个研究团队，在技术探索的征程上往前迈了一步。所以在这场技术创新的征程中，大家每天都在关注最前沿的资讯，密切关注、害怕错过、努力创新。
发布了文章2024-06-06
LLM 文档问答的技术求索：如何提升回答的可靠性
 庖丁科技
语言理解和生成是 LLM 的强项，问答类产品随之成为首批涌现的 AI Native 应用：和视频/音频/文档/网页等各类富格式文件聊天，快速提取信息。
发布了文章2024-05-24
复杂 PDF 解析实测——PDFlux 和 LlamaParse，谁更胜一筹？
庖丁科技
检索增强生成（Retrieval-Augmented Generation，简称RAG）用于提升大语言模型回答问题的准确性。传统的大语言模型会凭空“编造”答案，RAG 结合了信息检索和文本生成技术，增强了大语言模型的文本生成能力，是解决“幻觉”问题的重要方法。
发布了文章2024-05-15
PDF之父的三个关键抉择
 庖丁科技
编者按：迄今为止，PDF仍然是在商业领域中（特别是金融领域）最广泛使用的电子文档格式。庖丁科技以此文悼念PDF文档格式的共同发明者 — Charles Geschke博士，并纪念这一改变人类阅读方式的伟大发明。欲了解更多PDF文档格式和历史，请阅览《电子文档全景结构识别漫谈...
发布了文章2024-05-15
ChatGPT 重磅更新，为什么我们仍需要 ChatDOC？
庖丁科技
对于普通用户来说，最重要的更新莫过于 GPTs —— 普通用户也可以自定义专属 GPT 助手了。这一功能已经在 11 月 10 日向 GPT4 用户全量开放。
发布了文章2024-05-15
企业级知识问答，如何实现大语言模型的可靠应用？
庖丁科技
大模型已经狂飙了半年。然而，对于新技术，商业世界最关注的问题永远是：能用来干什么，要怎么用，成本是多少？作为一家技术和产品力过硬的 AI 公司，有不少希望早日应用新技术的客户找到我们，询问大模型在具体业务中的落地应用。大家经常问到的问题包括：能否私有...
发布了文章2024-05-15
大语言模型的技术发展及金融领域应用展望
 庖丁科技
3 月 15 日，美国人工智能公司 OpenAI 发布 GPT-4 多模态大模型，支持文本和图像输入；与 GPT-3.5 相比，其回答准确度、文字输入长度等各方面性能显著提升。
发布了文章2024-05-15
文档智能：技术框架及在监管科技的应用
 庖丁科技
国际数据公司 IDC 预测，从 2018 年到 2025 年，全球产生的数据量将从 33ZB 到增长到 175ZB，年复合增长率达 27%。其中，80% 都是计算机较难处理的非结构化数据。
发布了文章2024-05-15
电子文档全景结构识别漫谈
 庖丁科技
电子文档（Electronic Document），是文档在个人电脑、平板电脑、手机等电子设备上的视觉呈现形式，已经被广泛运用于各个领域（例如金融、专利、政府等）。PDF（Portable Document Format）文档是现今最常用的对外分发的电子文档格式。其最主要的优点是独立性：一旦...
发布了文章2024-05-15
PDF的困境与未来
 庖丁科技
电子文档（Electronic Document），是文档在个人电脑、平板电脑、手机等电子设备上的视觉呈现形式。在个人电脑诞生之前，文档的传播是以纸质文档的形式；而从上世纪八九十年代开始，经过近几十年IT技术的渗透，电子文档已取代了纸质文档的信息传播形式，充斥着我们工...
发布了文章2024-05-12
通过增强PDF结构识别，革新检索增强生成技术(RAG)
庖丁科技
尽管大语言模型（LLM）在自然语言生成方面取得了巨大的进展，但对于专业知识问答领域来说，结合检索增强生成技术（RAG）可以更好地利用领域专家知识、提供解释性的优势，提高问答准确率。