ThinkDoc
扫码查看

能深度解析文档、辅助写作的AI知识库

ThinkDoc

综合介绍

ThinkDoc 是一个专为AI应用设计的智能知识库平台,其核心是成为一个会“思考”的知识助手。它的开发初衷是为了解决专业人士在海量文档中检索信息、深度分析并高效产出报告的痛点。与其他知识库应用不同,ThinkDoc着力于应对三大挑战:第一,回答用户在文档中没有直接答案的复杂问题,需要深度分析和推理;第二,生成包含图表、表格在内的多模态内容,而不仅是文字;第三,通过多步骤的检索和推理来构建答案。为此,它采用“多模态知识库 + 多智能体协同”的架构,通过深度文档解析、融合检索和内置的写作智能体,将非结构化数据转化为AI就绪的知识资产,赋能深度研究(Deep Research),加速AI应用的落地。

功能列表

  • 深度文档解析: ThinkDoc的基础能力。它能深度理解PDF、Word等复杂格式文档的内在结构和语义,精确提取其中的表格、图片和逻辑关系,并统一输出为结构化的JSON数据,为后续的智能分析和检索打下坚实基础。
  • 多模态知识仓库: 支持将PDFDOCXPPTX等各类文档,以及网页、图片、音视频等统一存储。用户可以上传文件、导入文件夹、抓取URL或直接创建Markdown笔记,平台会将其解析并存入向量数据库和文档数据库,成为大模型的外挂记忆体。
  • 融合检索系统: 作为平台的中枢,它采用多智能体协同架构。能综合运用语义、关键词、上下文结构、知识图谱推理和数据智能体等多种方式进行检索,确保在面对复杂分析时也能获得全面、准确且相关的结果。
  • 内置三大智能体:
    • 智能对话:支持多轮对话,能够生成包含图片、表格的多模态回答,并且所有信息都提供来源引用,保证内容的可追溯性和可信度。
    • 检索分析:支持全文、语义和混合检索,能精准召回相关信息,并帮助用户分析关键发现与信息缺口,辅助决策。
    • 专业写作:平台特色功能。它能根据用户需求和检索结果自动生成报告大纲,用户编辑确认后,可在5分钟内撰写出万字专业研究报告,并支持导出为DocxMarkdown格式。

使用帮助

ThinkDoc 为个人和企业提供了灵活的使用方案,无论您是想快速体验还是进行深度集成,都能找到合适的方式。

1. 个人用户与小型团队:SaaS平台快速入门

对于希望立即体验的用户,官方的SaaS平台是最佳选择,可以免费使用全部功能。

  • 访问和注册
    1. 在浏览器中打开网址 https://doc.bluedigit.ai
    2. 完成注册和登录,即可进入平台主界面。
  • 创建知识库并添加资料
    1. 点击创建您的第一个知识库,它将作为您管理特定主题文档的容器。
    2. 向知识库中添加内容,支持多种方式:
      • 文件上传:上传本地的 PDFDOCXPPTX 等单个或多个文件。
      • 文件夹导入:一次性导入整个文件夹,平台会自动处理内部所有支持的文档。
      • URL导入:输入一个网址,ThinkDoc会自动抓取网页内容。
      • 在线笔记:直接在平台内创建和编辑 Markdown 格式的笔记。
    3. 上传后,系统将自动对您的资料进行深度解析和结构化处理。
  • 使用内置智能体
    1. 智能对话:在知识库的对话框中,直接用自然语言提问。例如:“根据XX报告,市场的主要驱动力是什么?”系统会给出包含图表和来源引用的多模态回答。
    2. 专业写作(核心功能)
      • 切换到“写作智能体”功能。
      • 输入您想撰写的报告主题,例如“分析一下最近的AI芯片行业发展趋势”。
      • 系统会基于知识库内容,首先自动生成一个结构化的大纲。
      • 您可以根据需要,对生成的大纲进行修改、删除或增加章节。
      • 确认大纲后,点击“生成报告”,写作智能体便会开始撰写全文,短时间内即可生成一篇万字长文,并可导出为 Docx 文件。

2. 企业用户:API集成与私有化部署

对于需要将ThinkDoc能力整合到现有系统或对数据安全有更高要求的企业,平台提供了强大的集成和部署选项。

  • API集成
    1. ThinkDoc提供基于FastAPI的高性能API接口,并遵循OpenAPI规范。开发者可以在平台上获取API Key,参考API文档进行二次开发。
    2. 与工作流平台集成:平台可以轻松与DifyN8N等主流AI工作流平台集成。在这些平台中,ThinkDoc可以作为一个外部知识库插件使用,实现企业级AI应用的快速落地。
  • 私有化部署
    1. 保障数据安全:企业可以选择将ThinkDoc整套系统部署在自己的私有云或本地服务器上。这种方式下,所有数据、模型和处理流程都在企业内部完成,实现物理隔离,确保了最高级别的数据安全和合规性。
    2. 弹性扩展:平台采用分布式架构和Docker容器化部署,支持从单机到大规模集群的弹性扩展,运维便捷。企业可以先通过SaaS版本体验全部功能,然后将同样的功能和体验复制到企业内部环境中。

应用场景

  1. 深度研究分析师将海量研报、财报、新闻稿导入系统,通过智能体快速生成包含完整数据和信息来源的专业研究报告。
  2. 个性教育根据学生的知识掌握情况,从知识库中实时检索相关内容,提供个性化反馈,并自动生成定制化的学习材料和练习题。
  3. 设备运维将产品手册、维修记录、技术图纸构建成知识图谱,现场工程师通过智能问答快速定位故障原因并获取解决方案。
  4. 智能客服整合产品FAQ、使用说明等,实现7x24小时的智能导购、使用指导和故障排除等客户服务,提升客户满意度。
  5. 法律咨询智能解析法律文书和过往案例,为律师提供精准的法条检索、案例分析和专业的法律建议,提升案件处理效率。
  6. 理财助手基于金融数据、市场分析报告,为客户提供个性化的投资建议、风险评估与资产配置方案。
  7. 政务服务将海量政策文件、办事指南进行结构化处理,为公众提供精准、易懂的政策解读和办事流程查询服务。
  8. 知识问答构建企业或个人的专属知识大脑,实现跨领域的知识关联和检索,为复杂问题提供准确的专业解答。

QA

  1. ThinkDoc与其他知识库或RAG工具有何不同?ThinkDoc最大的不同在于其“多智能体协同”架构带来的深度研究能力。它不仅仅是进行简单的“检索+生成”,而是通过深度解析、多策略融合检索和强大的写作智能体,实现从原始文档到深度分析报告的端到端自动化,旨在成为一个会“思考”的知识助手。
  2. 写作智能体生成的报告质量如何?写作智能体首先会根据您的需求和知识库内容生成一份详细的大纲,您可以对大纲进行编辑以确保报告的结构和方向符合要求。在此基础上,智能体会依据大纲和检索到的精准信息进行撰写,生成的报告逻辑清晰、内容详实,并能导出为Docx格式方便后续编辑。
  3. 如果我的文档格式非常复杂,比如包含大量图表和扫描件,ThinkDoc能处理吗?可以。深度文档解析是ThinkDoc的基础和核心能力。它专门针对包含复杂表格、技术图纸、多栏布局的PDF等文档进行了优化,能够最大限度地提取结构化数据并保持其原有的逻辑关系,这是实现高质量检索和问答的前提。
  4. 我如何将ThinkDoc集成到我的企业微信或钉钉中?您可以通过ThinkDoc提供的API接口进行二次开发,将其与企业微信、钉钉等内部办公系统对接。此外,也可以通过DifyN8N这类工作流自动化平台,以低代码的方式快速搭建连接,将ThinkDoc的知识问答能力嵌入到您现有的工作流程中。
微信微博Email复制链接