新颖性检索(novelty-search)
概述
新颖性检索(novelty-search)是 ragbase 平台内置的企业级专利与文献检索工具,用于快速发现技术领域的现有技术(prior art)。一次调用可在多个异构数据源上并行检索,自动排序返回最相关结果,并支撑后续说明书级引用与合规呈现。
核心能力(覆盖类型)
下列为按能力类型划分的代表性数据源(具体对接以平台上线的 Adapter 为准):
| 能力 | 覆盖范围 |
|---|---|
| 专利检索 | PatentHub(中国)、EPO(欧洲)、WIPO 等 |
| 学术文献 | Semantic Scholar、PubMed、Crossref、bioRxiv、arXiv 等 |
| 网络档案 | Internet Archive、Wikipedia(中 / 英文) |
| 行业监管 | FDA、ClinicalTrials.gov |
| 代码仓库 | GitHub(通过检索开源实现等侧面佐证资料) |
单次任务由平台侧 novelty-search 调度,向各数据源发起并行请求后进行融合与重排(关键词相关、稠密向量、稀疏向量等信号组合,最终以平台返回排序为准)。
工作流程
- 检索式构造 — 将技术方案拆解为 2~4 个核心关键词,支持中英文、IPC 分类号、申请人 / 发明人、日期等多维过滤。
- 并行调用 — 多个数据源 Adapter 同时发起 API / 检索请求。
- 结果融合 — 混合排序(如 BM25 类关键词相关性 + 稠密向量 KNN + 稀疏向量等),返回 Top N。
- 详情获取 — 对高相关条目调用
novelty_search_detail,获取权利要求书、说明书、附图、引用、法律状态等(字段依数据源而异)。 - 报告生成 — 产出交互式 HTML 报告:支持全文展开、分色高亮、锚点引用(须遵守下文「三条规则」)。
两个核心工具(Tool)
| Tool | 作用 |
|---|---|
novelty_search | 搜索:输入关键词、IPC、日期范围、申请人等 → 输出排序后的列表(含 record_id 与条目基本信息)。 |
novelty_search_detail | 详情:输入 record_id + 数据源 + 所需字段列表 → 输出条文级全文(权利要求书、说明书、引用、附图线索、法律状态等,以实现返回为准)。 |
三条关键规则(报告与引用)
⚠️ 不要自行摘要 — novelty_search_detail 取得的完整正文须在报告中全文嵌入,不要擅自缩写为「要点提炼」代替原文举证(可在分析区另写评述,但与原文展示区分离)。
⚠️ 必须高亮关键词 — 分析区与原文须在 HTML 中用带 class 的 mark 元素对核心技术特征分色标注,便于阅卷与团队协作对齐。
⚠️ record_id 有效期 — 部分来源(例如 PatentHub)返回的检索标识可能存在短时有效约束(如约 60 分钟);过期后应重新执行搜索再取详情。
适用场景
- 专利新颖性评估与查新意见书素材
- 技术领域竞品与布局扫描
- 撰写申请前的现有技术检索
- 侵权 / 自由实施(FTO)场景的公开资料线索搜集(仍以律师 / 代理机构判断为准)
- 学术选题与可行性的文献侧证
不适用
- 专利撰稿主流程:请配合 patent-agent、patent-doc-formatter
- 一般闲聊或非检索类问答
触发方式示例
对口令或自然语言中明确「查新 / 新颖性 / prior art / 现有技术」等意图即可,例如:
与 graft 的联动
检索结果集会话化后,可通过 graft 在后续撰写会话中复用(例如引用固定时间窗口内的查新结果作为 prior art 证据)。