标签

AI Agent 光学设计:Skill 自动解析专利并输出 Excel 报告

发布时间:2026-05-28 10:05来源:微信阅读:6

往期回顾:open code 结合 Zemax 实现 AI 单片物镜自动设计

在人工智能尚未普及的年代,光学工程师若要下载全公司专利并提取数据制成表格,过程极为繁琐;而在 AI 时代,借助 AI Agent 智能体,过去耗时一整天的任务如今仅需十分钟即可搞定。

本人编程功底尚浅,若有谬误之处,望各位专家海涵。

我对 Skill 的理解如下:

Skill:记录操作流程,当后续出现相关指令时自动调用。

Skill 存储位置:

本案例前置要求:

1. 搭建 Python 环境,推荐使用 DeepSeek V4 Pro 或性能更强的付费大模型。

2. 安装 Tesseract-OCR 及 Pytesseract 库以提取图片文字,并配置至系统 PATH 环境变量。

3. 优化网络环境,确保能顺利抓取谷歌学术上的专利文献。

鉴于专利爬取类 Skill 尚不完善,且需规避潜在的侵权风险,此处仅展示该 Skill 的训练方案及效果演示:

完成上述配置后,输入提示词

最终结果展示:

此过程需消耗大量 Token 进行持续调试,且不同大模型表现各异,但笔者全程未手敲代码,完全由智能体自动调试,完成后让 AI 生成 Skill 以便后续调用或异地部署。

生成的 Skill 文件:

若不愿自行调试或无法调出理想效果,笔者将提供一个现成 Skill 供下载。该 Skill 不含专利爬取功能(以规避侵权等风险),输入指令即可将单个或多个 PDF 转换为表格。经多次调试并消耗大量 Token,且通过异地部署测试,结果稳定可靠。

以下是 Patent-pdf-to-excel 的使用指南及效果展示:

请将 Patent-pdf-to-excel 与 PDF-analyze 配置至以下目录:

调用训练好的 Patent-pdf-to-excel Skill 提取专利信息。

提示词:

实现效果:

可将镜头专利(支持中、日、英三语)自动生成八个中文分页。

部分分页展示:

条件表达式:

镜头参数数据: