AI Agent 光学设计：Skill 自动解析专利并输出 Excel 报告

发布时间：2026-05-28 10:05阅读：13

往期回顾：open code 结合 Zemax 实现 AI 单片物镜自动设计

在人工智能尚未普及的年代，光学工程师若要下载全公司专利并提取数据制成表格，过程极为繁琐；而在 AI 时代，借助 AI Agent 智能体，过去耗时一整天的任务如今仅需十分钟即可搞定。

本人编程功底尚浅，若有谬误之处，望各位专家海涵。

我对 Skill 的理解如下：

Skill：记录操作流程，当后续出现相关指令时自动调用。

Skill 存储位置：

本案例前置要求：

1. 搭建 Python 环境，推荐使用 DeepSeek V4 Pro 或性能更强的付费大模型。

2. 安装 Tesseract-OCR 及 Pytesseract 库以提取图片文字，并配置至系统 PATH 环境变量。

3. 优化网络环境，确保能顺利抓取谷歌学术上的专利文献。

鉴于专利爬取类 Skill 尚不完善，且需规避潜在的侵权风险，此处仅展示该 Skill 的训练方案及效果演示：

完成上述配置后，输入提示词

最终结果展示：

此过程需消耗大量 Token 进行持续调试，且不同大模型表现各异，但笔者全程未手敲代码，完全由智能体自动调试，完成后让 AI 生成 Skill 以便后续调用或异地部署。

生成的 Skill 文件：

若不愿自行调试或无法调出理想效果，笔者将提供一个现成 Skill 供下载。该 Skill 不含专利爬取功能（以规避侵权等风险），输入指令即可将单个或多个 PDF 转换为表格。经多次调试并消耗大量 Token，且通过异地部署测试，结果稳定可靠。

以下是 Patent-pdf-to-excel 的使用指南及效果展示：

请将 Patent-pdf-to-excel 与 PDF-analyze 配置至以下目录：

调用训练好的 Patent-pdf-to-excel Skill 提取专利信息。

提示词：

实现效果：

可将镜头专利（支持中、日、英三语）自动生成八个中文分页。

部分分页展示：

条件表达式：

镜头参数数据：