Agent Skills

pdfvision 在 skills/pdfvision/ 中包含 Agent Skills。它们告诉智能体何时调用 CLI、先尝试哪些参数，以及何时升级到布局、渲染、OCR 或视觉区域裁剪。

PDF 工作很少能用一个固定命令解决。一个有用的智能体应检查第一轮结果，发现缺失或可疑证据，并选择下一次 pdfvision pass。内置 Agent Skills 编码了这个 workflow，使每个智能体会话不必重新发现它。

安装

bash

npx skills add yamadashy/pdfvision

全局安装：

bash

npx skills add yamadashy/pdfvision -g

Agent Skills 的主指令刻意保持简短，只在任务需要时指向 references。

支持 Agent Skills 的智能体通常应该：

这能保持交互高效，同时仍让智能体有机会像人类读者一样查看 PDF。

在智能体经常读取 PDF、报告、幻灯片、表单或扫描文档的项目中安装 Agent Skills。已经使用 Claude Code、Codex、Cursor 或其他支持 Agent Skills 的智能体环境的 repository 尤其适合。