停止对 PDF 截图：开发者提取高分辨率图像指南

发布: 1个月前 (2025年12月14日 GMT+8 00:40)

2 分钟阅读

原文: Dev.to

Source: Dev.to

糟糕的做法

打开 PDF，放大后截屏。
结果：像素化、低质量的 PNG，且背景颜色不对。

正确的做法：直接从 PDF 中提取图像

使用 Python（PyMuPDF）

安装库

pip install pymupdf

提取脚本

import fitz  # PyMuPDF

def get_images(pdf_file):
    doc = fitz.open(pdf_file)
    print(f"Processing: {pdf_file}")

    for page_index in range(len(doc)):
        page = doc[page_index]
        image_list = page.get_images()

        for img_index, img in enumerate(image_list):
            xref = img[0]
            base_image = doc.extract_image(xref)
            image_bytes = base_image["image"]
            ext = base_image["ext"]

            # Save the image
            filename = f"page{page_index+1}_img{img_index}.{ext}"
            with open(filename, "wb") as f:
                f.write(image_bytes)
            print(f"Saved: {filename}")

get_images("design_mockup.pdf")

该脚本直接提取 PDF 中嵌入的原始文件，保留原始质量（透明 PNG、高分辨率 JPEG 等）。

浏览器方式（无需代码）

一个免费的在线工具 PDFConvertLabs 在安全的后端执行相同的提取，并提供拖拽界面。它还能自动完成 CMYK 到 RGB 的转换。

在线从 PDF 中提取图像（请替换为实际 URL）

停止对 PDF 截图：开发者提取高分辨率图像指南

糟糕的做法

正确的做法：直接从 PDF 中提取图像

使用 Python（PyMuPDF）

安装库

提取脚本

浏览器方式（无需代码）

相关文章

初学者应该先学习 JavaScript 还是 Python？

Python指南：如何检测域名是否是诈骗

如何用 Python 构建实时 SEC 备案监控（不足 50 行）

Python 与测量工程的结合