Извлечение встроенных изображений из PDF

Вы можете использовать kdenlive для создания слайд-шоу изображений, а также для предварительного редактирования видео.

Скачать KDEnlive!

167
задан 16.10.2019, 14:35

9 ответов

Используйте pdfimages

pdfimages - инструмент для извлечения изображений PDF, который сохраняет изображения в PDF-файл в формат (ы) PPM, PBM, JPEG или JPEG 2000.

Это часть пакета poppler-utils, который вам нужно установить.

Использование: pdfimages [options] <PDF-file> <image-root>

Пример: Следующее извлекает все изображения из файла PDF и сохраняет их в формате JPEG.

pdfimages -j in.pdf /tmp/out

Сохранение изображений из файла PDF in.pdf в файлах /tmp/out-000.jpg (или /tmp/out-000.pbm; см. Ниже), /tmp/out-001.jpg и т. Д.


Справочная страница pdfimages объясняет:

-j:  Normally, all images are written as PBM (for monochrome images) or PPM for
     non-monochrome images) files. With this option,  images in DCT format are
     saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.
200
ответ дан 22.10.2019, 12:18
  • 1
    Было бы хорошо иметь решение, которое извлекает изображения в его собственном формате. Перекодирование JPEGs не действительно идеально. – pwkc 15.01.2014, 00:26
  • 2
    @Christian из страницы справочника -all Write JPEG, JPEG2000, JBIG2, and CCITT images in their native format. CMYK files are written as TIFF files. All other images are written as PNG files. This is equivalent to specifying the options -png -tiff -j -jp2 -jbig2 -ccitt. – potomok 04.09.2014, 19:01
  • 3
    Обратите внимание на то, что эти -all переключатель только поддерживается в недавних poppler-utils изменениях. Например, если Вы находитесь все еще на 12,04 Вы won' t быть в состоянии получить доступ к этой опции – sakibmoon 11.09.2014, 16:22
  • 4
    Если Вы can' t использование -all идут для форматов PNM. They' ре, без потерь, и можно постобработать изображения, например, к PNG. – potomok 01.07.2015, 14:12
  • 5
    @Christian, используйте $ pdfimages -list <PDF-file> для проверки исходного формата в " enc" столбец, таким образом, Вы don' t должны повторно закодировать изображение к другому формату. – sakibmoon 20.05.2017, 04:19

Я часто использую Inkscape для этого. Загрузите страницу и удалите все остальное. Преимущество заключается в том, что вы можете получать векторные изображения в SVG и изменять их по своему усмотрению.

24
ответ дан 22.10.2019, 12:18
  • 1
    Некоторый PDFs может только быть правильно импортирован с Inkscape внутренний импорт (poppler/cairo импорт, или pdfimage не может проанализировать его правильно). После того, как импортированный, копия & вставьте изображение в новый файл и измените размеры страницы к выбору graphicdesign.stackexchange.com/a/21638/95041 – Jamie Hartnoll 23.05.2017, 22:32
  • 2
    Никакая проблема для меня, который был лучшим решением, не отмечает, что необходимо выбрать одну страницу за один раз! – Tinou 20.09.2019, 01:20

У меня есть двухколонный PDF-файл со встроенными изображениями, созданными с помощью LaTeX, где исходные изображения были представлены в формате EPS. Я попробовал предлагаемое решение на основе pdfimages, но, к сожалению, оно не вернуло никаких изображений. Тогда я попытался использовать Inkscape, но генерируемые им SVG-изображения были искажены, и мне тоже не повезло, экспортируя их как EPS.

Программное обеспечение, которое работало для нас, было MasterPdfEditor .

Вот процедура

  • Откройте файл с помощью Master PDF Editor
  • Используйте инструмент редактирования (Alt + 1), чтобы выбрать изображение, которое нужно извлечь
  • Скопируйте фигуру (Ctrl + C)
  • Нажмите на окружающую пунктирную рамку вокруг изображения и проверьте правую боковую панель (инспектор объектов) и нажмите «Geomerty» , Там вы можете увидеть размер вашего выбора
  • Создать новый файл (Ctrl + N). Вам будет предложено указать размер страницы. Укажите точный размер вашего изображения и создайте новый файл
  • Теперь это немного сложно: вставьте изображение (Ctrl + V). Изображение может не отображаться в новом файле. Используйте стрелки, чтобы переместить его, пока вы не сможете отследить его.
  • Используйте стрелки для центрирования изображения на новой странице
  • Сохранить как PDF

Результат очень высокого качества, но программное обеспечение не бесплатное. Существует демо-версия, которая «позволяет вам попробовать все функции», но поставляется с «добавлением водяного знака в выходной файл». Честно говоря, я не заметил водяных знаков в созданном PDF.

5
ответ дан 22.10.2019, 12:18
  • 1
    Это, Спрашивает Ubuntu... Нам нравится открытый исходный код здесь, и Вашим решением является коммерческое решение с закрытым исходным кодом... Как это уже лучше тогда upvoted ответы? (-1 тем временем) – Igy 14.04.2016, 13:06
  • 2
    Спасибо @Fabby за обратную связь. Я didn' t знают об этом. Есть ли такое правило о askubuntu.com? Однако, как только Вы открываете Ubuntu центр программного обеспечения , Вы получаете предложения для небесплатных приложений. – Tinou 15.04.2016, 21:35
  • 3
    Нет, there' s никакой " rule" и именно поэтому я didn' t голосуют для удаления этого ответа, но существуют лучшие инструменты, которые свободны (как в бесплатном пиве и свобода слова) так that' s просто мнение. – Philip Kendall 16.04.2016, 10:15
  • 4
    +1. Я использовал командную строку ImageMagick, но это - интересное решение для кого-то ищущего GUI. – LightningStryk 18.07.2016, 19:41
  • 5
    Это работает на некоторых людей, that' s достаточно хороший. Don' t быть нацистом.... Я don' t знают кто " we". Можно говорить только за себя. +1 для ответа – Vandan Patel 23.05.2017, 21:57

Вы также можете попробовать pdfmod. Это графический интерфейс (GUI), который может извлекать изображения и выполнять другие основные операции с PDF.

4
ответ дан 22.10.2019, 12:18
  • 1
    Хм, кажется разрядным багги мне. Вставленный PDF с главным образом фиолетовыми изображениями и получил зеленоватые изображения. – Saeed Rahmatolahi 10.02.2018, 18:48

Я использую pdfimages, инструмент командной строки, и он отлично работает для меня. Он очень прост в использовании, и вы можете использовать опцию --help, чтобы узнать больше о его использовании. Я использую Ubuntu, и он поставляется предварительно установленным. Если ваши PDF-файлы зашифрованы или защищены паролем, есть варианты для этого, поэтому этот инструмент отлично работает. Вы можете прочитать больше о pdfimages здесь

1
ответ дан 22.10.2019, 12:18
  • 1
    Прочитайте другие ответы прежде, чем отправить Ваш. Заметьте there' s другой, который покрывает это. – Khuong 24.07.2013, 05:02
  • 2
    Хорошо, извините:) Я думавший отправить мой, потому что это имеет некоторую информацию о защищенных паролем файлах PDF и я объясняю, что этот инструмент имеет это опции, плюс я отправил ссылку, которая является учебным руководством об этом инструменте. – oshell 24.07.2013, 05:37
  • 3
    При получении достаточной репутации можно прокомментировать other' s ответы или upvoted их. – Paul Dixon 24.07.2013, 07:28

Если вам нужно обрезанное изображение в формате pdf / eps, извлеките страницу с изображением, используя pdfmod (в соответствии с предложением To Do).

Затем, используя pdfcrop, вы можете обрезать его, правильно устанавливая поля методом проб и ошибок:

pdfcrop --margins "-15 -50 0 -140" extracted_page.pdf
2
ответ дан 22.10.2019, 12:18

С pdfimages извлеченное изображение может состоять из двух или более частей. Простой способ соединить их снова, не беспокоясь о извлеченных форматах, - это импортировать детали в LibreOffice Draw, обрезать с помощью диалогового окна обрезки изображения, расположить детали, настроить размер страницы и экспортировать в любой формат, который вы предпочитаете.

1
ответ дан 22.10.2019, 12:18

Если вы хотите обрезать изображение из pdf с помощью pdfviewer, вы можете попробовать okular. Он может обрезать все (тексты или изображения) в формате PNG или JPEG. Если вы хотите извлечь изображения в формате png из pdf, вы можете сделать это с помощью минимальной команды с pdftohtml. Он конвертирует PDF в HTML плюс изображения. Здесь вы можете найти пример - https://www.youtube.com/watch?v=CG1rf7k3xo8 . Если вы хотите извлечь много изображений из PDF, я предлагаю вам попробовать это.

1
ответ дан 22.10.2019, 12:18

Используемое программное обеспечение: Xreader OS: Antergos

Шаги:

  1. Открыть PDF
  2. Щелкните правой кнопкой мыши изображение
  3. Выберите «Сохранить изображение как». .
  4. Введите имя файла и расширение.
  5. Сохранить.
0
ответ дан 22.10.2019, 12:18

Теги

Похожие вопросы