Есть ли лучший способ отредактировать PDF?

Недавно мне пришлось распечатать пару PDF-файлов, чтобы отправить кому-то, но я хотел отредактировать (зачеркнуть) пару небольших кусочков текста.

Быстрый поиск в Google не включил никаких инструментов для этой конкретной цели, поэтому я вернулся к imagemagick & amp; gimp:

  • convert document.pdf document.png
  • gimp document-0.png
  • (используйте кисть для закрашивания текста)
  • печать отредактированной страницы из gimp [116 ]
  • печать оставшихся страниц из xpdf

Проблема этой стратегии заключается в том, что процесс преобразования (из PDF в PNG или любой другой формат) теряет качество. Я попытался отредактировать PDF в gimp, но это не сработало сразу.

Существует ли специальный инструмент, который разрешает редактирование таким образом? (Это даже не должно быть «реальным» редактированием - я не отправляю электронную копию, так что «поддельное» редактирование будет работать, потому что бумажную копию нельзя взломать для раскрытия основного текста.)

Или есть хитрость в возможности редактировать PDF в gimp?

21
задан 07.12.2019, 15:15

15 ответов

По сути, вы пытаетесь выделить / аннотировать PDF, но с некоторой гибкостью в отношении прозрачности и цвета маркера (вы упомянули, что вам не нужно подвергать цензуре / удалять что-либо, просто редактировать). Посмотрите ли вы ответы здесь: Как выделить или аннотировать PDF-файлы?

Один из ответов с самым высоким рейтингом рекомендует Xournal , который здесь не упоминался и был бы моим оружием выбора. Это инструмент, который позволяет вам делать рукописные заметки, но имеет дополнительные функции, позволяющие аннотировать PDF. По умолчанию он сохраняет ваши аннотации в виде отдельного файла, но также позволяет вам экспортировать аннотированный PDF как новый PDF. Это должно поддерживать макет, шрифты и т. Д.

В Xournal вы можете выбрать «Аннотировать PDF», затем использовать сплошной черный маркер для маскировки частей, которые вы хотите отредактировать, и «Экспорт в PDF».

В Интернете есть несколько историй о том, что Xournal растеризует текст в экспортированном PDF-файле (спасибо за указание на это, MHC). Это не похоже на правду: с простыми аннотациями текст остается выбираемым и доступным для поиска, а размер файла не сильно увеличивается (в приведенном ниже примере он увеличился с 205 КБ до 220 КБ).

Для установки запустите в терминале: sudo apt-get install xournal или просто выберите его в Центре программного обеспечения

Xournal interface Resulting exported PDF

0
ответ дан 07.12.2019, 15:16
  • 1
    Для реальной редакции, которая заменяет текстовые данные изображениями, комбинируют этот ответ с @balu' s, который использует ImageMajick' команда s convert. – dashhund 07.12.2019, 15:18
  • 2
    Это работает хорошо, но я couldn' t находят, что очевидный способ редактирует информацию. Я должен был использовать инструмент ничьей для наброска, какие очень грязные взгляды и испытывает недостаток в профессионализме I' d как. Иначе, пятно на с экспортом, растеризирующим содержание так это can' t быть выбранным и обнаруженным. – Xar E Ahmer 07.12.2019, 15:18

Каждый день я редактирую множество PDF-файлов, поэтому трачу много времени на размышления о том, как сделать это наилучшим образом.

Для меня лучший способ - это разделить PDF на 1-страничный PDF-файл, затем редактировать с помощью GIMP, а затем объединить его. Я не использую imagemagick для всех файлов (я вообще не использую), поэтому я не теряю текстовый слой на всех страницах, а только на отредактированных. Не загружайте весь файл PDF сразу, так как это приводит к исчерпанию памяти.

Разделение PDF-файлов на 1-страничные файлы.

. Простое разделение PDF-файлов на 1-страничный PDF-файл с помощью этой функции bash (поместите в ~ / .bashrc):

function pdf_split(){
    for file in "$@"; do
        if [ "${file##*.}" != "pdf" ]; then
            echo "Skip $file because it's not PDF file";
            continue
        fi; 
        pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}') 
        echo "Detect $pages in $file";
        filename="${file%.*}";
        unset Outfile;
        for i in $(seq 1 "$pages"); do
            pdftk "$file" cat "$i" output "$filename-$i.pdf";
            Outfile[$i]="$filename-$i.pdf";
        done;
    done;
};

. Теперь вы можете ввести split_pdf file.pdf, чтобы получить много файлов PDF.

Редактировать файлы

Но теперь вам нужно отредактировать все эти файлы. Вы можете сделать это с помощью gimp original-filename-*.pdf. Я предлагаю настроить ярлык в GIMP (Главное окно-> Редактировать-> Ярлык), чтобы заменить файл (я использую CTRL + R), фильтр размытия (например, CTRL + D), закрыть файл (например, CTRL + W) и выйти из GIMP ( eg.CTRL + Q). Не забудьте не загружать в GIMP сразу несколько файлов, а GIMP, поскольку вы загружаете после открытия, поэтому вы можете безопасно использовать gimp original-filename-*.pdf для тысяч файлов.

Объединение файлов

Вы можете легко объединять файлы с помощью: pdftk originam-filename-*.pdf cat output "new-file-anon.pdf";

Соединять все вместе

Эти операции очень повторяющиеся и скучные, поэтому я соедините все это в один скрипт:

function pdf_redact(){
    for file in "$@"; do
        if [ "${file##*.}" != "pdf" ]; then
            echo "Skip $file because it's not PDF file";
            continue
        fi; 
        pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}') 
        echo "Detect $pages in $file";
        filename="${file%.*}";
        unset Outfile;
        for i in $(seq 1 "$pages"); do
            pdftk "$file" cat "$i" output "$filename-$i.pdf";
            Outfile[$i]="$filename-$i.pdf";
        done;
        gimp "${Outfile[@]}";
        pdftk "${Outfile[@]}" cat output "$filename-anon.pdf";
        rm "${Outfile[@]}";

    read -p "Do you want open output file? " -n 1 -r
    echo    
    if [[ $REPLY =~ ^[Yy]$ ]]
    then
            evince "$filename-anon.pdf";
    fi

    read -p "Do you want upload output file to Scribd.com? " -n 1 -r
    echo 
    if [[ $REPLY =~ ^[Yy]$ ]]
    then
        scribd_up "$filename-anon.pdf";
    fi
    done;
};

Новейшая версия этого скрипта всегда доступна по адресу: http://dostep.jawne.info.pl/it/bashrc [1119 ]

Не забудьте закрыть GIMP (CTRL + Q) после всех изменений, чтобы продолжить сценарий.

В зависимости от меня, я открываю отредактированные файлы (мне нравится читать, чтобы проверить, все ли), а также загружать их в Scribd с помощью моего другого скрипта - scribd_up , так что теперь я могу редактировать много файлов PDF. очень эффективно.

0
ответ дан 07.12.2019, 15:16

Поскольку многие решения здесь рекомендуют редактирование / отключение с помощью аннотаций (которые оставляют исходный контент в pdf), я рекомендую растеризацию pdf впоследствии, чтобы действительно удалить исходный контент. (Не будь этим парнем .)

Вот один из способов сделать это, в то же время поддерживая качество и размер файла низкими (по крайней мере, в моем случае куча черно-белых страниц):

$  convert -quality 100 -density 180 -compress zip notreallyredacted.pdf trulyredacted.pdf

Примечание: convert нужен ImageMagick.

Примечание 2: convert не сохраняет содержимое форм, которые вы могли заполнить. Чтобы он не потерялся, вы можете сначала напечатать документ «в файл» примерно в evince (или в любом приложении, которое вы заполнили), а затем , а затем растеризовать его. [ 119]

0
ответ дан 07.12.2019, 15:17

PDF Studio не является открытым исходным кодом и требует программного обеспечения.

С точки зрения этого вопроса, начиная с версии 8 он имеет функцию ручного редактирования. Пользователи могут выбрать текстовый объект и отредактировать его. Содержимое удаляется из PDF и заменяется черным прямоугольником.

В версии 9, которая выйдет в третьем квартале 2013 года, аннотации и запись для редактирования также будут доступны для изображений и фигур.

0
ответ дан 07.12.2019, 15:17

Лучший способ сделать это - использовать http://www.pdfescape.com . Вы можете комментировать, добавлять текст и изображения, рисовать «белый» прямоугольник вокруг того, что вы хотите отредактировать, и вы можете быстро загрузить и сохранить его. Он также очень хорошо работает с многостраничными документами, с чем не справляются многие другие решения. Например, если вы откроете многостраничный документ в Gimp или Inkscape, вы сможете открыть только одну страницу за раз. Процесс намного быстрее в PDFescape. Для меня весь процесс редактирования двухстраничного документа занимает меньше минуты.

0
ответ дан 07.12.2019, 15:18

Существует несколько редакторов для непосредственного редактирования документов PDF, таких как pdfedit, или преобразования его в другие векторные форматы, которые могут быть лучше поддержаны, например, pstoedit. Однако я бы не рекомендовал использовать какой-либо из них, так как риск сделать что-то глупое, например, просто закрасить текст черным, оставив векторы на месте, очень просто, что делает редактирование тривиальным для отмены.

Переход от вектора к растровому маршруту является наиболее безопасным способом, предпочтительно 1-разрядным растровым маршрутом, чтобы избежать любых потенциальных проблем с альфа-каналами или цветовых различий, которые могут сделать текст читабельным.

Если возможно, вы всегда должны редактировать исходный документ и просто удалять информацию, а не рисовать в PDF, поскольку даже кернинг и интервал текста вокруг отредактированного текста могут его выдать.

0
ответ дан 07.12.2019, 15:19

(изначально я рекомендовал Okular, но он не работал так, как я ожидал)

1. Отредактируйте документ в векторном редакторе

Мне удалось открыть PDF-файл в Inkscape , нарисовать прямоугольник поверх фрагмента текста и распечатать его. Inkscape - векторный редактор, поэтому растеризация не требуется. Однако некоторые шрифты выглядели неправильно - возможно, потому, что документ был создан на компьютере Windows с теми шрифтами, которые отсутствуют на моем.

Обратите внимание , что любой метод, который не включает растеризацию, является приемлемым, только если вы собираетесь печатать отредактированный документ на бумаге, а не распространять его в электронном виде, так как текст все еще можно извлечь из под отключениями.

2. Увеличьте разрешение растеризации при открытии в редакторе растровых изображений

Относительно «потери качества» при открытии страницы в Gimp : вы можете напрямую открыть файл PDF в Gimp. Это будет растеризовано в процессе. Величина потери качества в процессе зависит от разрешения, которое вы выбираете при импорте - разрешение 300 т / д должно обеспечить очень приличное качество (по умолчанию 100).

Вы также можете получить хорошие результаты с помощью команды ImageMagick convert, если скажете увеличить разрешение:

convert -density 300x300 ...
0
ответ дан 07.12.2019, 15:19
  • 1
    Предупреждение общему населению: методы редакции здесь, которые включают сдерживающий текст, предложенный здесь (например, все те, которые избегают растеризации) не безопасны. Текст может все еще быть выбран из-под отключений питания или прочитан из источника файла. Посмотрите, например freerepublic.com/focus/f-news/2706743/posts и hackaday.com/2008/08/01/exposing-poorly-redacted-pdfs – Josh Larson 07.12.2019, 15:20
  • 2
    +1 и принятый! Спасибо за предложение inkscape, это сделало разумное задание (не прекрасный - это потеряло несколько (неважный мне) графические объекты) - но очень разумный). И подсказка относительно convert была хороша также: колдовство, которое я использовал, было convert -density 300x300 и there' s никакая потеря качества. – Ethan Brimhall 07.12.2019, 15:21

Вы можете использовать Okular.

sudo apt-get install okular
  1. Откройте PDF с помощью Okular.
  2. Нажмите F6 .
  3. Нажмите 8 .
  4. Выделите текст, который вы хотите отредактировать.
  5. Щелкните правой кнопкой мыши текст, выберите свойства, выберите «Тип» в качестве «Выделения», нажмите Ok .
  6. Распечатать файл в формате PDF.
0
ответ дан 07.12.2019, 15:20
  • 1
    Okular может отредактировать с любым цветом (черным) из этих функций: текстовое выделение, свободная ручная строка и полигон связываются с внутренней заливкой. Можно сохранить настройку как собственный инструмент аннотации. Легко использование его много раз. Тогда при печати файла к PDF, Вы должны " сила rasterization" гарантировать редакцию не обратимо. Версия 1.1.3 Okular – Bhupendra 07.12.2019, 15:20

Вы также можете попробовать этот инструмент: https://launchpad.net/updf

Вот оно (но в любом случае, текст можно выбрать):

enter image description here

0
ответ дан 07.12.2019, 15:21
  • 1
    Как упомянуто, uPDF имеет много ошибок (и даже не отменяет/восстанавливает), но все все еще подходило в моем случае, так спасибо! – Labeeb Panampullan 07.12.2019, 15:21

Добавляю в список: Крита . Не было потери качества, потому что при импорте PDF вы можете определить dpi (установите значение 300, как сказал @Sergey). После редактирования нажмите «Экспорт в PDF». Наконец, я нахожу Krita более интуитивным, чем Gimp, после того, как долгое время пользовался Photoshop.

0
ответ дан 07.12.2019, 15:21

Я помню, как однажды мне и коллеге пришлось найти способ отредактировать пару PDF-файлов. В итоге мы использовали Gimp. Я прокомментирую вам детали ... мы открываем pdf напрямую с помощью gimp (в терминале)

gimp the_file.pdf

Как только вы закончите редактирование, мы не сохранили изменения, вместо того, чтобы распечатать их в PDF-файл ... Кажется, это работает нормально.

0
ответ дан 07.12.2019, 15:21
  • 1
    По любой причине канитель отказывается позволять мне делать любые редактирования в файл. Я должен был преобразовать с imagemagick' s convert сначала, затем отредактируйте преобразованный файл. (См. принятый ответ.) – Labeeb Panampullan 07.12.2019, 15:22
  • 2
    хорошо, решение inkscape допустимо. Но я повторяюсь Вам, Канитель может отредактировать файлы PDF непосредственно. =D – Jason Denney 07.12.2019, 15:22

Откройте PDF с помощью бесплатного инструмента PDF-Xchange PDF Viewer . Вычеркните текст, который нужно отредактировать, используя черные прямоугольники. Распечатать. Это даст вам легкую, качественную «фальшивую» редакцию.

0
ответ дан 07.12.2019, 15:22
  • 1
    Спасибо, это работало отлично на меня с вином. inkscape и решения для канители только действительно полезны для единственных редакций страницы. – Plugie 07.12.2019, 15:23

Если вы используете LibreOffice для создания PDF-файла, откройте документ в LibreOffice, выделите текст, который нужно отредактировать, щелкните правой кнопкой мыши и выберите символ, выберите «Фон» и нажмите черный. Экспорт в PDF.

0
ответ дан 07.12.2019, 15:23

Используйте LibreOffice Draw для того быстрого редактирования, которое вы ищете. После этого вы можете сохранить его в формате LibreOffice Draw или снова экспортировать в формат PDF (File> Export as PDF)

enter image description here

. Для импорта файлов PDF в LibreOffice Draw сначала необходимо установить пакет libreoffice-pdfimport.

Установите его через Центр программного обеспечения Ubuntu ( libreoffice-pdfimport Install libreoffice-pdfimport ) или через терминал с sudo apt-get install libreoffice-pdfimport.

0
ответ дан 07.12.2019, 15:24

Если вы не хотите помнить правильное заклинание для convert, вы можете использовать pdf-redact-tools , скрипт оболочки, автоматизирующий процесс разбиения PDF на изображения PNG и объединения их обратно вместе после редактирования (используя инструмент по вашему выбору, например, GIMP). Это удобно apt-get установить .

0
ответ дан 07.12.2019, 15:25

Теги

Похожие вопросы