Недавно мне пришлось распечатать пару PDF-файлов, чтобы отправить кому-то, но я хотел отредактировать (зачеркнуть) пару небольших кусочков текста.
Быстрый поиск в Google не включил никаких инструментов для этой конкретной цели, поэтому я вернулся к imagemagick & amp; gimp:
convert document.pdf document.png
gimp document-0.png
Проблема этой стратегии заключается в том, что процесс преобразования (из PDF в PNG или любой другой формат) теряет качество. Я попытался отредактировать PDF в gimp, но это не сработало сразу.
Существует ли специальный инструмент, который разрешает редактирование таким образом? (Это даже не должно быть «реальным» редактированием - я не отправляю электронную копию, так что «поддельное» редактирование будет работать, потому что бумажную копию нельзя взломать для раскрытия основного текста.)
Или есть хитрость в возможности редактировать PDF в gimp?
По сути, вы пытаетесь выделить / аннотировать PDF, но с некоторой гибкостью в отношении прозрачности и цвета маркера (вы упомянули, что вам не нужно подвергать цензуре / удалять что-либо, просто редактировать). Посмотрите ли вы ответы здесь: Как выделить или аннотировать PDF-файлы?
Один из ответов с самым высоким рейтингом рекомендует Xournal , который здесь не упоминался и был бы моим оружием выбора. Это инструмент, который позволяет вам делать рукописные заметки, но имеет дополнительные функции, позволяющие аннотировать PDF. По умолчанию он сохраняет ваши аннотации в виде отдельного файла, но также позволяет вам экспортировать аннотированный PDF как новый PDF. Это должно поддерживать макет, шрифты и т. Д.
В Xournal вы можете выбрать «Аннотировать PDF», затем использовать сплошной черный маркер для маскировки частей, которые вы хотите отредактировать, и «Экспорт в PDF».
В Интернете есть несколько историй о том, что Xournal растеризует текст в экспортированном PDF-файле (спасибо за указание на это, MHC). Это не похоже на правду: с простыми аннотациями текст остается выбираемым и доступным для поиска, а размер файла не сильно увеличивается (в приведенном ниже примере он увеличился с 205 КБ до 220 КБ).
Для установки запустите в терминале: sudo apt-get install xournal
или просто выберите его в Центре программного обеспечения
Каждый день я редактирую множество PDF-файлов, поэтому трачу много времени на размышления о том, как сделать это наилучшим образом.
Для меня лучший способ - это разделить PDF на 1-страничный PDF-файл, затем редактировать с помощью GIMP, а затем объединить его. Я не использую imagemagick для всех файлов (я вообще не использую), поэтому я не теряю текстовый слой на всех страницах, а только на отредактированных. Не загружайте весь файл PDF сразу, так как это приводит к исчерпанию памяти.
. Простое разделение PDF-файлов на 1-страничный PDF-файл с помощью этой функции bash (поместите в ~ / .bashrc):
function pdf_split(){
for file in "$@"; do
if [ "${file##*.}" != "pdf" ]; then
echo "Skip $file because it's not PDF file";
continue
fi;
pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}')
echo "Detect $pages in $file";
filename="${file%.*}";
unset Outfile;
for i in $(seq 1 "$pages"); do
pdftk "$file" cat "$i" output "$filename-$i.pdf";
Outfile[$i]="$filename-$i.pdf";
done;
done;
};
. Теперь вы можете ввести split_pdf file.pdf
, чтобы получить много файлов PDF.
Но теперь вам нужно отредактировать все эти файлы. Вы можете сделать это с помощью gimp original-filename-*.pdf
. Я предлагаю настроить ярлык в GIMP (Главное окно-> Редактировать-> Ярлык), чтобы заменить файл (я использую CTRL + R), фильтр размытия (например, CTRL + D), закрыть файл (например, CTRL + W) и выйти из GIMP ( eg.CTRL + Q). Не забудьте не загружать в GIMP сразу несколько файлов, а GIMP, поскольку вы загружаете после открытия, поэтому вы можете безопасно использовать gimp original-filename-*.pdf
для тысяч файлов.
Вы можете легко объединять файлы с помощью: pdftk originam-filename-*.pdf cat output "new-file-anon.pdf";
Эти операции очень повторяющиеся и скучные, поэтому я соедините все это в один скрипт:
function pdf_redact(){
for file in "$@"; do
if [ "${file##*.}" != "pdf" ]; then
echo "Skip $file because it's not PDF file";
continue
fi;
pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}')
echo "Detect $pages in $file";
filename="${file%.*}";
unset Outfile;
for i in $(seq 1 "$pages"); do
pdftk "$file" cat "$i" output "$filename-$i.pdf";
Outfile[$i]="$filename-$i.pdf";
done;
gimp "${Outfile[@]}";
pdftk "${Outfile[@]}" cat output "$filename-anon.pdf";
rm "${Outfile[@]}";
read -p "Do you want open output file? " -n 1 -r
echo
if [[ $REPLY =~ ^[Yy]$ ]]
then
evince "$filename-anon.pdf";
fi
read -p "Do you want upload output file to Scribd.com? " -n 1 -r
echo
if [[ $REPLY =~ ^[Yy]$ ]]
then
scribd_up "$filename-anon.pdf";
fi
done;
};
Новейшая версия этого скрипта всегда доступна по адресу: http://dostep.jawne.info.pl/it/bashrc [1119 ]
Не забудьте закрыть GIMP (CTRL + Q) после всех изменений, чтобы продолжить сценарий.
В зависимости от меня, я открываю отредактированные файлы (мне нравится читать, чтобы проверить, все ли), а также загружать их в Scribd с помощью моего другого скрипта - scribd_up , так что теперь я могу редактировать много файлов PDF. очень эффективно.
Поскольку многие решения здесь рекомендуют редактирование / отключение с помощью аннотаций (которые оставляют исходный контент в pdf), я рекомендую растеризацию pdf впоследствии, чтобы действительно удалить исходный контент. (Не будь этим парнем .)
Вот один из способов сделать это, в то же время поддерживая качество и размер файла низкими (по крайней мере, в моем случае куча черно-белых страниц):
$ convert -quality 100 -density 180 -compress zip notreallyredacted.pdf trulyredacted.pdf
Примечание: convert
нужен ImageMagick.
Примечание 2: convert
не сохраняет содержимое форм, которые вы могли заполнить. Чтобы он не потерялся, вы можете сначала напечатать документ «в файл» примерно в evince
(или в любом приложении, которое вы заполнили), а затем , а затем растеризовать его. [ 119]
PDF Studio не является открытым исходным кодом и требует программного обеспечения.
С точки зрения этого вопроса, начиная с версии 8 он имеет функцию ручного редактирования. Пользователи могут выбрать текстовый объект и отредактировать его. Содержимое удаляется из PDF и заменяется черным прямоугольником.
В версии 9, которая выйдет в третьем квартале 2013 года, аннотации и запись для редактирования также будут доступны для изображений и фигур.
Лучший способ сделать это - использовать http://www.pdfescape.com . Вы можете комментировать, добавлять текст и изображения, рисовать «белый» прямоугольник вокруг того, что вы хотите отредактировать, и вы можете быстро загрузить и сохранить его. Он также очень хорошо работает с многостраничными документами, с чем не справляются многие другие решения. Например, если вы откроете многостраничный документ в Gimp или Inkscape, вы сможете открыть только одну страницу за раз. Процесс намного быстрее в PDFescape. Для меня весь процесс редактирования двухстраничного документа занимает меньше минуты.
Существует несколько редакторов для непосредственного редактирования документов PDF, таких как pdfedit
, или преобразования его в другие векторные форматы, которые могут быть лучше поддержаны, например, pstoedit
. Однако я бы не рекомендовал использовать какой-либо из них, так как риск сделать что-то глупое, например, просто закрасить текст черным, оставив векторы на месте, очень просто, что делает редактирование тривиальным для отмены.
Переход от вектора к растровому маршруту является наиболее безопасным способом, предпочтительно 1-разрядным растровым маршрутом, чтобы избежать любых потенциальных проблем с альфа-каналами или цветовых различий, которые могут сделать текст читабельным.
Если возможно, вы всегда должны редактировать исходный документ и просто удалять информацию, а не рисовать в PDF, поскольку даже кернинг и интервал текста вокруг отредактированного текста могут его выдать.
(изначально я рекомендовал Okular, но он не работал так, как я ожидал)
1. Отредактируйте документ в векторном редакторе
Мне удалось открыть PDF-файл в Inkscape , нарисовать прямоугольник поверх фрагмента текста и распечатать его. Inkscape - векторный редактор, поэтому растеризация не требуется. Однако некоторые шрифты выглядели неправильно - возможно, потому, что документ был создан на компьютере Windows с теми шрифтами, которые отсутствуют на моем.
Обратите внимание , что любой метод, который не включает растеризацию, является приемлемым, только если вы собираетесь печатать отредактированный документ на бумаге, а не распространять его в электронном виде, так как текст все еще можно извлечь из под отключениями.
2. Увеличьте разрешение растеризации при открытии в редакторе растровых изображений
Относительно «потери качества» при открытии страницы в Gimp : вы можете напрямую открыть файл PDF в Gimp. Это будет растеризовано в процессе. Величина потери качества в процессе зависит от разрешения, которое вы выбираете при импорте - разрешение 300 т / д должно обеспечить очень приличное качество (по умолчанию 100).
Вы также можете получить хорошие результаты с помощью команды ImageMagick convert
, если скажете увеличить разрешение:
convert -density 300x300 ...
convert
была хороша также: колдовство, которое я использовал, было convert -density 300x300
и there' s никакая потеря качества.
– Ethan Brimhall
07.12.2019, 15:21
Вы можете использовать Okular.
sudo apt-get install okular
Вы также можете попробовать этот инструмент: https://launchpad.net/updf
Вот оно (но в любом случае, текст можно выбрать):
Добавляю в список: Крита . Не было потери качества, потому что при импорте PDF вы можете определить dpi (установите значение 300, как сказал @Sergey). После редактирования нажмите «Экспорт в PDF». Наконец, я нахожу Krita более интуитивным, чем Gimp, после того, как долгое время пользовался Photoshop.
Я помню, как однажды мне и коллеге пришлось найти способ отредактировать пару PDF-файлов. В итоге мы использовали Gimp. Я прокомментирую вам детали ... мы открываем pdf напрямую с помощью gimp (в терминале)
gimp the_file.pdf
Как только вы закончите редактирование, мы не сохранили изменения, вместо того, чтобы распечатать их в PDF-файл ... Кажется, это работает нормально.
convert
сначала, затем отредактируйте преобразованный файл. (См. принятый ответ.)
– Labeeb Panampullan
07.12.2019, 15:22
Откройте PDF с помощью бесплатного инструмента PDF-Xchange PDF Viewer . Вычеркните текст, который нужно отредактировать, используя черные прямоугольники. Распечатать. Это даст вам легкую, качественную «фальшивую» редакцию.
Используйте LibreOffice Draw для того быстрого редактирования, которое вы ищете. После этого вы можете сохранить его в формате LibreOffice Draw или снова экспортировать в формат PDF (File
> Export as PDF
)
. Для импорта файлов PDF в LibreOffice Draw сначала необходимо установить пакет libreoffice-pdfimport
.
Установите его через Центр программного обеспечения Ubuntu ( libreoffice-pdfimport ) или через терминал с
sudo apt-get install libreoffice-pdfimport
.
Если вы не хотите помнить правильное заклинание для convert
, вы можете использовать pdf-redact-tools , скрипт оболочки, автоматизирующий процесс разбиения PDF на изображения PNG и объединения их обратно вместе после редактирования (используя инструмент по вашему выбору, например, GIMP). Это удобно apt-get установить .
convert
. – dashhund 07.12.2019, 15:18