Хотя od -c
действительно покажет содержание файла, это не хороший способ получить его тип файла. В то время как некоторые файлы будут содержать заголовок с типом файла, не все будут. Лучшим путем является команда file
:
$ echo "hello" > foo.txt
$ file foo.txt
foo.txt: ASCII text
Так, для получения списка всех типов файлов в каталоге можно сделать:
for file in dir/*; do file "$file" | cut -d: -f 2; done | sort -u
PNG image data, 1500 x 500, 8-bit/color RGBA, non-interlaced
ASCII text
directory
GIF image data, version 89a, 22 x 22
ELF 64-bit LSB executable, x86-64, version 1 (SYSV), dynamically linked (uses shared libs), for GNU/Linux 2.6.32, BuildID[sha1]=becf821e4d814fdb69306d0b3f686eb06992f5e5, stripped
for file in dir/*; do ... done;
: выполните итерации через все в dir
(dir
, просто пример, необходимо изменить это на название фактического каталога, который Вы хотите перерыть), сохраняя каждый объект в свою очередь как $file
file "$file"
: выполненный file
на каждом из объектов найден. cut -d: -f 2
: распечатайте только второе поле (поля, определенные [1 112]) sed 's/^ //; s/ +/ /g'
: удалите пробелы с начала строки и преобразуйте последовательные пробелы в одиночный пробел. sort -u
: удалите типы дубликата файла Попробуйте это:
ls | xargs file -b | sort | uniq
, Как это работает:
ls: содержание каталога списка
файл-b : определите тип файла; не предварительно ожидайте имена файлов для вывода строк
вид : строки вида
uniq: опустите повторенные строки
file -b *
вместо ls | xargs file -b
, чтобы не анализировать ls
.
– MSalters
20.05.2020, 00:56
sort -u
удалит их, строки должны отличаться (у них могло бы также быть различное количество пробелов, которое делает их неидентичными). – Jonas 20.05.2020, 00:57dir/
, который был просто именем в качестве примера, необходимо будет изменить это на название реального каталога:for file in /home/alex/*; do ... done
, например. – NathanOliver 20.05.2020, 00:58