Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Команды по работе с текстом
В операционной системе UNIX большинство информации хранится в текстовом виде. Поэтому команды по обработке текстовой информации играют очень важную роль в этой операционной системе. echo Познакомимся еще с одной командой, аналог котоpой имеется в DOS-системах. Это команда echo (эхо). Она имеет фоpмат: echo [-n] [arg ...]Команда echo выводит на устройство стандартного вывода заданные ей аргументы, разделяя их пробелами и завершая их символом новой строки (\n). Эта команда удобна для формирования диагностических сообщений в командных файлах и для передачи известных данных в программном канале. С помощью следующей команды можно довольно пpосто создать пустой файл: echo > имя_файла. Возможен параметр -n — не выводить завеpшaющий символ перевода строки. Интеpпpетатоp команд имеет встроенную команду echo, которая имеет синтаксические различия с внешней командой echo. Следует знать, что пользователям, работающим с оболочкой, будет доступна встроенная команда echo, если они не укажут /bin/echo. Рассмотрим примеры использования этой команды: Вывод сообщения «Hello, world» на экpан: [user@localhost ~]$ echo "Hello, world."Hello, world.[user@localhost ~]$Вывод сообщения без завеpшающего символа новой стpоки: [user@localhost ~]$ echo -n "Hello, world."Hello, world.[user@localhost test]$Вывод сообщения в файл file1: [user@localhost ~]$ echo "Hello, world." > file1Добавление сообщения к содеpжимому файла file1: [user@localhost ~]$ echo "Hello, world." >> file1Вывод имен файлов текущего каталога в алфавитном поpядке: [user@localhost ~]$ echo *Вывод списка файлов с именами, соответствующих шаблону. Вывести имена файлов с pасшиpением .txt: cat Рассмотpим еще одну команду, котоpая может быть полезна пpи pаботе с файлами. Это команда cat (аналог команды TYPE для DOS-систем). Команда cat имеет следующий фоpмат: cat [-benstuv] [-] [file1 [file2 ...]]Она по очеpеди читает указанные, как аpгументы файлы и выводит их содеpжимое на стандаpтное устpойство вывода. Поименованный файл или файлы выводятся последовательно один за дpугим без пpомежутков. Если файл достаточно длинный, то можно пpиостановить вывод с помощью комбинации клавиш Ctrl-S. Для пpодолжения вывода нажмите любую клавишу. Окончание ввода производится комбинацией Ctrl-D. Операнды обрабатываются в порядке их pазмещения в командной строке. Если не указан ни один файл или указана опция (-), команда читает данные со стандаpтного устpойства ввода. Можно использовать следующие опции: -n Нумеpовать стpоки начиная с 1. -b Подразумевает опцию -n, но не нумеpует пустые стpоки. -e Подразумевает опцию -v и отображает знак доллара ($) в конце каждой строки (визуализация символа пеpевода стpоки). -s Пpи наличии идущих подpяд пустых стpок выводить только одну. -t Подразумевает опцию -v. Выводит cимволы табуляции как ^I. -u Вывод не буферизуется, то есть символы из входного файла записываются в стандаpтный вывод без задеpжки, как только они были пpочитаны. По умолчанию вывод буфеpизуется, то есть символы могут накапливаться в пpомежуточном буфеpе. -v Отображение непечатных символов. Упpавляющие символы выводятся в виде ^X (CRTL+X), символ DEL (восьмеричное 0177) как ^?. Символы не входящие в стандаpтный ASCII-набоp (напpимеp, символы киpиллицы с набоpом стаpших pазpядов) выводятся как «M-x», где x — опpеделяемый младшими семи битами символ. Рассмотрим примеры использования команды: Файл file выводится на устройство стандартного вывода: [user@localhost ~]$ cat fileСцепление (слияние) файлов file1 и file2, после чего они помещаются в файл file3: [user@localhost ~]$ cat file1 file2 > file3Пpисоединение файла file1 к концу файла file2: [user@localhost ~]$ cat file1 >> file2Вывод содеpжимого файла с нумеpацией стpок, но без нумеpации пустых стpок: [user@localhost ~]$ cat -b file11 Number 12 Number 23 Number 34 Number 45 Number 5Нумеpация всех стpок: [user@localhost ~]$ cat -n file11 Number 12 Number 23 Number 34 Number 4567 Number 5less Команда less используется для просмотра файлов, размер которых превышает размер экрана. Пользователю предоставляется интерактивынй интерфейс, в котором текст можно пролистывать, производить по нему поиск и т.п.. Имя просматриваемого файла необходимо указать в качестве аргумента программы: [user@localhost ~]$ less README.txtУправлять программой less просто: страницы перелистываются пробелом, а когда читать надоест, надо нажать q (Quit). Перелистывать страницы можно и клавишами Page Up/Page Down, для сдвига на одну строку вперед можно применять Enter или стрелку вниз, а на одну строку назад — стрелку вверх. Переход на начало и конец текста выполняется по командам g и G соответственно (Go). Полный список того, что можно делать с текстом в less, выводится по команде h (help). Для поиска и подсветки интересующего понятия можно воспользоваться командой /, после которой необходимо ввести интересующий термин — по нажатию клавиши Enter, курсор перейдёт к первому упоминанию термина, который будет выделен серым цветом. Последующие нажатия / и Enter приведут к продолжению поиска слова по документу. Программа less используется в качестве основы команды man — при просмотре страниц руководств. head Команда выводит на экран первые несколько строк файла. По умолчанию выводится первые 10 строк. Имя выводимого файла указывается в качестве аргумента программы, и если оно не задано, производится чтение информации со стандартного входа. С помощью параметра -n можно задать число строк от начала файлы, которые будут выведены на экран. Например: [user@localhost ~]$ head -n 4 /etc/inittab# /etc/inittab: init(8) configuration. # The default runlevel.id:5:initdefault:tail Команда выводит на экран последние несколько строк файла. По умолчанию выводятся последние 10 строк. Имя выводимого файла указывается в качестве аргумента программы, и если оно не задано, производится чтение информации со стандартного входа. С помощью параметра -n можно задать число строк от конца файла, которые будут выведены на экран. Например: [user@localhost ~]$ tail -n 5 /var/log/dmesgloop: loaded (max 8 devices)squashfs: version 3.1 (2006/08/19) Phillip LougherRegistering unionfs 1.4unionfs: debugging is not enableddevice-mapper: ioctl: 4.7.0-ioctl (2006-06-24) initialised: [email protected]Таким способом удобно просматривать последние записи системных журналов. Другим важным параметром команды является -f: команда ожидает изменения в конце фала и отображает их на экране. Часто это используется при просмотре постоянно увеличивающихся файлов. Для завершения команды нажмите Ctrl-C. cut Команда позволяет выводить указанные столбцы или записи из одного или нескольких файлов. Столбцом называется именно столбец — символы с одной и той же позицией в строке, записи же разделяюся символами табуляции. И столбцы и записи задаются указанием их порядкового номера в строке. Можно использовать следующие опции: -cсписок вывод столбцов, указанных агрументом список; -fсписок вывод полей, указанных агрументом список; -dсимвол устанавливает заданный символ в качестве разделителя полей при использовании параметра -f. Если в качестве разделителя используется небуквенный символ (например, пробел), он должен быть заключён в кавычки. Примеры работы программы: Выделение первых семи столбцов файла: [user@localhost ~]$ cat phones.txt1234567 Борис Петрович5557845 Анна Иоановна...[user@localhost ~]$ cut -c1-7 phones.txt12345675557845...Получение списка групп пользователей, зарегистрированных в системе: [user@localhost ~]$ cut -f1 -d: /etc/grouprootbindaemonsysadm...paste Команда paste объединяет два текстовых файла в один. В получившемся файле исходные строки располагаются в соседних столбцах, разделённые символом табуляции (или любым другим символом, указанным через параметр -d). Часто применяется совместно с программой cut. sort Команда sort сортирует строки, входящие во все исходные файлы, и выдает результат на стандартный вывод. Если имена файлов не указаны, или в качестве файла указан «-», исходная информация поступает со стандартного ввода. Команда имеет формат: sort [-c] [-r] [файл ...]При упорядочении используется один или несколько ключей сортировки, выделяемых из каждой вводимой строки. По умолчанию ключ сортировки один — вся строка, а порядок является лексикографическим, соответствующим принятой кодировке символов. Основные опции команды: -c Вместо сортировки файла проверяет, отсортирован ли он. Если файл не отсортирован, команда возвращает 1 и выводит соответствующее сообщение. -r Заменить результат сравнения на противоположный. Рассмотрим примеры использования команды: Отсортировать файл с фамилиями: [user@localhost ~]$ cat f.txtPetrovIvanovSidorovAbramov[user@localhost ~]$ sort f.txtAbramovIvanovPetrovSidorovОтсортировать список файлов в обратном порядке: [user@localhost ~]$ ls / | sort -rvarusrtmpsyssrvsbinroot...uniq Команда uniq построчно анализирует файл и в случае, если он содержит в себе повторяющиеся строки, выбрасывает дубликаты. Команда имеет следующий формат: uniq [-c] [исходный_файл]Если имя исходного файла не указано, команда читает данные со стандартного ввода. В качестве параметра может быть указано -c, тогда рядом с каждой строкой будет выведено число повторений этой строки. Рассмотрим примеры использования команды: Получим имена всех пользователей, работающих в системе в настоящий момент: [user@localhost ~]$ who | cut -f1 -d' 'rootrootivanmaria[user@localhost ~]$ who | cut -f1 -d' ' | uniqrootivanmariaОднако такой результат будет не всегда: [user@localhost ~]$ who | cut -f1 -d' 'rootivanrootmaria[user@localhost ~]$ who | cut -f1 -d' ' | uniqrootivanrootmariaЭто происходит потому, что команда uniq сравнивает строки последовательно. Для того, чтобы избежать дублирования, результат можно сперва сортировать: [user@localhost ~]$ who | cut -f1 -d' ' | sort | uniqivanmariarooticonv Команда iconv предназначена для перекодирования текстовых файлов из одной кодировки в другую и имеет следующий формат: iconv [-l] -f исходная_кодировка -t конечная_кодировка [исходный_файл]Если имя исходного файла не указано, команда читает данные со стандартного ввода. Имя кодировки — исходной или конечной должно соответствовать кодировке в файле, список доступных кодировок можно получить, если запустить команду iconv с параметром -l. wc Эта команда предназначена для подсчёта количества строк, символов и слов в указанных файлах. Команда имеет слудующий формат: wc [-clmw] file ...Можно использовать следующие опции: -c Вывод только количества байт. -l Вывод только количества строк. -m Вывод только количества символов. Отличается от числа байт при многобайтной кодировке. -w Вывод только количества слов. Рассмотрим примеры использования команды: Подсчёт числа слов в документе: [user@localhost test]$ wc -w lectures.txt568 lectures.txtЧисло файлов в каталоге: [user@localhost test]$ ls / | wc -l15Полная статистика по группе xml-файлов (число строк, число слов, число байт): [user@localhost test]$ cat *.xml | wc 16138 253680dd dd — команда блочного копирования файлов. Она имеет следующий формат: dd if=исходный_файл of=конечный_файл bs=размер_блока count=число_блоков skip=число_блолов seek=число_блоковПрограмма используется при копировании частей одного файла в другой, часто применяется при работе с устройствами. Рассмотрим параметры, принимаемые командой: if= Задаёт имя файла (или устройства), откуда будут копироваться данные. of= Задаёт имя файла (или устройства), куда будут копироваться данные. bs= Задаёт размер блока копирования в байтах. Можно применять модификаторы размера: «K» — килобайты, «M» — мегабайты и т.п. count= Задаёт число копируемых блоков. Если этот параметр не задан, копируется всеь исходный файл. skip= Число блоков в исходном файле, которое будет пропущено до чтения. seek= Число блоков в файле назначения, которое будет пропущено до записи. Рассмотрим примеры использования команды: Копирование загрузочного сектора жёсткого диска в файл bootsect: [root@localhost test]# dd if=/dev/hda of=bootsect bs=512 count=11+0 входных записей1+0 выходных записей512 bytes (512 B) copied, 9e-05 seconds, 5,7 MB/sКопирование файла размером до двух мегабайт на простой гибкий диск и обратно: |
Последнее изменение этой страницы: 2019-05-07; Просмотров: 166; Нарушение авторского права страницы