От простого к сложному
Запуск Перл - программы
Синтаксис
Встроенные переменные
Регулярные выражения (шаблоны)
Операторы и приоритеты
Пример 1. Введите в файл test1.pl следующие строки:
#!/usr/local/bin/perl # Содержимое файла test1.pl print "Наше Вам с кисточкой!\n";А теперь подробно разберем каждую строку.
#!/usr/local/bin/perlДанная строка должна быть первой в любой Перл-программе. Она указыванет системному интерпретатору что данный файл - это Перл-программа, а Веб-серверу - где искать интерпретатор Перл.
# Содержимое файла test1.plЭта строка называется комментарием. Она всегда начинается символом '#' и заканчивается таким объяснением, что как говорил великий Ходжа Насреддин "это тонкий филосовский вопрос", а говоря простым языком здесь можно писать все что угодно. Даже пожелание руководству. Уж здесь оно точно до него не дойдет.
print "Наше Вам с кисточкой!\n";Самая последняя ну и конечно главная. Она просто выводит на экран надпись "Наше Вам с кисточкой!".
Здесь слово print - это команда "вывести". Все что в кавычках - это символы, \n - перевод строки и ';' - признак конца команды. Он обязателен. В одной строке может быть несколько команд и все они должны завершаться символом ';'. После него может быть символ '#' - это значит остаток строки считается комментарием.
Над этой строкой автору пришлось больше всего поломать голову так как в нее постоянно лезли какие то странные "hello", "hello all", "Построемся и спасемся", "Строй наше спасение" и т.д и т.п.
Если вы никогда не работали с Перл, то бъюсь на спор в 10$, что данная программа сразу у вас не заработает! Не потому что она не верна, а потому что "Нельзя объять необъятное". Сразу, потом можно, да и то частями. Сначала сделайте ваш файл test1.pl исполняемым. Для этого введите команду:
chmod +x test1.plЗатем проверьте где у вас Перл. Для этого введите:
which perlСистема вам выдаст что то вроде: /usr/bin/perl
Если:
perl: Command not found.То тогда закройте браузер и ложитесь спать. У вас просто нет Перл или он не установлен. А мне остается послать вас к системному администратору или к man (для переводчиков- man сокращение от manual а не то что вы подумали). Теперь проверьте, чтобы строка 01 содержала то, что выдала команда which. Если совпало то введите:
test1.plи бьюсь на 50$ что и теперь программа не заработает, так как правильней ввести:
./test1.plЕсли я проиграл, то не радуйтесь. Даже если вам удалось запустить программу как test1.pl это значит, что у вас будут неприятности в будущем.
Пример 2. Данная программа выводит на экран все ваши секреты. А именно файл /etc/passwd.
#!/usr/local/bin/perl
open(PASS, "</etc/passwd") || die "Файл не найден!";
while(<PASS>)
{
print;
}
close(PASS);
Пояснения:
open(PASS, "</etc/passwd") || die "Файл не найден!";"Открыть" файл, т.е. создать указатель файла PASS, а в случае ошибки выдать "Файл не найден!" и закончить программу.
while(<PASS>)Читать по одной строке файла в переменную по умолчанию $_
{
Открыть блок операторов.
print;Вывести на экран переменную по умолчанию $_
}Конец блока.
close(PASS);Закрыть файл. Этого можно и не делать так-как файл автоматически закроется после окончания программы.
Результат работы этой программы тот же что и команды cat /etc/passwd. По экрану пробежали непонятные строки, но зато теперь перед вами открыты горизонты Перл программирования!
Все последующие примеры будут развитием этой программы и она превратится из гадкого утенка в прекрасного лебедя (не генерала).
Пример 3. Разделенеие полей.
#!/usr/local/bin/perl
open(PASS, "</etc/passwd") || die "Файл не найден!";
while(<PASS>)
{
($login, $pass, $uid, $gid, $name, $home_dir, $shell) = split(':');
print "$login \t $name\n";
}
close(PASS);
Пояснение:
($login, $pass, $uid, $gid, $name, $home_dir, $shell) = split(':');
Присвоить указанным переменным поля входной строки, считая разделителем
символ ':'.
print "$login \t $name\n";Вывести login - имя пользователя и его описание. Поля разделены символом '\t' - табуляции.
Пример 4. Вывести имена пользователей, отсортированных по группам.
#!/usr/local/bin/perl
open(PASS, "sort -n -t : +3 -4 +0 /etc/passwd|") || die "Файл не найден!";
while(<PASS>)
{
($login, $pass, $uid, $gid, $name, $home_dir, $shell) = split(':');
print "$login \t $gid \t $name\n";
}
close(PASS);
Пояснения:
open(PASS, "sort -n -t : +3 -4 +0 /etc/passwd|") || die "Файл не найден!";В данной строке весь фокус! Входным файлом для нашей программы стал выход команды sort, которая и отсортирует входные данные.
Форматированный вывод. Ну а теперь напечатаем на экране все наши данные в удобной форме.
#!/usr/local/bin/perl
open(PASS, "sort -n -t : +3 -4 +0 /etc/passwd|") || die "Файл не найден!";
while(<PASS>)
{
($login, $pass, $uid, $gid, $name, $home_dir, $shell) = split(':');
write(); # Форматированный вывод данных.
}
close(PASS);
exit 0; # Завершение программы
############ Описание формы вывода ##################
format STDOUT =
Пользователь: ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
$name
^<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
$name
^<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
$name
----------------------------------------------------------------------
Login:@<<<<<<<< Uid:@<<< Gid:@<<< Home dir:@<<<<<<<<<<<<<<<<<<<<<
$login, $uid, $gid, $home_dir
----------------------------------------------------------------------
. # Это последняя строка программы
Фрагмент результата:
Пользователь: Калужский ликеро-водочный завод. Лучшие водки и настойки. Звонить только перед праздником Кострикову Анатолию т. 2-23-06,,, ---------------------------------------------------------------------- Login:uucryst Uid:1055 Gid:66 Home dir:/var/spool/uucppublic/ ---------------------------------------------------------------------- Пользователь: Торговый Дом Дилен,,, ---------------------------------------------------------------------- Login:uudilen Uid:1075 Gid:66 Home dir:/var/spool/uucppublic ----------------------------------------------------------------------Если вам интересно узнать как работает эта программа, то переверните страницу и начините свое путешествие в мире Перл. Желаю удачи!
perl [ключи] файл аргументыПеред стартом Перл ищет скрипт (программу) в следующем порядке:
После "обнаружения" скрипта Перл компилирует его целиком во внутреннее представление. Если обнаруживаются ошибки то выполнение прекращается. Если ошибок нет он выполняется. Если скрипт заканчивается без команд exit() или die() то по умолчанию выполняется команда exit(0) обозначающая нормальное завершение программы.
Ключи:
| -Oцифры | Код символа-разделителя записей. По умолчанию \0. | ||||||||||||||||||||||||||||||||||||||||||||||||
| -a | Включает режим автоматического разделения (split) переменной $_ в массив $F. Применяется с ключами -n и -p. | ||||||||||||||||||||||||||||||||||||||||||||||||
| -c | Выполняется синтаксическая проверка скрипта и выход без запуска. | ||||||||||||||||||||||||||||||||||||||||||||||||
| -d | Запуск в режиме интерактивной отладки.
|
||||||||||||||||||||||||||||||||||||||||||||||||
| -Dчисло или Dсписок | Установить флаги отладки Перл. Например -d14 проследить, как Перл исполняет вашу программу. | ||||||||||||||||||||||||||||||||||||||||||||||||
| -e команда | Выполнение скрипта из одной строки указанного в командной строке. | ||||||||||||||||||||||||||||||||||||||||||||||||
| -F шаблон | Указывает шаблон разделения в режиме работы с ключом -a | ||||||||||||||||||||||||||||||||||||||||||||||||
| -iрасширение | Применяется для резервной копии файла обрабатываемого
оператором '<>'. Оригинал хранится в файле с тем же именем что и исходный,
но с указанным расширением.
Пример: perl -p -i.old -e "s/рядовой/ефрейтор/" file- Поменять все слова "рядовой" на "ефрейтор" в файле file, а оригинал записать в файле file.old |
||||||||||||||||||||||||||||||||||||||||||||||||
| -Iдиректория | Директория includ- файлов для С препроцессора. Применяется с ключом -P по умолчанию это /usr/include и /usr/lib/perl. | ||||||||||||||||||||||||||||||||||||||||||||||||
| -lчисло | Автоматическая обработка символа конца строки.
Работает в двух случаях.
|
||||||||||||||||||||||||||||||||||||||||||||||||
| -n | Зацикливает скрипт и последовательно обрабатывает файлы указанные в командной строке. Позволяет создавать команды подобные sed или awk. Операторы BEGIN и END дают возможность делать начальные и конечные установки. Содержимое файлов не выводится. | ||||||||||||||||||||||||||||||||||||||||||||||||
| -p | То же что и -n но печатает обрабатываемые строки файлов. | ||||||||||||||||||||||||||||||||||||||||||||||||
| -P | Предварительная обработко препроцессором языка С. Будьте внимательны и не применяйте в комментариях слова 'if', 'else' или 'define' т.к. это команды С - препроцессора. | ||||||||||||||||||||||||||||||||||||||||||||||||
| -s | Включение режима обработки ключей командной строки запуска скрипта. Все аргументы с символом '-' в начале, считаются ключом и переменным с таким же именем присваивается значение true. | ||||||||||||||||||||||||||||||||||||||||||||||||
| -S | Использование системной переменной PATH для поиска скрипта. Данный ключ применяется в системах не воспринимающих последовательность "#!" в начале скрипта для указания интерпретатора. | ||||||||||||||||||||||||||||||||||||||||||||||||
| -T | Режим проверки "дыр" в защите. Обычно это нужно для программ работающих в режиме повышенной привелегии (setuid, setguid). Желательно для CGI скриптов. | ||||||||||||||||||||||||||||||||||||||||||||||||
| -u | Принудительный дамп памяти после компиляции скрипта. Этот дамп можно потом использовать для создания исполняемого файла с помощью программы undump. | ||||||||||||||||||||||||||||||||||||||||||||||||
| -U | Разрешение выполнять опасные операции. Например стереть директорию или выполнять явно не закрытую программу. | ||||||||||||||||||||||||||||||||||||||||||||||||
| -v | Вывод номера версии Перл. | ||||||||||||||||||||||||||||||||||||||||||||||||
| -w | Вывод имен переменных используемых только один раз, имен скаляров используемых до их определения, имен переопределяемых подпрограмм, ссылок на неопределенный указатели файлов, попыток записи в файлы открытых только на "чтение", употребление не коретных записей чисел, использование массивов как скаляров, рекурсия более 100 уровней. | ||||||||||||||||||||||||||||||||||||||||||||||||
| -x директория | Режим запуска скрипта вставленного в файл содержащий обычный текст. Началом скрипта считаестся строка с символами '#!' в начале и содержащия слово perl. Концом - строка с '__END__' Указанная директория становится текущей в момент исполнения. Если необходимо читать последующие строки то это лучше делать через указатель файла DATA. |
Декларации могут использоваться в любом месте программы так же как и предложения (statements) но действуют они только в фазе компиляции программы. Обычно их помещают или в начале или в конце программы.
Декларация подпрограмм позволяет использовать имя подпрограммы как списковый оператор начиная с момента декларирования.
Пример:
sub test; # Декларация подпрограммы test $var1 = test $0; # Использование как оператора списка.Декларации подпрограмм могут быть загружены из отдельного файла предложением require или загружено и импортировано в текущую область имен предложением use. Подробно см. главу Модули.
Любое простое предложение может содержать single модификатор перед ';'. Существуют следующие single модификаторы:
if EXPR unless EXPR while EXPR until EXPRгде EXPR - выражение возвращающее логическое значение true или false.
Модификаторы while и until вычисляются в начале предложения кроме блока do который выполняется первым.
if EXPR - модификатор "если". Предложение выполняется если EXPR возвращает true.
Пример:
$var = 1; $var2 = 3 if $var > 0; # Результат: $var2 = 3while EXPR - модификатор "пока". Предложение выполняется пока EXPR = true
Пример:
$var = 1; print $var++ while $var < 5; # Печать $var с инкрементомРезультат: 1234
until EXPR - модификатор "до ". Предложение выполняется до тех пор, пока EXPR = false
Пример:
$var = 1; print $var++ until $var > 5; # Печать $var с инкрементомРезультат: 12345
unless EXPR - модификатор "если не". Обратный к if. Выражение выполняется есле EXPR = false.
Пример:
$var = 1; print $var++ unless $var > 5; # Печать $var с инкрементомРезультат: 1
Сужествуют следующие виды сложных предложений:
if (EXPR) BLOCK if (EXPR) BLOCK else BLOCK if (EXPR) BLOCK elsif (EXPR) BLOCK ... else BLOCK LABEL while (EXPR) BLOCK LABEL while (EXPR) BLOCK continue BLOCK LABEL for (EXPR; EXPR; EXPR) BLOCK LABEL foreach VAR (LIST) BLOCK LABEL BLOCK continue BLOCKОбратите внимание, что сложные предложения описаны в термах блоков, а не предложений как в языках C или Pascal. Поэтому необходимо всегда использовать круглые скобки для обозначения блока.
if (EXPR) BLOCK - вычисляется логическое выражение EXPR и если true блок выполняется.
Пример:
$var =1;
if ($var == 1)
{
print $var,"\n";
}
Результат: 1
if (EXPR) BLOCK else BLOCK2 - если EXPR=true выполняется BLOCK иначе BLOCK2.
Пример:
$var =2;
if ($var == 1)
{
print "\$var = 1\n";
} else {
print "\$var не равно 1\n";
}
Результат: $var не равно 1
if (EXPR1) BLOCK1 elsif (EXPR2) BLOCK2 ... else BLOCK - если EXPR1=true выполняется BLOCK1 иначе если EXPR2=true выполняется BLOCK2 иначе ... иначе BLOCK.
Пример:
$var = 1;
if ($var == 0)
{
print "\$var = 0\n";
} elsif ($var == 1)
{
print "\$var = 1\n";
} else {
print "Не известное \$var\n";
}
Результат: $var = 1
Блок после continue выполняется всегда перед тем как вычисляется логическое выражение EXPR. Это подобно EXPR3 в предлжении for, поэтому в этом блоке удобно изменять счетчики и флаги цикла даже, если применяестя оператор next.
Пример:
M1: while ($i < 6) { ++$i; # Увеличиваем счетчик на 1 next M1 if $i < 3; # Переходим в начало если $i < 3 ++$i; # иначе увеличиваем счетчик еще раз на 1 } continue { print "$i "; # Печатаем $i }
Результат: 1 2 4 6
last - подобен оператору break в языке С. Немедленно прерывает цикл. Блок continue пропускается.
Пример:
M1:
while ($i < 6)
{
++$i; # Увеличиваем счетчик на 1
last M1 if $i > 3; # Выход из цикла если $i > 3
++$i; # иначе увеличиваем счетчик еще раз на 1
} continue {
print "$i "; # Печатаем $i
}
Результат: 2 4
redo - начать новый цикл не вычисляя EXPR и не выполняя continue блок.
Пример:
M1:
while ($i < 6)
{
++$i; # Увеличиваем счетчик на 1
redo M1 if $i == 3; # Далее пропустить для $i = 3
++$i; # иначе увеличиваем счетчик еще раз на 1
} continue {
print "$i "; # Печатаем $i
}
Результат: 2 5 7
LABEL for (EXPR1; EXPR2; EXPR3) BLOCKОператор for полностью аналогичен оператору for в С. В перед началом цикла выполняется EXPR1, если EXPR2 = true выполняется блок, затем выполняется EXPR3.
Пример:
for ($i = 2; $i < 5; ++$i)
{
print $i, " ";
}
print "\nПосле цикла i = $i\n";
Результат:
2 3 4 После цикла i = 5
LABEL foreach VAR (LIST) BLOCKПеременной VAR присваивается поочередно каждый элемент списка LIST и выполняется блок. Если VAR опущенно то элементы присваиваются встроеной переменной $_. Если в теле блока изменять значение VAR то это вызовет изменение и элементов списка т.к. VAR фактически указывает на текущий элемент списка. Вместо слова foreach можно писать просто for - это слова синонимы.
Пример:
@месяц = ("январь","февраль","март"); # Создали массив
foreach $i (@месяц)
{
print $i," "; # Печать $i
}
Результат: январь февраль март
Пример:
@месяц = ("январь","февраль","март"); # Создали массив
foreach $i (@месяц)
{
$i = uc($i); # Перевели в верхний регистр
}
print @месяц;
Результат: ЯНВАРЬФЕВРАЛЬМАРТ
Пример:
for $i (3,5,7)
{
print "$i ";
}
Результат: 3 5 7
SWITCH:
{
if ($i ==1 ) { .....; last SWITCH; }
if ($i ==2 ) { .....; last SWITCH; }
if ($i ==3 ) { .....; last SWITCH; }
$default = 13;
}
Выбирайте сами по своему вкусу.
В Перл реализовано три формы goto. goto - метка, goto - выражение и goto - подпрограмма.
goto - метка выполняет непосредственный переход на указанную метку.
goto - выражение - Вычисляет имя метки и делает соответсвующий переход.
Например если мы хотим сделать переход на одну из трех меток "M1:", "M2:" или "M3:" в зависимости от значений переменной $i равной 0, 1 или 2 то это лучше сделать следующим образом:
goto ("M1", "M2", "M3")[$i];
здесь $i используется как индекс массива указанного непосредственно в выражении.
goto подпрограмма - довольно редкий случай т.к. всегда проще и надежней вызвать подпрограмму "естественным" образом.
= head Набор стандартных процедурто пропускается все до слова '=cut'. Это удобно для включения длинных на несколько строк или страниц комментариев. Затем с помощью специальной программы pod можно отделить текст документации от текста программы.
Имена скалярных переменных всегда начинаются с символа '$' даже когда обозначают элемент массива.
Пример:
$var1 # Простой скаляр 'var1'
$var1[0] # Первый элемент массива 'var1'
$var1{'first'} # Элемент с индексом 'first'
В случае использования имени массива "целиком" или его "среза" перед именем
массива ставится символ '@'.
Пример:
@var1 # Все элементы массива var1 ( $var1[0], $var1[1], ... $var1[n])
@var1[1,3,10] # Элементы $var1[1], $var1[3], $var1[10]
@var1{'first','last'} # то же что и ( $var1{'first'}, $var1{'last'} )
Хеш "целиком" начинается с символа '%'.
Пример:
%var, %key, %yearsИмена подпрограмм начинаются символом '&' если из контекста не видно, что это подпрограмма.
Пример:
&sub1, &test_prog, test(12)Имена таблиц символов всегда начинаются символом '*'.
Каждый тип переменных имеет свою область памяти поэтому $var1 и $var1[0] совершенно разные переменные, хотя $var1[0] часть массива @var1. Так же @var1 и %var1 - разные массивы переменных.
Имена переменных могут содержать любые буквенно-цифровы символы за исключением пробела и табуляции. Эти смволы используются в качестве разделителей. Большие и малые буквы различаются поэтому $var1 и $Var1 - разные переменные. В Перл по умолчанию имена меток и указателей файлов пишут большими буквами.
В Перл имеется два главных контекста: скалярный и список (list). Проще говоря если в левой части выражения имеется ввиду одно единственное значение - то это скалярный контекст. Если множество значений - список.
Пример:
$var1 = <>; # Прочитать одну строку файла @var1 = <>; # Прочитать все строки файла в массив @var1 $var1 = (1,2,3); # $var = 3 - количество элементов @var1 = (1,2,3); # Создание массива @var1 с элементами 1,2,3
В Перл не существует типов "строка" или "число" или "файл" или что то еще. Это контекстно зависимый полиморфный язык для работы с текстами.
Скаляр имеет логическое значение "TRUE" (истина) если это не нулевая строка или число не равное 0.
В Перл существует два типа нулевых (null) скаляров - определенные (defined) и не определенные (undefined). Не определенное значение возвращается когда что-то не существует. Например не известная переменная, конец файла или ошибка. С помощью функции defined() вы можете заранее обнаружить подобное состояние.
Количество элементов массива так же является скаляром и начинается символами $# подобно интерпретатору csh. Фактически $#var1 - это индекс последнего элемента массива. Нужно помнить что первый элемент имеет индкес 0 поэтому количество элементов определяется как $#var1+1 . Присвоение значения $#var1 - изменит длину массива и разрушит "оставленные" значения. Присвоение значения элементу массива с индексом больше чем $#var1 - увеличит размер массива, а присвоение ему нулевого списка - обнулит.
В скалярном контексте имя массива возвращает его длину (для списка возвращается последний елемент).
Пример:
@var1 = (4, 3, 2, 1); # Присвоение значения элементам массива $i = @var1; # Использование скалярного контекста print $i; # Печать результата 4 - кол-во элементов print @var1; # Списковый контекст, печать всех элементов.Для принудительного получения скалярного значения удобно применять функцию scalar().
Пример:
print scalar(@var1); # Вывод длины массива а не его значенийХеш в скалярном контексте возвращает "true" если существует хотя бы одна пара "ключ-значение". Фактически возвращается строка типа 2/8 где 8 - количество выделенных "ячеек" памяти а 2 - количество использованных.
123 123.123 0.12 .12E-10 0xABCD # Шестнадцетиричная запись 0377 # Если 0 в начале - восьмеричная 123_456_123 # Так тоже можно для удобства чтения.Строки ограничиваются одинарными (') или двойными (") кавычками:
'Ровняйсь, смирно!' "Построемся и спасемся."Способов обозначения строк очень много. Подробно смотрите описание оператора qq.
В хеше можно опускать кавычки если индекс не содержит пробелов.
Пример:
$var1{first} то же что и $var1{'first'}
Обратите внимание на то что перед первой одинарной кавычкой должен стоять пробел иначе строка воспримется как имя переменной так-как в именах разрешено использование одинарных кавычек.
Запрещается в кавычках применять зарезервированные литералы __LINE__ (номер текущей строки программы), __FILE__ (текущий файл).
Для обозначения конца программы можно применять литерал __END__. Весь последующий текст игнорируется, но его можно прочитать, используя указатель файла DATA.
Слова в программе не поддающиеся ни какой интепретации воспринимаются, как строки в кавычках поэтому рекомендуется имена меток и указателей файлов писать большими буквами для избежания возможного "конфликта" с зарезервированными словами.
В Перл есть возможность вставлять текст документа прямо в программу. Так называемый "here-doc" (здесь текст) метод. Обозначается символами << за которым идет слово-ограничитель.
Пример:
print <<EOF; # Все строки до EOF - текст для печати. Эй вы трое, идите двое сюда! Полковник Савонькин. EOF
Пример:
@var1 = (1, 2, 'привет', 1.2); # Присвоить значение элементам.где
$var1[0] = 1, $var1[1] = 2, $var1[2] = 'привет' $var1[3] = 1.2
$var1 = (1, 2, 'привет', 1.2);а здесь $var1 = 1.2 т.е. последнее значение списка.
Допускается применять в списке другие списки, но в полученном списке уже невозможно различить начало и конец включенных списков.
Пример:
@s1 = (1, 2, 3); # Первый список @s2 = (6, 7, 8); # Второй @s = (0, @s1, 4, 5, @s2, 9, 10); # Включаем списки @s1 и @s2 print @s; # Результат: 012345678910 - значения без пробелов.Список без элементов обозначаестя как () и называется нуль-списком. Списковое выражение можно употреблять как имя массива, но при этом его нужно брать в круглые скобки.
Пример:
print ('январь','февраль','март')[1];
Результат: февраль
Список может быть присвоен списку только если каждый элемент в списке в левой части выражения допустим по типу списку в правой части.
Пример:
($a, $b, $c) = (1, 2, 3); # $a = 1, $b = 2, $c = 3Присваивание списков в скалярном контексте возвращает количество присвоенных элементов.
Пример:
$x = (($a, $b, $c) = (1,2)); # Результат $x=2В случае присваивания списка хешу список разсматривается как пары: ключ-значение.
Пример:
%дни_месяца = ('январь', 31, 'февраль', 30);
Результат: $дни_месяца{январь} = 31, $дни_месяца{февраль} = 30
Для удобства записи можно использовать выражение с => .
Пример:
%дни_месяца = ( январь => 31, февраль => 30, );
Единственно где это необходимо, так это для работы со ссылками на файлы. Например если вам нужно создать локальную ссылку на файл в процедуре то это лучше сделать так:
sub new_sub
{ local *IN; # Ссылка на файл
open (IN, "test") || return undef; #Открыть файл. Возврат при ошибке.
.........
return;
}
Более подробно это описано в главе Ссылки.
use English;Точно так же если вы захотите пользоваться переменными и методами текущего указателя файлов вы можете написать:
use FileHandle;после этого можно просто писать:
метод указатель выражениеили
указатель -> метод(выражение)Ниже приводятся имена как в короткой так и в длинной (словесной) форме. Некоторые из встроенных переменных имеют доступ тоько на чтение поэтому изменить их значение просто не возможно.
$_ $ARGПеременная - по умолчанию для операторов ввода и поиска. То есть если в качестве аргумента не указана никакая переменная то используется именно эта.
$цифраСодержит найденные подстроку в последнем поиске, когда шаблон содержит метасимволы в круглых скобках. Цифра в данном случае это номер скобок. Первая подстрока имеет номер 1.
$& $MATCHНайденная подстрока в последнем поиске по шаблону.
$`Подстрока предшевствующая найденной подстроке.
$' $POSTMATCHПодстрока последующая за найденной подстрокой.
$+ $LAST_PAREN_MATCHПодстрока найденная в поиске с выбором по "или".
$* $MULTILINE_MATCHINGЕсли значение этой переменной установить равным 1 то переменная в которой осуществляется поиск будет считаться многосторочной т.е. содержащей символы '\n' - перевод строки. Если значеие равно 0 то переменная считается однострочной. В Перл версии 5 и выше не рекомендуестя использовать эту переменную.
$. $INPUT_LINE_NUMBER $NRНомер прочитанной строки последнего оператора ввода. Закрытие файла вызывает очистку значения этой переменной.
$/ $RS $INPUT_RECORD_SEPARATORСимвол - признак конца входной строки. По умолчанию это '\n'
$| $OUTPUT_AUTOFLUSHЕсли присвоить этой переменной не нулевое значение то будет сброс буфера вывода после каждой операции вывода. Значение по умолчанию -0
$, $OFS $OUTPUT_FIELD_SEPARATORСимвол добавляемый оператором print после каждого элемента из списка параметров.
$\ $ORS $OUTPUT_RECORD_SEPARATORСимвол добавляемый print после вывода всех параметров.
$" $LIST_SEPARATORАнологичен "$," но добавляется после каждого элемента массива указаноого в "....".
$; $SUBSEP $SUBSCRIPT_SEPARATORСимвол - разделитель для эмуляции многомерных массивов в хеш массивах. По умолчанию '\034'.
$# $OFMTФормат по умолчанию для вывода чисел.
$% $FORMAT_PAGE_NUMBERФормат по умолчанию для вывода номеров страниц.
$= $FORMAT_LINES_PER_PAGEДлина одной страницы. По умолчанию 60 строк.
$- $FORMAT_LINES_LEFTКоличество оставшихся строк на странице.
$~ $FORMAT_NAMEИмя формата текущего вывода. По умолчанию имя указателя.
$^ $FORMAT_TOP_NAMEИмя текущего формата для заголовка страницы.
$: $FORMAT_LINE_BREAK_CHARACTERSСимволы переноса строки для многострочных полей. В строке формата такие поля начинаются символом '^'. По умолчанию '\n-'.
$^L $FORMAT_FORMFEEDСимвол перевода формата ( смены листа). По умолчанию '\f'.
$^A $ACCUMULATORТекущее значение аккумулятора функции write() для format(). Значение этой переменной можно увидеть только при использовании функции formline() т.к. write() очищает ее после каждого вывода.
$? $CHILD_ERRORДанная перменная содержит статус завершения таких процессов, как: закрытие pipe, завершение функций system(), wait() и `...`.
$! $ERRNO $OS_ERRORВ числовом контексте возвращает код ошибки errno. В строковом - строку сообщения об ошибке. Можно принудительно присвоить этой перменной код ошибки что бы получить системное сообщение для данного кода или установить код завершения для функции die().
$@ $EVAL_ERRORСообщение об ошибке последней команды eval().
$$ $PID $PROCESS_IDНомер текущего процесса.
$< $UID $REAL_USER_IDРеальный UID текущего процесса.
$> $EUID $EFFECTIVE_USER_IDЭффективный UID текущего процесса.
$( $GID $REAL_GROUP_IDРеальный GID текущего процесса.
$) $EGID $EFFECTIVE_GROUP_IDЭффективный GID текущего процесса.
$O $PROGRAM_NAMEИмя файла программы. Если этой переменной присвоить какое нибудь значение то его можно видеть в команде ps, что удобно для контроля за состоянием программы.
$[Номер первого элемента массива или символа строки. Значение по умолчанию - 0.
$] $PERL_VERSIONСтрока сообщение версии Перл. Печатается по команде perl -v Применяется в программе для определения рабочей версии Перл. В числовом контексте это номер версии плюс номер модификации / 1000.
$^D $DEBUGGINGТекущее значение ключа отладки '-D'.
$^F $SYSTEM_FD_MAXНомер максимального системного описателя файлов (system file descriptor). Обычно это 2.
$^I $INPLACE_EDITТекущее значение inplace-edit возможности. Для отключения используйте undef.
$^P $PERLDBВнутренний флаг отладки. Применяется для того что бы отладчик не отслеживал самого себя.
$^T $BASETIMEВремя в секундах с начала 1970 года старта текущей программы.
$^W $WARNINGЗначение флага '-w'. true -если включено и false - выключено.
$^X $EXECUTABLE_NAMEКоманда запуска Перл. Аналогично argv[0] в С.
$ARGVИмя текущего файла читаемого оператором '<>'.
@ARGVМассив параметров строки запуска программы. Внимание! @#ARGV - меньше количества параметров на 1 т.к. $ARGV[0] это первый параметр (не имя программы).
@INCСписок директорий диска которые просматривает Перл для выполнения команд do, require или use.
%INCЭтот хеш содержит имена директорий для имен использованных файлов командами do или require. Ключ - имя файла, а значение - директория.
$ENV{выражение}
Хеш %ENV содержит значения переменных окружения. Изменение этих значений
вызывает изменение окружения для процессов потомков.
$SIG{выражение}
Хеш %SIG содержит имена подпрограмм для системных сигналов таких как INT,
QUIT, PIPE, ... Значение 'DEFAULT' - для системной обработки. 'IGNORE'
- игнорировать данный сигнал.
Как правило все эти операторы имеют схожие опции такие как:
i - не различать строчные и заглавные буквы
m - считать строку многострочной
s - однострочная строка
x - расширенный синтаксис ( использование пробелов и комментариев)
Обычно все эти опции обозначают как '/x'. Их можно использовать даже внутри шаблонов использую новую конструкцию (?...)
Регулярные выражения или шаблоны (pattern) то же самое что и regexp процедуры в Юниксе. Выражения и синтаксис заимствован из свободно распространяемых процедур V8 Генри Спенсера (Henry Spencer) там же они подробно и описаны.
В шаблонах используются следующие метасимволы (символы обозначающие группы других символов) часто называемых egrep - стандартом:
\ - считать следующий метасимвол как обычный символ
^ - начало строки
. - один произвольный символ. Кроме '\n' - конец строки
$ - конец строки
| - альтернатива (или)
() - группировка
[] - класс символов
Метасимволы имеют модификаторы (пишутся после метасимвола):
* - повторяется 0 или большее число раз
+ - повторяется 1 или большее число раз
? - 1 или 0 раз
{n} - точно n раз
{n,} - по меньшей мере раз
{n,m} - не менше n, но и не больше m
Во все других случаях фигурные скобки считаются обычными (регулярными) символами. Таким образом '*' эквивалентна {0,} , '+' - {1,} и '?' - {0,1}. n и m не могут быть больше 65536.
По умолчанию действие метасимволов "жадно" (greedy). Совпадение распространяется столько раз сколько возможно не учитывая результат действия следуюющих метасимволов. Если вы хотите "уменьшить их аппетит" то используйте символ '?'. Это не изменяет значение метасимволов просто уменьшает распространение. Таким образом:
*? - станет 0 и более
+? - 1 и более
?? - 0 или 1 раз
{n}? - точно n раз
{n,}? - не меньше n раз
{n,m}? - больше или равно n и меньше m раз
Шаблоны работают так же, как и двойные кавычки поэтому в них можно использовать `\` - символы (бакслэш-символы):
\t - символ табуляции
\n - новая строка
\r - перевод каретки
\а - перевол формата
\v - вертикальная табуляция
\a - звонок
\e - escape
\033 - восьмеричная запись символа
\x1A - шестнадцатеричная
\c[ - control символ
\l - нижний регистр следующего символа
\u - верхний регистр следующего символа
\L - все символы в нижнем регистре до \E
\U - в верхнем регистре до \E
\E - ограничитель смены регистра
\Q - отмена действия как метасимвола
Дополнительно в Перл добавлены следующие метасимволы:
\w - алфавитно-цифровой или '_' символ
\W - не алфавитно-цифровой или '_' символ
\s - один пробел
\S - один не пробел
\d - одна цифра
\D - одна не цифра
Обратите внимание что все это "один" символ. Для обозначения последовательности применяйте модификаторы. Так:
\w+ - слово
\d+ - целое число
[+-]?\d+ - целое со знаком
[+-]?\d+\.?\d* - число с точкой
Кроме того существуют мнимые метасимволы. Обозначающие не существующие символы в месте смены значения. Такие как:
\b - граница слова
\B - не граница слова
\A - начало строки
\Z - конец строки
\G - конец действия m//g
Граница слова (\b) - это мнимая точка между символами \w и \W. Внутри класса символов '\b' обозначает символ backspace (стирания). Метасимволы \A и \Z - аналогичны '^' и '$' но если началостроки '^' и конец строки '$' действуют для каждой строки в многосторочной строке, то \A и \Z обозначают начало и конец всей многосторчной строки.
Если внутри шаблона применяется группировка (круглые скобки) то номер подстроки группы обозначается как '\цифра'.
Заметьте что за шаблоном в пределах выражения или блока эти группы обозначаются как '$цифра'. Кроме этого существуют дополнительные переменные:
$+ - обозначает последнее совпадение
$& - все совпадение
$` - все до совпадения
$' - все после совпадения
Пример:
$s = "Один 1 два 2 и три 3";
if ($s =~ /(\d+)\D+(\d+)/)
{
print "$1\n"; # Результат '1'
print "$2\n"; # '2'
print "$+\n"; # '2'
print "$&\n"; # '1 два 2'
print "$`\n"; # 'Один '
print "$'\n"; # ' и три 3'
}
Перл версии 5 содержит дополнительные конструкции шаблонов:
(?#комментарий) - комментарий в теле шаблона.
(?:шаблон) - группировка как и '( )' но без обратной ссылки
(?=шаблон) - "заглядывание" вперед.
Например /\w+(?=\t)/ соответствует слову, за которым идет табуляция, но символ '\t' не включается в результат.
Пример:
$s = "1+2-3*4";
if ($s =~ /(\d)(?=-)/) # Наити цифру за которой стоит '-'
{
print "$1\n"; # Результат '2'
} else {
print "ошибка поиска\n";
}
(?!шаблон) - "заглядывание" вперед по отрицанию.
Пример:
$s = "1+2-3*4";
if ($s =~ /(\d)(?!\+)/) # Наити цифру за которой не стоит '+'
{
print "$1\n"; # Результат '2'
} else {
print "ошибка поиска\n";
}
(?ismx) - "внутренние" модификаторы. Удобно применять в шаблонах, где например
нужно внутри шаблона указать модификатор.
Правила регулярного выражения. (regex)
| ассоц. | операторы |
|---|---|
| левая | термы и левосторонные списковые операторы |
| левая | -> |
| - | ++ -- |
| правая | ** |
| правая | ! ~ \ унарные + и - |
| левая | =~ !~ |
| левая | * / % x |
| левая | + - . |
| левая | << >> |
| - | именованные унарные операторы |
| - | < > <= >= lt gt le ge |
| - | == != <=> eq ne cmp |
| левая | & |
| левая | | ^ |
| левая | && |
| левая | || |
| - | .. |
| правая | ?: |
| правая | = += -= *= и т.д. |
| левая | , => |
| - | правосторонние списковые операторы |
| левая | not |
| левая | and |
| левая | or xor |
| левая |
Если после любого спикового оператора ( print(), и т.д.) или унарного оператора (chdir(), и т.д.) следует левая круглая скобка, то операторы внутри скобок имеют наивысший приоритет. Так же как и обычные функции.
Если скобки отсутсвуют то приоритет списковых операторов или наивысший или наименьший в отношении операторов справа или слева от него.
Например:
@i = ('a ','b ', print 'c ', 'd ');
print "\n",@i,"\n";
Результат:
c d a b 1Здесь мы имеем списковый оператор print. Для запятых слева от него он имеет наименьший приоритет, но повышает приоритет правой запятой. Поэтому правая запятая воспринимается как параметр для print и печатается 'c d' а левая просто записывает код завершения операции в массив @i и последний print показывает это.
Употребление инкремента к строковым переменным в Перл имеет одну особенность. Каждый символ остается в своем классе (большие, малые, цифры) и учитывается перенос предыдущего символа. Таким образом строковые переменные с цифрами работают как числовые переменные.
Пример:
print ++($i = "09"); # Результат "10" print ++($i = "a9"); # "b0" print ++($i = "az"); # "ba" print ++($i = "aZ"); # "bA"
print 4**2 # Результат 16 print -4**2 # Результат -16 т.е. -(4**2)
В скалярном контексте возвращает строку левой части повторенную величиной указанной в правой части. В списковом контексте, если в левой части список в круглых скобках - повторенный список.
Пример:
print '*' x 5; # Результат '*****' print (1,2) x 3; # Результат 121212
'>>' - сдвигает побитно вправо значение выражения в левой части на количество бит указанное в правой.
Отличие от подобных операторов в С заключается в том, что в С возращаемое значение либо 0 либо 1. Тогда как в Перл возвращается результат выражения.
Пример:
for $i (1..4)
{
print "$i ";
}
Результат: 1 2 3 4
В скалярном контексте результат - логическое значение. Каждая '..' операция устанавливает свое собственное состояние. Это false до тех пор пока левый операнд false. Как только левый операнд стал true результат - true до тех пока правый true, после чего результат опять - false. Если вы не хотите проверять правый операнд то используйте оператор '...'.
Правый операнд не вычисляется пока результат false и левый операнд не вычисляется пока пока результат true. Приоритетность оператора '..' немного ниже чем '&&' и '||'. Возвращаемое значение если flase - нулевая строка, если true - порядковый номер начиная с 1. Порядковый номер обнуляется для каждого нового диаппазона. Последний порядковый номер добавляется строкой "E0" которая не изменяет его значение но позволяет фиксировать последнее значение.
Пример:
@алфавит = ('a'..'z'); # Массив малых букв латинского алфавита
@цифры = (0..9); # Массив цифр
Пример:
$i = 1; $i > 1 ? print "больше" : print "меньше";Результат: меньше
Вся эта группа операторов подобна операторам С т.е.
$i += 2;эквивалентно
$i = $i + 2;Остальные операторы этой группы работают аналогично. Допустимы следующие операторы:
**= += -= .= *= /= %= x= &= |= ^= <<=>>= &&= ||=Приоритет всей этой группы операторов равен приоритету '='.
По умолчанию Полное Функция Интерполяция
---------- ------ ------------ ----
'' q{} Literal нет
"" qq{} Литерал да
`` qx{} Команда да
qw{} Список слов нет
// m{} Шаблон да
s{}{} Подстановка да
tr{}{} Трансляция нет
В строках допускающих интерполяцию имена переменных начинающиеся с символов
'$' или '@' - интерполируются т.е. в строку вставляется значение строки
или массива.
Данные последовательности символов имеют специальное значение:
| \t | символ табуляции |
| \n | символ новой строки |
| \r | возврат |
| \f | перевод формата |
| \v | вертикальная табуляция |
| \b | backspace (забой) |
| \a | звонок |
| \e | escape |
| \034 | восьмеричный символ |
| \x1a | шестьнадцатеричный символ |
| \c[ | символ управления |
| \l | нижний регистр следующего символа |
| \u | верхний регистр следующего символа |
| \L | нижний регистр для всех символов до \E |
| \U | верхний регистр для всех символов до \E |
| \E | ограничитель смены регистра |
| \Q | отмена действия метасимволов до \E |
Шаблоны интерполируются как регулярные выражения. Это выполняется вторым проходом после интерполяции переменных поэтому в шаблоны можно вставлять переменные. Для отмены интерполяции используйте '\Q'. Если вы применяете вложенные ограничители то внутренние ограничители работать не будут.
Опции:
g - Глобальный поиск. Поиск всех вхождений.
i - Сравнение не зависит от регистра (верхний или нижний)
m - Строка многострочна
o - однопроходная компиляция
s - однострочная строка
x - используеются расширенные регулярные выражения
Если '/' - ограничитель то начальное 'm' можно опустить. С помощью него в качестве ограничителя может быть любой символ кроме пробела.
PATTERN может содержать переменные которые будут интерполироваться (перекомпилироваться) каждый раз в момент вычисления. Переменные $) и $| не интерполируются. Если вы хотите что бы такой шаблон интерполировался один раз - добавьте /o. Это необходимо делать в циклах поиска для увеличения быстродействия однако если вы измените значение переменной Перл этого даже не заметит.
Если PATERN - нулевая строка то используется последнее регулярное выражение.
В скалярном контексте возвращается список элементы которого результаты выполнения выражений в скобках патерна ($1, $2, $3...). Обратите внимание что первый елемент $1.
Пример:
$a = "/usr/local/perl/perl.bin"; # Анализируемая строкаЦель: Создать массив @dirs с именами директорий.
Решение: Самый простой способ воспользоваться split('\/') но в качестве примера используем скобки.
@dirs =~ m[/(\w*)/(\w*)/(\w*)/(\w*)]Здесь 'm[' - использовать квадратные скобки как ограничители. (\w*) - шаблон алфавитноцифровой последовательности.
В результате @dirs равен ('usr', 'local', 'perl')
Пример:
print q#Привет.#; # Результат Привет. print 'O\'K'; # O'K
Пример:
$var = 13; print "\$var = $var";Результат: $var = 13
Пример:
print `date`;Результат: Thu Nov 14 13:36:49 MSK 1996
Пример:
print qw/Построемся и спасемся!/; # ('Построемся','и','спасемся!')
Результат: Построемсяиспасемся!
Часто применяется как:
use POSIX qw( setlocale localeconv ) @EXPORT = qw( proc1 var );
Если строка в которой ведестя поиск не указана (операторы =~ или != ) то используется переменная $_ .
Если в качестве раделителя '/' исрользовать одинарную кавычку (') то интерполяции не будет иначе можно применять переменные в шаблоне или подстроке.
Опции:
e - Расмматривать правую часть как выражение
g - Глобальный поиск
i - Без различия регистра букв
m - многосточная переменная
o - компилировать шаблон один раз
s - однострочная переменная
x - расширенное регулярное выражение
Разделитель '/' можно заменить на любой алфавитно-цифровой символ кроме пробела.
Пример:
$var = "12345"; # исходная строка $var =~ s/1/0/; # Заменить '1' на '0'. Результат 02345 $var =~ s(5)(.); # Заменить '5' на '.' Результат 0234.Здесь в качестве разделителя применены скобки поэтому подстрока взята в две скобки.
$var =~ s/\d*/каламбур/; Заменить все цифры. Результат 'каламбур.' $var =~ s/а/о/g; # Заменить все 'а' на 'о'. Результат 'коломбур.' $var = "12 34"; # Новое значение $var =~ s/(\d\d) (\d\d)/$2 $1/; # Поменять местами числа. # Результат '34 12'.
Опции: c - дополнение "таблица1"
d - стереть найденные но не замененные символы
s - "сжать" повторяющиеся замененные символы.
Если указана опция /d таблица2 всегда интерпретируется как положено. Другими словами если таблица2 короче чем таблица1 то символ из таблицы1 интерпретируется всегда. Если таблица2 - null то все символы строки остаются не изменненные. Это удобно для подсчета количества сиволов в строке определенного класса или для сжатия повторяющихся символов например пробелов.
Пример:
$s = "hello"; # Исходная строка $s =~ tr/a-z/A-Z/; # Заменить малые буквы на большие. Результат # 'HELLO' $s = 'Hel....lo'; $s =~ tr/a-zA-z/_/c; # Заменить все не буквы на '_' # Результат 'Hel____lo' $s =~ tr/_/ /s; # Заменить '_' на ' ' и сжать. # Результат 'Hel lo' $s =~ tr/a-zA-Z /a-zA-Z/d; # Удалить все не буквы. Результат 'Hello'Если один и тот же символ несколько раз указан в таблице1 то применяется только первая замена.
Следующая команда ввода вывода выглядит как '<файл>'. Вычисление <файл> приводит к чтению строки из файла. Обратите внимание что 'файл' здесь не имя файла а указатель файла который создается функцией open(). В скалярном контексте читается одна строка вместе с символом '\n' - перевода строки, а в списковом весь файл читается в список элементы которого суть строки файла.
В случае обнаружения конца файла результат оператора не определен и воспринимается как false. Если не указана переменная результата то по умолчанию это $_. Указатель файла по умолчанию STDIN - стандартный ввод.
Пример:
while(<>) { print; }; # Прочитать и вывести весь файл STDIN
У оператора '<>' есть одна отличительная особенность. Если в командной
строке нет никаких аргументов то читается стандартный ввод, если есть аргументы
то они считаются именами файлов которые последовательно читаются.
Если в угловых скобках записана переменная то содержимое этой переменной считается именем указателя файла или ссылкой на указатель файла. Если такого указателя не существует то содержимое переменной воспринимается как шаблон имен файлов и результат - имена файлов на диске подходящих по шаблону.
Пример:
while(<*.pl>) { print;}; # То же что и ls *.pl
@files = <*>; # Массив @files содержит имена файлов в директории
но лучше сделать: @files = glob("*"); т.к. внутри скобок можно использовать
переменные.
use integer;то компилятор будет использовать целочисленную арифметику до конца текущего блока, хотя вложенный блок может это и отменить в своих пределах с помощью:
no integer;
Аргумент унарного оператора воспринимается обычно в скалярном контексте а спискового как в скалярном так и списковом причем скалярные аргументы идут первыми. В дальнешем списковые аргументы мы будем обозначать словом 'LIST' это значит что функция имеет список аргументов разделенных запятой. Аргументы функций можно заключать в круглые скобки и таким образом обозначать что "это функция" и приоритет не имеет значения иначе это списковый или унарный оператор с определенным фиксированным приоритетом. Пробел после имени функции и скобкой значения не имеет. Поэтому будьте внимательны!
Пример:
print 1 + 2 + 3; # результат 6 print(1+2)+3; # результат 3 print (1+2)+3; # опять 3 print (1+2+3); # 6Если функция возвращает результат как в скалярном так и в списковом контексте то код выхода по ошибке - скаляр c неопределенным значением или пустой список.
Запомните правило:
Не существует общего правила преобразования списка в скаляр!
Каждый оператор и функция имеют свой вид значения в скалярном котексте. Для одних это количество элементов из скалярного контекста. Для других первый элемент списка или последний или количество успешных операций. Каждый свое если вы специально не указываете.
-X указатель файла -X выражение -XПроверка файла, где 'X' одно из ниже описанных значений. Это унарный оператор с одним аргументом - либо именем файла либо указателем файла. Проверяет одно из условий. Если аргумент не указан то берется значение переменной $_. Для ключа -t STDIN.
Результат 1 если true и '' если false или неопределенное значение если файл не найден. Несмотря на странный вид это унарный оператор с соответсвующим приоритетом. Аргумент можно заключать в круглые скобки. 'X' имеет следующие значения:
-r Файл разрешен на чтение эффективным uid/gid -w на запись -//- -x исполнение -//- -o принадлежит эффективному uid -R Файл разрешен на чтение реальным uid/gid -W на запись -//- -X исполнение -//- -O принадлежит реальному uid -e файл существует -z пустой -s не пустой -f обычный текст -d директория -l символическая ссылка -p pipes (конвейер) -S socket (гнездо) -b специальное блочное устройство -c -//- символьное -//- -t указатель на уст-во tty -u установлен бит setuid -g -//- setgid -k -//- sticky -T текстовой файл -B двоичный -M "возраст" файла в днях на момент старта скрипта -A дней с последнего чтения -C дней с последней модификации inode
Если указано выражение то возвращается список:
($package, $filename, $line, $subroutine, $hasargs, $wantargs)Выражение определяет "глубину" вложенности просмотра стека вызовов.
$subroutine - имя подпрограммы $hasargs - имеющиеся аргументы $wantargs - необходимые аргументыПрименение данной функции в DB пакете возвращает более детальную информацию. К списку аргументов добавляется список @DB::args.
Пример: chmod 0666 'f1', 'f2', 'f3';
Ворзвращается результат последнего оператора в блоке или значение оператора return. Если обнаружится синтаксическая ошибка или выполнится оператор die возвращается не определенное значение а переменная $@ содержит сообщение об ошибке. Если ошибки не было то $@ содержит нулевую строку. При отсутсвии аргумента берется значение переменной $_.
($name, $passwd, $uid, $gid, $quota, $comment, $gcos, $dir, $shell) = getpw* ($name, $passwd, $gid, $members) = getgr* ($name, $aliases, $addrtype, $length, @addrs) = gethost* ($name, $aliases, $addrtype, $net) = getnet* ($name, $aliases, $proto) = getproto* ($name, $aliases, $port, $proto) = getserv*В скалярном контексте возвращается имя или что-то другое в зависимости от типа функции.
Элемент $members в вызове getgr содержит разделенные пробелом имена членов группы.
@addrs содержит IP адреса компьютеров в сети Интернет в упакованном виде. Для распаковки применяйте: ($a, $b, $c, $d) = unpack('C4',$addr[0]);
($sec,$min,$hour,$mday,$mon,$year,$wday,$yday,$isdst)=gmtime(time);
Например:
goto ('метка1', 'метка2', 'метка3')[$i];
Здесь при $i = 0 будет переход на 'метка1', $i = 1 на 'метка2' и т.д.
Третья форма (goto &подпрограмма) довольно "хитрый" метод подмены имени вызываемой подпрограммы именем текущей. Это используется в методе автозагрузки когда нужно запустить другую процедуру но под именем текущей как-будто та была вызвана раньше.
($sec,$min,$hour,$mday,$mon,$year,$wday,$yday,$isdst)=localtime(time);
Если имя файла начинается с символа '|' то имя считается системной командой на вход которой выводятся данные (поток). Имя '-' - стандартный вход (STDIN), '>-' - стандартный вывод (STDOUT). Функция возвращает true при успехе и false - неудаче.
Если имя (выражение) начинается с символов ">&" то остаток имени считается именем указателя файла который окрывается повторно. Символ '&' может стоять после '<', '>>', '+>', '+>>' и '+<'. Режим повторного открытия должен соответсвовать первому. Выражение вида "<&=N" где N -число, эквивалентно системному вызову fdopen().
Если имя "|-" или "-|" то происходит "расщепление" (fork) процесса на потомка и родителя. При этом возвращается номер процесса потомка (PID) внутри родительского процесса и 0 - внутри потомка. При этом запись/чтение в файл родительским процессом воспринимается как чтение/запись потомком. Для потомка это стандартный ввод/вывод. Родительский процесс ждет завершения потомка после закрытия потока и получает код завершения в переменной $?.
Имя файла не должно содержать пробелов как в начале так и в конце.
A - текстовая строка, добавляется пробелами.
a - текстовая строка, добавляется 0 символом.
b - битовая строка (возрастающая нумерация бит)
B - битовая строка (убывающая нумерация бит)
h - шестнадцатеричная строка ( младший байт - первый)
H - шестнадцатеричная строка (старший байт первый)
c - символ со знаком
C - символ без знака.
s - короткое целое (один байт) со знаком.
S - короткое целое без знака.
i - целое (два байта) со знаком.
I - целое без знака.
l - длинное целое (4 байта) со знаком.
L - длинное целое без знака.
n - короткое в "сетевом" формате
N - длинное в "сетевом" формате.
v - короткое в "VAX" формате.
V - длинное в "VAX" формате.
f - single float.
F - double float.
p - указатель на строку ограниченную 0.
P - указатель на структуру с фиксированной длиной.
u - упаковка uuencode.
x - нуль-байт
X - резервный байт.
@ - заполнить нулями позицию.
За каждой буквой может стоять число означающее количество повторов. Для всех типов за исключением 'a', 'A', 'b', 'B', 'h' и 'H', упаковывается максимально возможное количество значений из списка. Символ '*' после типа означает использовать оставшиеся параметры. Тип 'a' и 'A' использует только одно значение из списка и добавляет остаток поля либо нуль-символами либо пробелами (при распаковке по типу 'A' пробелы и нули отбрасываются, а по 'a' - нет). Типы 'b' и 'B' упаковывают строку в указанное число бит. Так же как и 'h' и 'H' в число ниблов (байт).
'P' - упаковывает указатель на структуру с указанной длиной. Числа с плавающей запятой (floats и double) записываются в стандартном для каждой машины формате и могут быть разными для разных типов машин. Заметьте, что Перл всегда использует двойную точность (double) поэтому упаковка и распаковка по типу 'f' приведет к потере точности. Шаблоны для распаковки и упаковки совершенно одинаковы.
Примеры:
print(pack("ccc",65,66,67)); # Результат ABC
print(pack("A4A3","ab","cdefg")); # "ab cde"
print(pack("a4a3","ab","cdefg")); # "ab\0\0cde"
Так как print работает в списковом контексте, то все элементы списка так же вычисляются в списковом контексте т.е. функции будут возвращать списковые значения. Аргументы можно заключать в круглые скобки. Если указатель файла - элемент массива то элемент нужно заключить в фигурные скобки для вычисления блока.
REF, SCALAR, ARRAY, HASH, CODE, GLOB
Если аргумент - ссылка на класс то возвращается имя класса. Функция ref() аналогична функции typeof().
Если расширение имени файла отсутсвует то по умолчанию принимается ".pm" В данной функции можно указывать путь расположения файла, а если библиотека расположена в стандартной системной области Перл то вместо require предпочтительней использовать use().
Все переменные и массива начинающиеся с этих символов обнуляются. Если выражение отсутсвует то обнуляестя поиск ?шаблон? для повторного поиска. Сбрасываются только переменные текущего модуля.
Пример:
reset 'a'; # очистить все переменные начинающиеся # буквой 'a' reset 'a-z' # все переменные с малых букв.Выражение вида: 'A-Z' употреблять не рекомендуестя т.к. обнуляются важные массивы @ARGV и @ENV.
Указанная подпрограмма возвращает значения больше, меньше или равное нулю в зависимости от двух соседних элементов списка. Имя подпрограммы может быть указано переменной. Она не должна быть рекурсивной и два сравниваемых элемента списка передаются как глобальные переменные $main::a и $main::b. Это ссылки поэтому их изменение приводит к изменению самих элементов списка.
Если выражение отсутсвует то обрабатывается содержимое переменной $_. Если шаблон отсутсвует то разделителем является пробел.
Все что подходит по шаблону считается разделителем. Если указан предел то это максимальное число разделений. Отрицательное значение предела воспринимается как неограниченно большой предел.
Если пустая строка походит под шаблон разделителя то исходное значение разделяется по символьно.
Предел удобно использовать для частичного разделения строки.
Пример:
($a, $b, $остаток) = split(/ /, "Один Два Три Четыре",3);здесь $a = 'Один', $b = 'Два' и $остаток = 'Три Четыре'
Если шаблон содержит круглые скобки то символы-разделители указанные в них вставляются в результирующий список как обычные элементы, причем вставляется символ который совпал с разделителем.
Пример:
@a = split(/([,.])/, "Один,Два.Три");здесь @a = ("Один", "," ,"Два", ".", "Три")
($dev,$ino,$mode,$nlink,$uid,$gid,$rdev,$size,$atime,$mtime,$ctime, $blksize,$blocks) = stat($filename);где
Если указан аргумент '_' то возвращается результат предыдущего вызова stat().
Функция работает следующим образом:
Для указанного скаляра (если аргумент отсутсвует берется значение переменной
$_) строится список указателей на каждый символ строки. Затем когда начинается
поиск первыми просматриваются символы которые наиболее редко встречаются
в английском языке.
Выигрыш по времени очевиден когда выполняется многократный поиск в одной и той же строке и время затраченной на индексацию окупается.
Для создания объекта ассоциативного типа необходимо определение следующих методов:
TIEHASH classname, LIST DESTROY this FETCH this, key STORE this, key, value DELETE this, key EXISTS this, key FIRSTKEY this NEXTKEY this, lastkeyОбычного массива:
TIEHASH classname, LIST DESTROY this FETCH this, key STORE this, key, value [others TBD]Скалярного типа:
TIEHASH classname, LIST DESTROY this FETCH this, key STORE this, key, value
($user, $system, $cuser, $csystem) = times;где:
Символ '%' в шаблоне означает что вы хотите получить вместо значения его контрольную сумму. По умолчанию 16 битовую.
BEGIN { require модуль; import модуль список; }
Сам модуль должен распологаться в системной области Перл файлов.
По умолчанию имя формата заголовка листа состоит из имени указателя файла и добавленной строки "_TOP". Динамически это млжно делать присваивая формат переменной $^. Количество оставшихся строк листа содержится в переменной $- и если присвоить ей 0 то произойдет смена листа. Подробно описание форматов смотри в главе "Форматы".
sub имя; # Только декларация. Определение ниже. sub имя (прототипы); # То же но с декларацией параметров. sub имя блок; # Декларация и определение. sub имя (прототипы) блок; # То же, но с парамметрами.Для определения динамичской анонимной подпрограммы можно указать:
$переменная = sub блок;Для импортирования подпрограмм из других модулей используйте:
use модуль qw(подпрограмма1 подпрограмма2);Вызов подпрограммы:
имя(список параметров); # символ '&' можно не указывать. имя список; # Если подпрогрмма уже декларирована. &имя; # Параметры в @_Все параметры передаются подпрограмме как массив @_. Соответсвенно $_[0] - первый параметр, $_[1] - второй и т.д. Массив @_ - локальный, но он содержит адреса параметров, поэтому можно изменять значение параметров.
Возвращаемое значение подпрограммы - результат последнего оператора. Это может быть как скаляр так и массив. Можно принудительно возвращать результат используя функцию return().
Подпрограмму можно вызвать используя префикс '&' перед именем подпрограммы. Если подпрограмма предварительно продекларирована, то префикс и скобки можно опустить.
my() декларирует private переменные в пределах текущей подпрограммы, блока, функции eval() или do/require/use файлов. Private переменные аналогичны auto переменным в С.
Пример:
# Программа вычисления факториала.
print fact(3); # вычислить факториал 3*2*1
sub fact # Определяем подпрограмму.
{ my $m; # private переменная но не local !
$m = $_[0];
return 1 if $m <= 1;
return($m * fact($m -1));
}
Можно указывать начальные значения private переменных как:
my(список) = выражение;Так для вышеприведенного примера лучше было написать:
my($m) = $_[0];
| Декларация | Пример вызова |
|---|---|
| sub mylink($$) | mylink $old, $new |
| sub myvec($$$) | myvec $var, $offset, 1 |
| sub myindex($$;$) | myindex &getstring, "substr" |
| sub myreverse(@) | myreverse $a, $b, $c |
| sub myjoin($@) | myjoin ":",$a,$b,$c |
| sub mypop(\@) | mypop @array |
| sub mysplice(\@$$@) | mysplice @array, @array, 0, @pushme |
| sub mykeys(\%) | mykeys %{$hashref} |
| sub myopen(*;$) | myopen HANDLE, $name |
| sub mypipe(**) | mypipe READHANDLE, WRITEHANDLE |
| sub mygrep(&@) | mygrep { /foo/ } $a, $b, $c |
| sub myrand($) | myrand 42 |
| sub mytime() | mytime |
Здесь:
| \'символ' | параметр с типом 'символ' |
| '@' или '%' | все оставшиеся параметры как список |
| '$' | скаляр |
| '&' | безымянная подпрограмма |
| '*' | ссылка на таблицу имен |
| ';' | разграничитель обязательных и не обязательных параметров |
Для скаляров употряблять '*' не имеет смысла т.к. они и так передаются ссылкой и вы можете изменять значение параметра изменяя например переменную $_[0].
use subs 'функция1', 'функция2' ....;и далее в модуле определить сами функции.
packages имя_модуля;Конец модуля это конец блока или файла. Головной модуль имеет по умолчанию имя main. На имя внутри модуля можно ссылаться добавляя '::' после имени модуля.
Например:
$main::var1 - переменная в головном модуле ::var1 - то же самое. Имя main можно опускать $модуль1::var1 - переменная в модуле 'модуль1' $модуль1::модуль2::var1 - Модуль2 содержится в модуле 1Только идентификаторы начинающиеся с буквы или символа '_' хранятся в пространтсве имен текущего модуля. Остальные хранятся в пространстве головного модуля main.
Кроме этого имена STDIN, STDOUT, STDERR, ARGV, ARGVOUT, ENV, INC и SIG так же хранятся в головном модуле.
Например:
*pi = \3.14159;Здесь переменная $pi - это константа пи которую уже нельзя изменить.
Конструктор BEGIN выполняется сразу как только возможно, т.е. как только он определен даже не завершая дальнейший разбор программы. Можно указать несколько блоков BEGIN. Они будут выполняться один за другим в порядке определения.
Деструктор END выполняется последним как только возможно, т.е. при завершении работы интерпрератора. Можно указать несолько блоков END при этом они будут выполняться в обратном определению порядке.
package имя_модуля; # Такое же как и имя этого файла без
# расширения '.pm'
require Exporter; # Обязательная строка для экспорта имен
@ISA = qw(Exporter); # -//-
@EXPORT = qw(func1 func2) # Перечисляем имена функций.
# Внимание ! нет запятой!
@EXPORT_OK = qw( $переменная @массив ); # Указать публичные
# переменные, массивы и т.д. если необходимо
{ # Начало блока модуля
.....
sub func1
........
sub func2
........
1;
}
Данный файл с расширением ".pm" должен храниться в одной из библиотечных
директорий Перл. Они перечислены в массиве @INC одно из них обычно "/usr/local/lib/perl/".
В головной программе вы указываете:
use имя_модуля;и вам становятся доступны имена подпрограмм данного модуля.
use имя;когда хотят включить действие и
no имя;когда выключить.
В стандартный набор входят следующие pragma:
| diagnostics | Включить режим расширенной диагностики |
| integer | Использовать целочисленную арифметику |
| less | Режим минимальной загрузки компилятора |
| overload | Режим переопределения операторов |
| sigtrap | Режим слежения за прерываниями |
| strict | Режим ограниченного использования "опасных" операторов |
| subs | Режим обязательного декларирования подпрограмм |
| AnyDBM_File | Возможность работы с разными типами баз данных |
| AutoLoader | Загрузка в память функций только во время вызова |
| AutoSplit | Разделить модуль для автозагрузки |
| Benchmark | Анализ скорости исполнения программы |
| Carp | Предупреждения об ошибках |
| Config | Доступ к конфигурации Перл |
| Cwd | Получить имя текущей рабочей директории |
| DB_File | Работа с базой данных формата Berkley DB |
| Devel::SelfStubber | Режим отладки автозагрузки |
| DynaLoader | Динамическая загрузка библиотек C |
| English | Использовать длинные имена встроенных переменных |
| Env | Импортировать имена переменных окружения |
| Exporter | Обеспечивает экспорт/импорт для модулей |
| ExtUtils::LibList | Определяет используемые библиотеки |
| ExtUtils::MakeMaker | Создает файл проекта Makefile |
| ExtUtils::Manifest | Программы для создания и проверки файла MANIFEST |
| ExtUtils::Mkbootstrap | Применение файла начальной загрузки для DynaLoader |
| Fcntl | Определения как и в С Fcntl.h |
| File::Basename | Синтаксический разбор спецификации файла |
| File::CheckTree | Быстрый проход по директориям диска |
| File::Find | Быстрый поиск файлов по директориям |
| FileHandle | Обеспечивает объектный метод доступа к указателям файлов |
| File::Path | Создание/удаление директорий |
| Getopt::Long | Расширенная обработка опций |
| Getopt::Std | Стандартная обработка опций |
| I18N::Collate | Сравнение символов локалбной кодировки |
| IPC::Open2 | Межпроцессорный обмен по чтению и записи |
| IPC::Open3 | Межпроцессорный обмен по чтению, записи, и обрабоки ошибок |
| Net::Ping | Тест доступа к хосту |
| POSIX | Стандартный интерфейс по IEEE Std 1003.1 |
| SelfLoader | Загрузка функций только по вызову |
| Socket | Определение структур и констант как и в С socket.h |
| Test::Harness | Стандартный тест с статистикой |
| Text::Abbrev | Создание таблицы сокращений по списку |
Подробное описание каждой библиотеки записано в самом файле.
С помощью оператора format вы описываете заголовки, размеры полей, указываете положение данных на листе в удобной текстовой форме. Затем выполняете команду write(файл) которая выводит отформатированные данные в указанный файл.
Оператор формат имее следующий синтаксис:
format имя = FORMLIST .Обратите внимание на то, что описание формата идет после строки format и заканчивается символом '.' в начале строки. Здесь 'имя' - это имя формата, такое же как и имя указателя выходного файла. Если 'имя' отсутсвует то значение по умолчанию - STDOUT.
FORMLIST - это строки формата. Они бывают трех типов:
В описательной строке указывается только положение и вид выводимых данных, но не имена полей и переменных. Для этого предназначена следующая строка аргументов которая следует всегда после описателя и содержит имена переменных или целые выражения в порядке указанном описателем.
Размер и вид поля в описателе обозначается следующими символами:
">>>>" - выровнить значение по правому краю. "<<<<" - выровнить значение по левому краю. "||||" - выровнить значение по центру. "####.###" - формат числа с точкой. "@*" - многострочная строка. Данные выводятся в колонку.Размер поля равен количеству указанных символов.
Символ '^' в начале поля имеет специальное значение. Так: "^####" - пусто если переменная не определена.
Для строчного скаляра: "^<<<<<" - Выводится сколько возможно символов, а значение переменной меняется на остаток вывод которого можно продолжить на следующих строках которые могут иметь свои поля.
Пример:
#!/usr/local/bin/perl # # Программа печати пригласительного билета # $кому = "Чапаеву Василию Ивановичу"; $от_кого = "Компания МММ"; $адрес = "Москва, ул. Петровка, д 38"; $текст = "Уважаемый Василий Иванович! Компания МММ имеет честь пригласить Вас и Ваших близких на презентацию наших новых хромовых сапог, сделанных на уровне мировых стандартов качества и дизайна."; format STDOUT = П Р И Г Л А С И Т Е Л Ь Н Ы Й Б И Л Е Т ---------------------------------------------------------------------- Кому: @<<<<<<<<<<<<<<<<<<<<<<<<<< | ^||||||||||||||||||||||||||||||| $кому, $текст | ^||||||||||||||||||||||||||||||| $текст От кого: @<<<<<<<<<<<<<<<<<<<<<<< | ^||||||||||||||||||||||||||||||| $от_кого, $текст | ^||||||||||||||||||||||||||||||| $текст Адрес:@<<<<<<<<<<<<<<<<<<<<<<<<<< | ^||||||||||||||||||||||||||||||| $адрес, $текст | ^||||||||||||||||||||||||||||||| $текст | ^||||||||||||||||||||||||||||||| $текст | ^||||||||||||||||||||||||||||||| $текст ---------------------------------------------------------------------- Отпечатано в типографии ИТУ 38 . write(); # Вывод данных. exit 0; # Конец программыРезультат:
П Р И Г Л А С И Т Е Л Ь Н Ы Й Б И Л Е Т ---------------------------------------------------------------------- Кому: Чапаеву Василию Ивановичу | Уважаемый Василий Иванович! | Компания МММ имеет честь От кого: Компания МММ | пригласить Вас и Ваших близких | на презентацию наших новых Адрес:Москва, ул. Петровка, д 38 | хромовых сапог, сделанных на | уровне мировых стандартов | качества и дизайна. | ---------------------------------------------------------------------- Отпечатано в типографии ИТУ 38Специальные переменные:
| $~ | построчный формат содержимого |
| $^ | формат заголовка листа |
| $% | номер листа |
| $= | строк в листе |
Если вы хотите использовать одни и те же форматы для разных файлов, то самый простой путь:
use FileHandle; # Указать в начале программы format_name файл имя_формата; # Формат содержимого листа format_top_name файл имя_формата; # Формат заголовка листа write(файл); # вывод данныхЗдесь под словом 'файл' имеется ввиду указатель файла, полученный командой open().
Если вам нужно в теле листа выводить разного рода форматы (например
заголовки групп или отбивку листа) то применяйте format_name.
Команды отладчика.
| h | Получить справку по командам |
| T | Просмотреть стек программы |
| s | Выполнить одну команду и остановиться |
| n | Выполнить подпрограмму и остановиться |
| r | Выполнить текущую подпрограмму и остановиться |
| c | Продолжить выполнение до сдедующей точки остановки |
| c номер | Продолжить выполнение до строки с данным номером |
| <CR> | Повторить последнию команду n или s |
| l min+incr | Вывести incr+1 строк программы начиная со строки min |
| l min-max | Вывести строки начиная с min до max |
| l номер | Вывести строку с указанным номером |
| l | Вывести следующий экран строк |
| - | Вывести предыдущий экран строк |
| w строк | Вывести экран строк. Текущая в середине |
| l подпрограмма | Вывести строки указанной подпрограммы |
| /шаблон/ | Найти строку в тексте программы |
| ?шаблон? | Обратный поиск строки в тексте программы |
| L | Вывести строки с точками останова и активами |
| S | Вывести имена всех подпрограмм |
| t | Включить или выключить трассировку |
| b строка [ условие] | Установить точку остановки |
| b подпрограмма [ условие ] | Установить точку остановки в начале указанной подпрограммы и если указано при данном условии |
| d | Убрать точку остановки |
| D | Убрать все точки остановки |
| a строка команда | Установить актив (команду которая выполнится вместе с указанной строкой. "команда" - обычныая команда Перл |
| A | Стереть все активы |
| < команда | Выполнять команду перед каждой остановкой |
| > команда | Выполнить команду после остановки отладчика |
| V модуль [имена] | Вывести значение всех или указанных имен в модуле. Внимание! Символ '$' не вводится |
| X [имена] | То же что и V , но только для текущего модуля |
| ! номер | Выполнить одну строку программ |
| ! -номер | Выполнить одну команду с номером предшествующим текущей строке |
| H - n | Вывести n последних выполненных команд |
| q или ^D | Выход из программы |
| команда | Выполнить команду Перл |
| p выражение | Вывести значение выражения |
Конструктор BEGIN не отслеживается отладчиком, но можно в теле конструктора указать:
$DB::single =1;и отладчик остановится. Данная команда не вызовет ошибку при работе без отладчика.