INT FAHR;
FOR (FAHR =LOWER; FAHR <= UPPER; FAHR =FAHR + STEP)
PRINTF("%4D %6.1F\N", FAHR, (5.0/9.0)*(FAHR-32));
}
величины LOWER, UPPER и STEP являются константами и поэ-
тому они не указываются в описаниях. Символические имена
обычно пишут прописными буквами, чтобы их было легко отли-
чить от написанных строчными буквами имен переменных. отме-
тим, что в конце определения не ставится точка с запятой.
Так как подставляется вся строка, следующая за определенным
именем, то это привело бы к слишком большому числу точек с
запятой в операторе FOR .
1.5. Набор полезных программ
Теперь мы собираемся рассмотреть семейство родственных
программ, предназначенных для выполнения простых операций
над символьными данными. В дальнейшем вы обнаружите, что
многие программы являются просто расширенными версиями тех
прототипов, которые мы здесь обсуждаем.
1.5.1. Ввод и вывод символов
Стандартная библиотека включает функции для чтения и за-
писи по одному символу за один раз. функция GETCHAR() извле-
кает следующий вводимый символ каждый раз, как к ней обраща-
ются, и возвращает этот символ в качестве своего значения.
Это значит, что после
C = GETCHAR()
переменная 'C' содержит следующий символ из входных данных.
Символы обычно поступают с терминала, но это не должно нас
касаться до главы 7.
Функция PUTCHAR(C) является дополнением к GETCHAR : в
результате обращения
PUTCHAR (C)
содержимое переменной 'C' выдается на некоторый выходной но-
ситель, обычно опять на терминал. Обращение к функциям
PUTCHAR и PRINTF могут перемежаться; выдача будет появляться
в том порядке, в котором происходят обращения.
Как и функция PRINTF , функции GETCHAR и PUTCHAR не со-
держат ничего экстраординарного. Они не входят в состав язы-
ка "C", но к ним всегда можно обратиться.
1.5.2. Копирование файла
Имея в своем распоряжении только функции GETCHAR и
PUTCHAR вы можете, не зная ничего более об операциях вво-
да-вывода, написать удивительное количество полезных прог-
рамм. Простейшим примером может служить программа посимволь-
ного копирования вводного файла в выводной. Общая схема име-
ет вид:
ввести символ
WHILE (символ не является признаком конца файла)
вывести только что прочитанный символ
ввести новый символ
программа, написанная на языке "C", выглядит следующим обра-
зом:
MAIN() /* COPY INPUT TO OUTPUT; 1ST VERSION */
{
INT C;
C = GETCHAR();
WHILE (C != EOF) {
PUTCHAR (C);
C = GETCHAR();
}
}
оператор отношения != означает "не равно".
Основная проблема заключается в том, чтобы зафиксиро-
вать конец файла ввода. Обычно, когда функция GETCHAR натал-
кивается на конец файла ввода, она возвращает значение , не
являющееся действительным символом; таким образом, программа
может установить, что файл ввода исчерпан. Единственное ос-
ложнение, являющееся значительным неудобством, заключается в
существовании двух общеупотребительных соглашений о том, ка-
кое значение фактически является признаком конца файла. Мы
отсрочим решение этого вопроса, использовав символическое
имя EOF для этого значения, каким бы оно ни было. На практи-
ке EOF будет либо -1, либо 0, так что для правильной работы
перед программой должно стоять собственно либо
#DEFINE EOF -1
либо
#DEFINE EOF 0
Использовав символическую константу EOF для представле-
ния значения, возвращаемого функцией GETCHAR при выходе на
конец файла, мы обеспечили, что только одна величина в прог-
рамме зависит от конкретного численного значения.
Мы также описали переменную 'C' как INT , а не CHAR , с
тем чтобы она могла хранить значение, возвращаемое GETCHAR .
как мы увидим в главе 2, эта величина действительно INT, так
как она должна быть в состоянии в дополнение ко всем возмож-
ным символам представлять и EOF.
Программистом, имеющим опыт работы на "C", программа
копирования была бы написана более сжато. В языке "C" любое
присваивание, такое как
C = GETCHAR()
может быть использовано в выражении; его значение - просто
значение, присваиваемое левой части. Если присваивание сим-
вола переменной 'C' поместить внутрь проверочной части опе-
ратора WHILE , то программа копирования файла запишется в
виде:
MAIN() /* COPY INPUT TO OUTPUT; 2ND VERSION */
{
INT C;
WHILE ((C = GETCHAR()) != EOF)
PUTCHAR(C);
}
Программа извлекает символ , присваивает его переменной
'C' и затем проверяет, не является ли этот символ признаком
конца файла. Если нет - выполняется тело оператора WHILE,
выводящее этот символ. Затем цикл WHILE повторяется. когда,
наконец, будет достигнут конец файла ввода, оператор WHILE
завершается, а вместе с ним заканчивается выполнение и функ-
ции MAIN .
В этой версии централизуется ввод - в программе только
одно обращение к функции GETCHAR - и ужимается программа.
Вложение присваивания в проверяемое условие - это одно из
тех мест языка "C", которое приводит к значительному сокра-
щению программ. Однако, на этом пути можно увлечься и начать
писать недоступные для понимания программы. Эту тенденцию мы
будем пытаться сдерживать.
Важно понять , что круглые скобки вокруг присваивания в
условном выражении действительно необходимы. Старшинство
операции != выше, чем операции присваивания =, а это означа-
ет, что в отсутствие круглых скобок проверка условия != бу-
дет выполнена до присваивания =. Таким образом, оператор
C = GETCHAR() != EOF
эквивалентен оператору
C = (GETCHAR() != EOF)
Это, вопреки нашему желанию, приведет к тому, что 'C'
будет принимать значение 0 или 1 в зависимости от того, на-
толкнется или нет GETCHAR на признак конца файла. Подробнее
об этом будет сказано в главе 2/.
1.5.3. Подсчет символов
Следующая программа подсчитывает число символов; она
представляет собой небольшое развитие программы копирования.
MAIN() /* COUNT CHARACTERS IN INPUT */
{
LONG NC;
NC = 0;
WHILE (GETCHAR() != EOF )
++NC;
PRINTF("%1D\N", NC);
}
Оператор
++NC;
демонстрирует новую операцию, ++, которая означает увеличе-
ние на единицу. Вы могли бы написать NC = NC + 1 , но ++NC
более кратко и зачастую более эффективно. Имеется соответст-
вующая операция -- уменьшение на единицу. Операции ++ и --
могут быть либо префиксными (++NC), либо постфиксными
(NC++); эти две формы, как будет показано в главе 2, имеют в
выражениях различные значения, но как ++NC, так и NC++ уве-
личивают NC. Пока мы будем придерживаться префиксных опера-
ций.
Программа подсчета символов накапливает их количество в
переменной типа LONG, а не INT . На PDP-11 максимальное зна-
чение равно 32767, и если описать счетчик как INT , то он
будет переполняться даже при сравнительно малом файле ввода;
на языке "C" для HONEYWELL и IBM типы LONG и INT являются
синонимами и имеют значительно больший размер. Спецификация
преобразования %1D указывает PRINTF , что соответствующий
аргумент является целым типа LONG .
Чтобы справиться с еще большими числами, вы можете ис-
пользовать тип DOUBLE / FLOAT двойной длины/. мы также ис-
пользуем оператор FOR вместо WHILE с тем, чтобы проиллюстри-
ровать другой способ записи цикла.
MAIN() /* COUNT CHARACTERS IN INPUT */
{
DOUBLE NC;
FOR (NC = 0; GETCHAR() != EOF; ++NC)
;
PRINTF("%.0F\N", NC);
}
Функция PRINTF использует спецификацию %F как для FLOAT
, так и для DOUBLE ; спецификация %.0F подавляет печать не-
существующей дробной части.
Тело оператора цикла FOR здесь пусто, так как вся рабо-
та выполняется в проверочной и реинициализационной частях.
Но грамматические правила языка "C" требуют, чтобы оператор
FOR имел тело. Изолированная точка с запятой, соответствую-
шая пустому оператору, появляется здесь, чтобы удовлетворить
этому требованию. Мы выделили ее на отдельную строку, чтобы
сделать ее более заметной.
Прежде чем мы распростимся с программой подсчета симво-
лов, отметим, что если файл ввода не содержит никаких симво-
лов, то условие в WHILE или FOR не выполнится при самом пер-
вом обращении к GETCHAR , и, следовательно , программа вы-
даст нуль, т.е. Правильный ответ. это важное замечание. од-
ним из приятных свойств операторов WHILE и FOR является то,
что они проверяют условие в начале цикла, т.е. До выполнения
тела. Если делать ничего не надо, то ничего не будет сдела-
но, даже если это означает, что тело цикла никогда не будет
выполняться. программы должны действовать разумно, когда они
обращаются с файлами типа "никаких символов". Операторы
WHILE и FOR помогают обеспечить правильное поведение прог-
рамм при граничных значениях проверяемых условий.
1.5.4. Подсчет строк
Следующая программа подсчитывает количество строк в
файле ввода. Предполагается, что строки ввода заканчиваются
символом новой строки \N, скрупулезно добавленным к каждой
выписанной строке.
MAIN() /* COUNT LINES IN INPUT */
{
INT C,NL;
NL = 0;
WHILE ((C = GETCHAR()) != EOF)
IF (C =='\N')
++NL;
PRINTF("%D\N", NL);
}
Тело WHILE теперь содержит оператор IF , который в свою
очередь управляет оператором увеличения ++NL. Оператор IF
проверяет заключенное в круглые скобки условие и, если оно
истинно, выполняет следующий за ним оператор /или группу
операторов, заключенных в фигурные скобки/. Мы опять исполь-
зовали сдвиг вправо, чтобы показать, что чем управляет.
Удвоенный знак равенства == является обозначением в
языке "C" для "равно" /аналогично .EQ. В фортране/. Этот
символ введен для того, чтобы отличать проверку на равенство
от одиночного =, используемого при присваивании. Поскольку в
типичных "C" - программах знак присваивания встречается при-
мерно в два раза чаще, чем проверка на равенство, то естест-
венно, чтобы знак оператора был вполовину короче.
Любой отдельный символ может быть записан внутри оди-
ночных кавычек, и при этом ему соответствует значение, рав-
ное численному значению этого символа в машинном наборе сим-
волов; это называется символьной константой. Так, например,
'A' - символьная константа; ее значение в наборе символов
ASCII /американский стандартный код для обмена информацией/
равно 65, внутреннему представлению символа а. Конечно, 'A'
предпочтительнее, чем 65: его смысл очевиден и он не зависит
от конкретного машинного набора символов.
Условные последовательности, используемые в символьных
строках, также занимают законное место среди символьных кон-
стант. Так в проверках и арифметических выражениях '\N'
представляет значение символа новой строки. Вы должны твердо
уяснить, что '\N' - отдельный символ, который в выражениях
эквивалентен одиночному целому; с другой стороны "\N" - это
символьная строка, которая содержит только один символ. Воп-
рос о сопоставлении строк и символов обсуждается в главе 2.
Упражнение 1-6
----------------
Напишите программу для подсчета пробелов, табуляций и
новых строк.
Упражнение 1-7
----------------
Напишите программу, которая копирует ввод на вывод, за-
меняя при этом каждую последовательность из одного или более
пробелов на один пробел.
1.5.5. Подсчет слов
Четвертая программа из нашей серии полезных программ
подсчитывает количество строк, слов и символов, используя
при этом весьма широкое определение, что словом является лю-
бая последовательность символов, не содержащая пробелов, та-
буляций или новых строк. /Это - упрощенная версия утилиты
'WC' системы 'UNIX'/
#DEFINE YES 1
#DEFINE NO 0
MAIN() /* COUNT LINES, WORDS, CHARS IN INPUT */
{
INT C, NL, NW, INWORD;
INWORD = NO;
NL = NW = NC = 0;
WHILE((C = GETCHAR()) != EOF) {
++NC;
IF (C == '\N')
++NL;
IF (C==' ' \!\! C=='\N' \!\! C=='\T')
INWORD = NO;
ELSE IF (INWORD == NO) {