Лекция 1. Устройство Интернет.

Основные понятия

Адресация в Интернет

Каждому узлу в сети Интернет присвоен свой адрес, выглядит он так:

xxx.xxx.xxx.xxx,

где xxx - числа от 0 до 255. Иногда эти числа называют октеты (octet), поскольку на каждое из отводится по 8 бит (1 байт)

IP-адрес (Internet Protocol Address)
уникальный числовой адрес, однозначно идентифицирующий узел сети, группу узлов или сеть.

Пример IP-адреса: 193.232.70.36

Если вы подключаете свой компьютер к Интернету время от времени, например, по телефону (это называется сеансовым подключением), то IP-адрес вам выделяется только на время работы. Присвоение адреса на время сеанса связи называется динамическим распределением IP-адресов. Статические адреса, как правило, закреплены за теми узлами Интернета, которые должны присутствовать в сети постоянно.

Были определены три класса сетей (A, B, и C), чтобы учесть разные масштабы конфигураций. В класс A входят большие сети общенационального масштаба (малое количество сетей с большим числом компьютеров). Класс B предназначен для сетей регионального масштаба, класс C - для локальных сетей (большое количество сетей с относительно малым числом компьютеров).

Зарезервированные IP-адреса.

127.0.0.1
используется для создания адреса обратной связи (петли). С помощью этого адреса компьютер может обратиться по сети сам к себе (например, в случае когда программа-клиент и программа-сервер находятся на одном и том же компьютере).
10.0.0.0; 172.16.0.0 - 172.31.0.0; 192.168.0.0
для использования внутри локальных сетей.

В настоящее время Интернет столкнулся с реальной угрозой нехватки адресов. Поэтому была разработана и внедряется новая версия IP – IP v6, позволяющая существенно расширить адресное пространство.

Существуют сети, использующие иные протоколы (например, FidoNet). Пользователи таких сетей также могут подключаться к Интернет, но не напрямую, а через шлюзы.

Шлюз
компьютер или программа, предназначенные для перевода данных из формата одной сети в формат, принятый в другой сети.

Доменные имена.

Домен (область, зона)
виртуальная зона, к которой относится тот или иной компьютер.

Доменное имя представляет адрес любого ресурса в Интернете как последовательность слов. Такой адрес легче запомнить. Адреса Интернет-ресурсов, представленные таким образом, называют URL – Uniform Resource Locator, универсальный указатель ресурса.

Между доменными адресами и IP-адресами установлены однозначные соответствия. Например, компьютер с IP адресом 209.87.181.103 имеет доменное имя www.cdrom.com. После ввода URL следует обращение к «справочному» компьютеру, чтобы определить, какой IP-адрес «скрывается» за введенным вами доменным именем. Этот «справочный» компьютер называется сервером DNS. DNS (Domain Name System) – служба каталогизации доменных имен. Таблица соответствия доменных имен IP-адресам размещается на многих DNS-серверах., которые последовательно опрашиваются при поиске того или иного значения.

В отличие от IP-адресов доменное имя читается справа налево.

Самый правый сегмент доменного имени представляет собой домен верхнего уровня.

Домены верхнего уровня различаются по географическому признаку, или по характеру деятельности:

Географические домены верхнего уровня

  • ru - Россия
  • by - Белоруссия
  • ua - Украина
  • kz - Казахстан
  • uk - Великобритания
  • de - Германия
  • fr - Франция
  • it - Италия
  • pl - Польша
  • сz – Чехия
  • сa - Канада
  • fi - Финляндия
  • us - США (редко)

Организационные домены верхнего уровня.

  • gov- правительственные организации
  • mil - военные организации
  • com - коммерческие организации
  • еdu - образовательные учреждения
  • net - сетевые организации
  • org - общественные организации
  • int – международные организации

Домены бывают нескольких уровней. Например, в доменном имениwww.cdrom.com, "com" - домен первого уровня, "cdrom" - второго уровня, "www" - третьего уровня.

Тот, кто владеет доменом определенного уровня, может создавать сколько угодно доменов более низких уровней. Домены первого уровня не подлежат продаже. Они определяются организацией по развитию Интернет. Домены второго во многих странах продаются или же на них передается право администрирования на коммерческой основе. Это называется делегированием домена.

URL

Точное местонахождение документа в сети Интернет однозначно определяется адресом сервера, номером порта, именем директории и именем файла с этим документом. Для успешной загрузки требуемого документа с сервера программе просмотра также нужно указать протокол, используемый этим сервером. Это связано с тем, что кроме WWW-серверов, программы просмотра могут обращаться к FTP-серверам, серверам телеконференций, серверам электронной почты и некоторым другим типам серверов. Комбинация протокола, адреса сервера, номера порта, имени директории и имени файла получила название Uniform Resource Locator, или сокращенно URL.

Синтаксис URL

протокол://адрес_сервера:номер_порта/имя_директории/имя_файла

Название протокола при наборе URL в адресной строке браузера может быть пропущено, тогда по умолчанию используется протокол http. Кроме http, WWW-клиенты могут общаться c серверами, поддерживающими протоколы ftp, gopher и некоторыми другими. Название протокола отделяется от остальной части URL двоеточием. В названии протокола прописные латинские буквы и соответствующие им строчные буквы эквивалентны.

В качестве адреса сервера может использоваться как доменное имя, так и IP- адрес.

Номер порта выражается целым положительным числом и отделяется от адреса двоеточием. Если номер порта WWW-сервера равен 80, то в URL его можно не указывать.

В связи с тем, что подавляющее большинство серверов WWW работает под управлением UNIX-подобных операционных систем, в URL имеют место следующие отличия от стиля Windows:

  • Не указывается имя дисковода.
  • В именах директорий и файлов прописные и строчные символы различаются. Например, Letter.txt и letter.txt являются различными файлами.
  • Имена файлов и директорий могут содержать несколько точек. Часть имени, следующая за последней встречающейся точкой, обычно называется суффиксом (suffix), или расширением (extension). Расширение, как правило, указывает на тип файла.
  • Файлы с документами, публикуемыми в WWW, часто имеют суффиксы .html или .htm. Эти суффиксы являются аббревиатурой от названия языка, на котором пишут WWW-документы, HyperText Markup Language.
  • Поддиректории разделяются не обратной косой чертой \, а прямой / Например: /usr/staff/data/
  • Если имя директории начинается с символа ~ (тильда), это означает, что это - так называемая домашняя директория (home directory) пользователя данной компьютерной системы. На компьютерах с многопользовательской операционной системой UNIX каждому пользователю присваивается имя пользователя (login name), под которым он регистрируется в системе, и выделяется собственная "домашняя" директория, предназначенная для хранения принадлежащих ему файлов. Вместо абсолютного имени домашней директории с указанием всех ее поддиректорий можно использовать имя пользователя, которому предшествует символ ~ (тильда). Например, если директория /fuji1/people/dima/ является домашней директорией пользователя с именем dima, то ее можно записывать просто как ~dima/

Обратите внимание на следующие особенности задания имен директорий и файлов в URL:

  • Директория, указанная в URL, может не совпадать с истинной директорией в файловой системе на том сервере, где находится требуемый файл.
  • Если в URL указано только имя директории, а имя файла не задано, то сервер на такой запрос вышлет файл с определенным именем, зависящим от настройки сервера, - обычно index.html или (редко) welcome.html. Если же такого файла в заданной директории нет, то большинство серверов автоматически вышлют вам список всех файлов в данной директории.Например, URL http://www.scs.uiuc.edu:80/~dima/index.html эквивалентен следующему, в котором опущен номер порта (80 - номер порта, принимаемый по умолчанию) и имя файла (данный сервер настроен так, чтобы высылать index.html): http://www.scs.uiuc.edu/~dima/
  • Обратите внимание на косую черту, которой заканчивается имя директории! Ее нельзя опускать, даже если в URL имя файла не указано.
  • применять описанные выше правила пользователю WWW практически никогда не приходится. Представьте себе, что вы просматриваете некоторый документ в WWW, и в этом документе находите гиперсвязь с интересующим вас другим документом - тогда программа просмотра по вашему желанию загрузит его автоматически, и вам даже не обязательно знать соответствующий URL. Возможен и другой вариант: вам кто-либо сообщил URL документа, который мог бы вас заинтересовать. В этом случае необходимо всего лишь ввести этот URL в программу просмотра без опечаток. О программах просмотра и работе с ними мы поговорим в следующем разделе, а этот раздел завершим списком наиболее часто встречающихся опечаток при вводе URL с клавиатуры:

Список наиболее часто встречающихся опечаток при вводе URL с клавиатуры:

  • Пробелы между символами, входящими в URL.
  • Использование обратной косой черты \ вместо прямой /.
  • Пропуск или замена символа ~ (тильда) на какой-либо другой символ.
  • Замена строчных букв на прописные и наоборот в именах директорий и файлов.
  • Замена строчной латинской буквы l на цифру 1 и наоборот, а также замена буквы o на цифру 0, латинской буквы c на русскую букву с, латинской буквы p на русскую букву р и т. п.
  • Пропуск последней косой черты, следующей за именем директории, в случае, когда в URL не указывается имя файла.