Oracle для профессионалов

         

Сервер


Трудно решить, с какого компонента сервера начать описание. Процессы используют область SGA, поэтому рассматривать SGA до процессов не имеет смысла. С другой стороны, при описании процессов и их функционирования придется ссылаться на компоненты SGA. Они тесно взаимосвязаны. С файлами работают процессы, и их нет смысла описывать, пока не объяснено, что делают процессы. Ниже определены некоторые термины и сделан общий обзор сервера Oracle, после чего подробно рассматриваются отдельные компоненты.

Два термина в контексте Oracle вызывают большую путаницу. Речь идет о терминах "база данных" и "экземпляр". В соответствии с принятой в Oracle терминологией, эти понятия определяются так:

  • база данных - набор физических файлов операционной системы;
  • экземпляр - набор процессов Oracle и область SGA.
  • Эти два термина иногда взаимозаменяемы, но представляют принципиально разные концепции. Взаимосвязь между ними такова, что база данных может быть смонтирована и открыта в нескольких экземплярах. Экземпляр может смонтировать и открыть только одну базу данных в каждый момент времени. Не обязательно отрывать и монтировать одну и ту же базу данных при каждом запуске экземпляра.

    Стало еще непонятнее? Вот ряд примеров, которые помогут прояснить ситуацию. Экземпляр — это набор процессов операционной системы и используемая ими память. Все эти процессы могут работать с базой данных, которая представляет собой просто набор файлов (файлов данных, временных файлов, файлов журнала повторного выполнения, управляющих файлов). В каждый момент времени с экземпляром связан только один набор файлов. В большинстве случаев обратное утверждение тоже верно; с базой данных работает только один экземпляр. В случае же использования параллельного сервера Oracle (Oracle Parallel Server — OPS), опции Oracle, позволяющей серверу функционировать на нескольких компьютерах в кластерной среде, одна и та же база данных может быть одновременно смонтирована и открыта несколькими экземплярами. Это делает возможным доступ к базе данных одновременно с нескольких компьютеров. Oracle Parallel Server позволяет создавать системы с высокой доступностью данных и, при условии правильной реализации, очень масштабируемые. Рассмотрение опции OPS здесь не предусмотрено, поскольку для описания особенностей ее реализации потребовалась бы отдельная книга.


    Итак, в большинстве случаев между базой данных и экземпляром имеется отношение один к одному. Это, вероятно, и является причиной путаницы при использовании этих терминов. По опыту большинства пользователей, база данных — это экземпляр, а экземпляр — это база данных.

    Во многих тестовых средах это, однако, не так. На моем диске, например, может быть пять отдельных баз данных. На тестовой машине СУБД Oracle установлена в одном экземпляре. В каждый момент времени работает только один экземпляр, но обращаться он может к разным базам данных, в зависимости от задач, которые я решаю. Создав несколько конфигурационных файлов, я могу монтировать и открывать любую из этих баз данных. В данном случае у меня один "экземпляр", но несколько баз данных, лишь одна из которых доступна в каждый момент времени.

    Итак, теперь под термином "экземпляр" мы будем понимать процессы и память сервера Oracle. Термин "база данных" означает физические файлы, в которых находятся данные. База данных может быть доступна многим экземплярам, но экземпляр в каждый момент времени обеспечивает доступ только к одной базе данных.

    Теперь можно приступать к рассмотрению абстрактной схемы СУБД Oracle.

    Упрощенно, СУБД Oracle включает большую область памяти — SGA, — содержащую внутренние структуры данных, доступ к которым необходим всем процессам для кеширования данных с диска, кеширования данных повторного выполнения перед записью на диск, хранения планов выполнения разобранных операторов SQL и т.д. Имеется также набор процессов, подключенных к этой области SGA, причем механизм подключения в каждой операционной системе другой. В среде UNIX процессы физически подключаются к большому сегменту разделяемой памяти — выделенному ОС фрагменту памяти, к которому может одновременно обращаться несколько процессов. В ОС Windows для выделения памяти процессы используют библиотечную функцию malloc() языка C, поскольку они сами являются потоками одного большого процесса. В СУБД Oracle также имеется набор файлов, читаемых и записываемых процессами/потоками базы данных (причем читать и записывать эти файлы имеют право только процессы Oracle). В этих файлах хранятся данные таблиц, индексов, временное пространство, журналы повторного выполнения и т.д.



    Если запустить СУБД Oracle в UNIX-системе и выполнить команду ps (для просмотра состояния процессов), можно увидеть количество работающих процессов и их имена. Например:

    $ /bin/ps -aef | grep ora816 ora816 20827 1 0 Feb 09 ? 0:00 ora_d000_ora816dev ora816 20821 1 0 Feb 09 ? 0:06 ora_smon_ora816dev ora816 20817 1 0 Feb 09 ? 0:57 ora_lgwr_ora816dev ora816 20813 1 0 Feb 09 ? 0:00 ora_pmon_ora816dev ora816 20819 1 0 Feb 09 ? 0:45 ora_ckpt_ora816dev ora816 20815 1 0 Feb 09 ? 0:27 ora_dbw0_ora816dev ora816 20825 1 0 Feb 09 ? 0:00 ora_s000_ora816dev ora816 20823 1 0 Feb 09 ? 0:00 ora_reco_ora816dev

    Я еще опишу назначение каждого из этих процессов, но часто их в совокупности называют просто фоновыми процессами Oracle. Это — постоянно работающие процессы, образующие экземпляр; они появляются при запуске СУБД и работают до тех пор, пока она не будет остановлена. Интересно отметить, что все это — процессы, а не программы. СУБД Oracle реализуется одной программой в UNIX, но программа эта многолика. Программа, которая запускалась для реализации процесса ora_lgwr_ora816dev, была использована и для запуска процесса ora_ckpt_ora816dev. Есть только один двоичный файл с именем oracle. Просто он выполняется несколько раз с разными именами. В ОС Windows с помощью программы tlist, входящей в Windows resource toolkit, можно обнаружить только один процесс — Oracle.exe. В случае NT тоже есть всего одна двоичная программа. Этот процесс создает несколько потоков, представляющих фоновые процессы Oracle. С помощью утилиты tlist (или любого из множества подобных средств) можно увидеть эти потоки:

    C:\Documents and Settings\Thomas Kyte\Desktop>tlist 1072 1072 ORACLE.EXE CWD: C:\oracle\DATABASE\ CmdLine: c:\oracle\bin\ORACLE.EXE TKYTE816 VirtualSize: 144780 KB PeakVirtualSize: 154616 KB WorkingSetSize: 69424 KB PeakWorkingSetSize: 71208 KB NumberOfThreads: 11 0 Win32StartAddr:0x00000000 LastErr:0x00000000 State:Initialized 5 Win32StartAddr:0x00000000 LastErr:0x00000000 State:Initialized 5 Win32StartAddr:0x00000000 LastErr:0x00000000 State:Initialized 5 Win32StartAddr:0x00000000 LastErr:0x00000000 State:Initialized 5 Win32StartAddr:0x00000000 LastErr:0x00000000 State:Initialized 5 Win32StartAddr:0x00000000 LastErr:0x00000000 State:Initialized 5 Win32StartAddr:0x00000000 LastErr:0x00000000 State:Initialized 5 Win32StartAddr:0x00000000 LastErr:0x00000000 State:Initialized 5 Win32StartAddr:0x00000000 LastErr:0x00000000 State:Initialized 5 Win32StartAddr:0x00000000 LastErr:0x00000000 State:Initialized 5 Win32StartAddr:0x00000000 LastErr:0x00000000 State:Initialized 0.0.0.0 shp 0x00400000 ORACLE.EXE 5.0.2163.1 shp 0x77f80000 ntdll.dll 0.0.0.0 shp 0x60400000 oraclient8.dll 0.0.0.0 shp 0x60600000 oracore8.dll 0.0.0.0 shp 0x60800000 oranls8.dll ...





    В данном случае имеется 11 потоков, выполняющихся в рамках одного процесса Oracle. Если подключиться к базе данных, количество потоков увеличится до 12. В ОС UNIX к существующим процессам oracle просто добавился бы еще один. Теперь можно представить следующую схему. Предыдущая схема представляла концептуальный вид СУБД Oracle сразу после запуска. Теперь, если подключиться к СУБД Oracle в наиболее типичной конфигурации, схема будет выглядеть примерно так:

    ...

    Обычно СУБД Oracle при подключении пользователя создает новый процесс. Это принято называть конфигурацией выделенного сервера, поскольку на все время сеанса ему выделяется отдельный серверный процесс. Сеансы и выделенные серверы находятся в отношении один к одному. Клиентский процесс (любая программа, пытающаяся подключиться к СУБД) будет непосредственно взаимодействовать с соответствующим выделенным сервером по сети, например, через сокет TCP/IP. Именно этот сервер будет получать и выполнять SQL-операторы. Он будет читать файлы данных, а также искать необходимые данные в кеше. Он будет выполнять операторы UPDATE и PL/SQL-код. Единственное его назначение — отвечать на получаемые SQL-запросы.

    СУБД Oracle также может работать в режиме многопоточного сервера

    (multi-threaded server — MTS), в котором при подключении не создается дополнительный поток или процесс UNIX. В режиме MTS СУБД Oracle использует пул "разделяемых серверов" для поддержки большого количества пользователей. Разделяемые серверы — это просто механизм организации пула подключений. Вместо запуска 10000 выделенных серверов (это действительно много, если речь идет о процессах или потоках) для 10000 сеансов режим MTS позволяет обслуживать их с помощью гораздо меньшего количества разделяемых серверов, которые (как следует из названия) будут совместно использоваться всеми сеансами. Это позволяет СУБД Oracle поддерживать намного больше сеансов, чем в режиме выделенного сервера. Машина, на которой работает сервер, может не справиться с поддержкой 10000 процессов, но управление 100 или 1000 процессами для нее вполне реально. В режиме MTS разделяемые серверные процессы обычно запускаются сразу при старте СУБД и отображаются в списке, выдаваемом командой ps (в представленных выше результатах выполнения команды ps процесс ora_s000_ora816dev



    представляет собой разделяемый серверный процесс).

    Принципиальное отличие режима MTS от режима выделенного сервера состоит в том, что клиентский процесс, подключившийся к СУБД, никогда не взаимодействует непосредственно с разделяемым сервером, как это происходит в случае выделенного сервера. Он не может взаимодействовать с разделяемым сервером, так как соответствующий процесс используется совместно. Чтобы обеспечить совместное использование этих процессов, необходим другой механизм взаимодействия. Для этого в СУБД Oracle используется процесс (или набор процессов), которые называют диспетчерами. Клиентский процесс взаимодействует по сети с процессом-диспетчером. Процесс-диспетчер помещает запрос клиента в очередь запросов в SGA (это одно из многих назначений области SGA). Первый же свободный разделяемый сервер выберет и обработает этот запрос (например, запрос может иметь вид UPDATE T SET X = X+5 WHERE Y = 2). По завершении выполнения команды разделяемый сервер поместит ответ в очередь ответов. Процесс-диспетчер следит за очередью и немедленно передает полученный результат клиенту. Концептуально поток информации в режиме MTS выглядит следующим образом:

    ...

    Клиентское подключение посылает запрос диспетчеру. Диспетчер поместит этот запрос в очередь запросов в области SGA (1). Первый свободный разделяемый сервер выберет этот запрос (2) из очереди и обработает его. Когда разделяемый сервер закончит выполнение, ответ (коды возврата, данные и т.д.) помещается в очередь ответов (3), после чего выбирается диспетчером (4) и возвращается клиенту.

    С точки зрения разработчика нет никакой разницы между подключением к серверу в режиме MTS и подключением к выделенному серверу. Теперь, когда стало понятно, как происходит подключение к выделенному и разделяемому серверу, возникают вопросы: а как вообще подключиться; как запускается выделенный сервер и как связываться с процессом-диспетчером? Ответы зависят от платформы, но в принципе все происходит так, как описано ниже.

    Мы рассмотрим наиболее общий случай: запрос на подключение по сети с использованием протоколов TCP/IP. В этом случае клиент находится на одной машине, а сервер — на другой, причем эти машины связаны сетью на базе семейства протоколов TCP/IP. Все начинается с клиента. Он посылает запрос клиентскому ПО Oracle на подключение к базе данных. Например, выполняется команда:



    C:\> sqlplus scott/tiger@ora816.us.oracle.com

    Здесь клиентом является утилита SQL*Plus. scott/tiger — имя пользователя и пароль, а ora816.us.oracle.com — имя службы TNS. TNS — сокращение от Transparent Network Substrate (прозрачная сетевая среда), которое обозначает "базовое" программное обеспечение, встроенное в клиент Oracle и обеспечивающее удаленное подключение (двухточечное взаимодействие клиента и сервера). Строка подключения TNS указывает программному обеспечению Oracle, как подключаться к удаленной базе данных. В общем случае клиентское программное обеспечение обращается к файлу TNSNAMES.ORA. Это обычный текстовый файл конфигурации, обычно находящийся в каталоге [ORACLE_HOME]\network\admin и содержащий записи вида:

    ORA816.US.ORACLE.COM = (DESCRIPTION = (ADDRESS_LIST = (ADDRESS = (PROTOCOL = TCP)(HOST = aria.us.oracle.com)(PORT = 1521)) ) (CONNECT_DATA = (ORACLE_SID = ora816) ) )

    Именно эти параметры конфигурации позволяют клиентскому ПО Oracle преобразовать строку ora816.us.oracle.com в необходимые для подключения данные: имя хоста; порт на этом хосте, прослушиваемый процессом, который принимает подключения; идентификатор SID (Site IDentifier) базы данных на хосте, к которой необходимо подключиться, и т.д. Эта строка, ora816.us.oracle.com, может преобразовываться в необходимые данные и по-другому. Например, она может преобразовываться с помощью службы Oracle Names — распределенного сервера имен для СУБД, аналогичного по назначению службе DNS, используемой для преобразования имен хостов в IP-адреса. Однако в большинстве небольших и средних серверов, где количество копий конфигурационных файлов невелико, чаще всего используется именно файл TNSNAMES.ORA.

    Теперь, когда клиентскому ПО известно, куда подключаться, оно открывает соединение через сокет TCP/IP к порту 1521 машины aria.us.oracle.com. Если администратор базы данных соответствующего сервера настроил службу Net8 и запустил процесс прослушивания, это подключение может быть принято. В сетевой среде на сервере работает процесс TNS Listener. Это процесс прослушивания, обеспечивающий физическое подключение к базе данных. Получив запрос на подключение, он проверяет его, используя собственные файлы конфигурации, и либо отвечает отказом (например, не существует запрашиваемой базы данных или IP-адрес подключающегося содержится в списке тех, кому не разрешено подключение к хосту), либо обеспечивает подключение клиента.



    При подключении к выделенному серверу процесс прослушивания автоматически запустит выделенный сервер. В ОС UNIX это делается с помощью системных вызовов fork() и exec() (единственный способ создать новый процесс после инициализации ОС UNIX — использовать системный вызов fork()). Теперь мы физически подключены к базе данных. В Windows процесс прослушивания требует от серверного процесса создания нового потока для подключения. После создания этого потока клиент "перенаправляется" на него, и тем самым обеспечивается физическое подключение. В случае ОС UNIX это можно представить следующей схемой:

    ...

    В режиме MTS процесс прослушивания работает иначе. Ему известно, какие процессы-диспетчеры работают в составе экземпляра. При получении запроса на подключение процесс прослушивания выбирает процесс-диспетчер из пула доступных диспетчеров. Затем он посылает клиенту информацию, позволяющую подключиться к процессу-диспетчеру. Это необходимо, поскольку процесс прослушивания работает на известном порту соответствующего хоста, а вот диспетчеры будут принимать подключения через произвольно выделенные порты. Процессу прослушивания известны эти выделенные порты, поэтому он автоматически выбирает свободный диспетчер. Затем клиент отключается от процесса прослушивания и подключается непосредственно к диспетчеру. В результате устанавливается физическое соединение с СУБД. Графически это можно представить так:

    ...

    Итак, обзор архитектуры Oracle закончен. Мы описали, что такое экземпляр Oracle, что такое база данных и как можно подключиться к базе данных через выделенный и разделяемый сервер. На следующей схеме показано взаимодействие с сервером Oracle клиента, подключенного к разделяемому серверу, и клиента, работающего с выделенным серверным процессом. Один экземпляр Oracle может поддерживать оба типа подключений одновременно:

    ...

    Теперь подробно рассмотрим процессы, образующие сервер, их назначение и взаимодействие друг с другом, а также содержимое области SGA и назначение ее компонентов. Но начнем мы с описания различных типов файлов, которые сервер Oracle использует для управления данными.


    Содержание раздела