Использование технологий интеграции для предоставления данных в среде grid
Многие из описанных в этой статье технологий, которые являются полезными для интеграции информации, оказываются полезны и для предоставления данных в среде grid. Вы можете также использовать возможности детального предоставления Oracle Streams для того чтобы предоставлять информацию по одной записи за раз. Вы можете также использовать возможности типа распределенного SQL, чтобы хранить данные на своем месте, пока они не потребуются, а затем по требованию предоставлять их. Инструментальные средства перемещения больших объемов данных типа переносимых табличных пространств и Data Pump являются эффективным способом обеспечить закачку в grid-сеть больших количеств данных.
Предположим, что у вас имеется промышленная база данных, и необходимо выполнить некоторый анализ. В среде grid вы можете просто принять решение добавить узлы к промышленной базе данных RAC, чтобы обеспечить дополнительные ресурсы CPU, необходимые для анализа. Тем не менее, иногда это может оказаться невыполнимым. Возможно, есть ведомственные ограничения, которые запрещают проведение анализа по отношению к промышленной базе данных. Возможно, вы не эксплуатируете RAC, или у вас не имеется больше подходящих узлов в собственной сети и устройств SAN для распределения – но у вас действительно имеются узлы в другой сети или SAN. Используя возможности предоставления данных Oracle Database 10g, вы можете транспортировать табличные пространства, содержащие информацию, которую вы планируете анализировать, определить значения реплики Streams этих данных в другой системе и выполнить анализ этой системы.
Эта опция также полезна для того, чтобы мигрировать в grid с помощью единственной команды и без всякого простоя системы. Кроссплатформные переносимые табличные пространства позволяют переносить данные между различными платформами и операционными системами. В то время как вы перемещаете ваши данные и создаете новую базу данных в grid-среде, имеющаяся у вас база данных остается онлайновой. Как только перемещение будет выполнено, происходящие с базой данных изменения будут перехватываться и применяться к целевой базе данных. Сразу после запуска реплики, вы можете просто указать приложениям на новую базу данных в grid, и миграция будет завершена.
Иногда лучший способ совместного использования и интеграции информации состоит в том, чтобы просто обратиться к ней дистанционно, когда вы испытываете в ней необходимость. Как было описано ранее в этой статье, в Oracle имеется распределенный SQL, удаленные вызовы процедур и встроенные распределенные транзакции. Вы можете делать запросы об информации, в которой вы нуждаетесь, к другим базам данных, обновлять эту информацию, когда вы в этом нуждаетесь, и получать доступ к логике программ на других серверах. Можно обратиться к данным в других системах управления базами данных через универсальные возможности связи Oracle, или используя для этого Transparent Gateways. Можно объединить данные Oracle и данные из других систем, а также использовать Oracle Streams со шлюзами для совместного использования информации с системами от других производителей.
В grid-среде с увеличивающимся количеством данных и высоким объемом сетевого трафика, эффективный доступ к информации может стать устрашающей задачей. Производительность и масштабируемость grid зависят от эффективности, надежности и защищенности средств коммуникации. Используя новые опции высокоскоростного межузлового соединения, Oracle Database 10g обеспечивает эффективную и быструю сетевую магистраль для grid-среды, которая также поддерживает большое количество данных, передаваемых по сети. Кроме того, она снимает с серверов тяжелое бремя использования CPU для работы с сетями, и позволяет серверам иметь больше времени для выполнения того, для чего они были первоначально предназначены – выполнения прикладных программ и обслуживания данных.
Преобладающий сегодня протокол LAN и Интернета (то есть, TCP/IP) жертвует временем ожидания для достижения надежности, общности и расстояния. В среде центра обработки данных серверы приложений, являющиеся программным обеспечением промежуточного уровня, обрабатывают бизнес-логику и связываются с Web-серверами и с серверами базы данных. Интерфейсные коммуникация на входе обычно выполняются сегодня по подключениям TCP/IP, что становится тяжким бременем при использовании CPU серверов приложений, так же как и для серверов базы данных. Для некоторых конфигураций измерения показали, что на обработку стека TCP/IP расходуется до 80% циклов CPU (прим.), в результате чего не так уж много возможностей CPU остается для первоначального назначения серверов приложений – выполнять приложения, и первоначального назначения серверов базы данных – обслуживать данные.
Содержание раздела