Основні реляційні субди: ibm db2, oracle, ms sql server, informix. порівняння

Основні реляційні субди: ibm db2, oracle, ms sql server, informix. порівняння

По роботі довелося протягом деякого часу розумітися на СУБД IBM DB2. Т.к. система комерційна, то в інтернеті не так багато інформації російською мовою, тож вирішив описати деякі особливості роботи цієї СУБД.

Точка входу

Почнемо з вхідної точки до СУБД. У SQL SERVER кінцевою точкоює екземпляр (instance), в якому звичайно можуть бути окремі бази даних, але конфігурація та модель безпеки є єдиною для всього екземпляра. У DB2 точка входу виглядає так - екземпляр (який відповідає конкретному порту) - база даних. При цьому конфігурація є і для екземпляра, і для окремої бази даних.

Переглянути конфігурацію екземпляра можна або за допомогою db2-команди:

Database Manager Configuration

Node type = Enterprise Server Edition з компаніями та сервісними клієнтами

Database manager configuration release level = 0x0b00

CPU speed (millisec/instruction) (CPUSPEED) = 2.912790e-07
Communications bandwidth (MB/sec) (COMM_BANDWIDTH) = 1.000000e+02

max number of concurrently active databases (NUMDB) = 8
Federated Database System Support (FEDERATED) = YES
Transaction processor monitor name (TP_MON_NAME) =

Default charge-back account (DFT_ACCOUNT_STR) =

Java Development Kit installation path (JDK_PATH) = /home/db2inst1/sqllib/java/jdk32

Diagnostic error capture level (DIAGLEVEL) = 3
Notify Level (NOTIFYLEVEL) = 3
Diagnostic data directory path (DIAGPATH) = /home/db2inst1/sqllib/db2dump

Default database monitor switches
Buffer pool (DFT_MON_BUFPOOL) = OFF

Де будуть вказані параметри, їх значення та розшифровка. Можливий також скорочений варіант:

get dbm cfg

Або за допомогою запиту:

Select name, value from sysibmadm.dbmcfg

З важливих параметрівможна відмітити:

  • тип аутентифікації (AUTHENTICATION)
  • шлях за замовчуванням для створення нових баз даних (DFTDBPATH)
  • виявлення сервера по мережі (DISCOVER)
Подивитися налаштування конкретної бази можна так:

connect to sample(sample - ім'я бд)

get database manager configuration

Або приблизно таким самим запитом, як і раніше:

select name, value from sysibmadm.dbcfg

Аутентифікація

Великою відмінністю DB2 від інших СУБД є модель аутентифікації. Тут немає внутрішніх користувачів, як у SQL Server чи MySQL. Вся автентифікація проводиться зовнішніми по відношенню до СУБД засобами (плагінами, що динамічно підвантажуються) - засобами операційної системиабо зовнішніми плагінами (Kerberos, GSS API). Тип автентифікації задається у параметрі AUTHENTICATION конфігурації менеджера БД. За замовчуванням виставлено значення SERVER - ім'я користувача та пароль передається у відкритому вигляді і ця пара перевіряється на правильність засобами операційної системи. Якщо ім'я користувача та пароль вірні, то перевіряється наявність привілею CONNECT у користувача або груп, до яких він входить (в т.ч. спеціальна група PUBLIC, куди входять усі авторизовані користувачі). Дані привілеї можна переглянути в таблиці SYSCAT.DBAUTH :

select GRANTEE from SYSCAT.DBAUTH where CONNECTAUTH = "Y"

Великою помилкою при налаштуванні є включення типу аутентифікації CLIENT.У цьому випадку DB2 довіряє проведення аутентифікації клієнту, що підключається, і якщо у PUBLIC є привілей CONNECT, то будь-який користувач зможе підключитися до БД і отримає доступ до всіх даних, які є у PUBLIC. Ім'я користувача при цьому береться із операційної системи. Тобто якщо ми підключаємося через Data Studio користувачем Administrator, то будуть надані всі привілеї, які є у даного користувача. І в цьому випадку немає різниці, з якого комп'ютера було зроблено доступ. Цей типаутентифікації рекомендується включати лише тоді, коли є захищений канал між сервером та клієнтом, та інші клієнти не зможуть підключитися до СУБД.

Авторизація

Привілеї рівня конкретного екземпляра прописуються зміни менеджера БД. Це такі привілеї:

  • SYSADM
  • SYSCTRL
  • SYSMAINT
  • SYSMON
Задаються ці привілеї за допомогою вказівки групи, куди входитиме користувач. У dbmcfg це відповідно параметри SYSADM_GROUP, SYSCTRL_GROUP, SYSMAINT_GROUP та SYSMON_GROUP.

Далі є привілеї конкретної бази даних. Це такі привілеї, як доступ до бази даних (CONNECTAUTH), створення таблиць (CREATETABAUTH), створення підпрограм (EXTERNALROUTINEAUTH) тощо. Ці привілеї можна переглянути у поданні SYSCAT.DBAUTH

І нарешті привілеї доступу до конкретних даних - таблиць, підпрограм тощо. Тут все досить тривіально, але також із деякими особливостями.

Привілеї доступу до таблиць можна переглянути у поданні SYSCAT.TABAUTH. Тип виданого привілею зберігається в окремих колонках, залежно від самого привілею (SELECTAUTH, DELETEAUTH тощо). При видачі привілею за допомогою команди GRANT для привілеїв REFERENCES та UPDATE можна також вказати імена колонок, на які поширюватимуться ці привілеї. У цьому випадку інформацію про це можна переглянути у поданні SYSCAT.COLAUTH

Привілеї підпрограм (функцій, процедур та методів) можна переглянути в SYSCAT.ROUTINEAUTH. Тут не зовсім тривіально, в залежності від полів SPECIFICNAME і TYPENAME привілеї можуть бути видані на всі підпрограми заданої схеми.

Якщо читачам сподобається стаття, то готовий розповісти з приводу захисту даних у DB2 за допомогою Label-Based Access Control

СУБД IBM DB2 – результат майже 30-х дослідно-конструкторських та дослідницьких робіт фірми IBM. Останню на сьогодні версію цієї СУБД (6.х) відрізняє один з найбільш продуманих наборів засобів управління та оптимізації та механізм БД, що допускає нарощування від портативного ПК з Windows 95 до цілого кластеру великих ЕОМ S/390, що працюють під керуванням OS/390.

Пакет DB2 випускається у двох редакціях: DB2 Workgroup та DB2 Enterprise Edition. У СУБД реалізовані всі відомі за попередніми версіями DB2 новаторські технології механізму БД, такі, як розпаралелювання обробки запиту, повний набір засобів тиражування, зведені таблиці запитів для підвищення продуктивності БД, можливості об'єктно-орієнтованого конструювання баз даних та мови Java. До цього слід додати, що система DB2 оснащена порожнім набором мультимедіа-розширень, що дозволяють зберігати текст, звук та відео-фрагменти, зображення та географічні дані та маніпулювати ними. Можна казати, що з можливостям масштабування розроблена фахівцями IBM технологія кластеризації баз даних немає аналогів. Ці розширення істотно полегшують процес розробки додатків для Web, а також програм, що містять фотозображення та об'ємні текстові звіти. Система DB2 цілком конкурентоспроможна і в якості платформи для розробки додатків, оскільки існує засіб Stored Procedure Builder - автоматично перетворює оператор SQL у відповідний клас Java і включає його в структуру бази даних. У версії DB2 6.1 значно покращено функціональну сумісність з іншими СУБД: пакет дозволяє використовувати розроблену Microsoft специфікацію OLE DB, новий стандарт доступу до баз даних. Кошти адміністративного управління СУБД DB2, які у нової версіїпереписані на Java і можуть бути отримані з Web, заслуговують на найвищу оцінку.

Основними недоліками даної СУБД є відносна складність адміністрування та відсутність (поки що) реалізацій під популярні серверні ОС, наприклад LINUX.

У цій СУБД завдяки Index Smart-Guide можна здійснювати налаштування, формуючи оптимальні індекси для заданої кількості звернень, що характеризує типове навантаження на БД. DB2- єдиний пакет дозволяє генерувати зведені таблиці, що значно ефективність роботи СУБД як сховищ даних. Зведена таблиця - це тимчасова робоча область, використовувана базою даних зберігання відповідей часто запити. Ну що ж, можна сказати, що оснащена новими функціональними можливостями, а також засобами розпаралелювання та можливостями вибору практично будь-якого типу з'єднання та індексів (крім хіба що растрових індексів), модель DB2 6.1 перетворюється на найдорожчу з високопродуктивних систем. Кошти адміністративного управління цієї СУБД цілком відповідають рівню розв'язуваних завдань, крім того, вона надає виключно широкі можливості для роботи з мультимедіа-даними та для програмування (чого явно бракує системі Microsoft SQL Server).

СУБД від Informix

Останнім часом намітився перехід від реляційних СУБД до об'єктно-орієнтованих (що очевидно простежується з прикладу Oracle). Informix також дотримуючись даної концепції анонсувала нове рішення СУБД Centaur, що базується на реляційній БД Informix Dynamic Server 7.3 і об'єктно-реляційній БД Informix Universal Data Option і поєднує в собі високу швидкодію Dynamic Server при роботі з даними з універсальністю та мультимедіа функціями Univers. Ця реалізація призначена для розробки інтернет-систем. Імовірно дана СУБД матиме гнучке середовище розробки, що має нарощування, відповідне характерним для Інтернету інтенсивним навантаженням, і засобами роботи з новими типами даних, які з розвитком Web стали використовуватися повсюдно. Реалізовані в новій системізасоби Java дозволять розробникам створювати цією мовою збережені процедури, програми користувача і компоненти DataBlades, які в Informix називають замовними розширеннями бази даних.

З точки зору клієнтів Inforix, це стане великим кроком уперед, оскільки до цього часу при роботі з DataBlades вони могли користуватися лише мовою Сі та SPL, внутрішньою мовою фірми Informix для написання процедур, що зберігаються. Крім того, пакет Centaur буде оснащений вбудованими засобами обробки об'єктів ActiveX. Це дозволить, наприклад, створювати збережені процедури БД мовою Visual Basic; правда, для цього потрібно, щоб пакет Centaur виконувався в середовищі Windows NT.

Centaur буде надбудовою Informix Dynamic Server і працювати з традиційним для цього пакета форматом БД, так що в розпорядженні користувачів залишаться всі колишні функції, а модернізація системи до рівня нової версії не буде пов'язана з великими труднощами. Крім того, у пакеті Centaur будуть збережені всі можливості конструювання та програмування, завдяки яким система Informix Universal Server визнана визначним технічним досягненням. Нова система буде оснащена засобами об'єктно-орієнтованого конструювання баз даних, створення спеціалізованих таблиць та програм індексування; до її складу увійде дозволить користувачам вбудовувати у запити власні функції та не покладатися виключно на стандартні засоби SQL.

Висновки.

Розглянувши основні характеристики архітектур побудови АІС, серверних операційних систем та СУБД надалі як архітектуру АІС ми виберемо архітектуру інтернет/інтранет, як серверну ОС Linux, як СУБД Oracle 8i. У зведеній таблиці представлені порівняльні характеристики двох найбільш поширених сьогодні рішень на базі Microsoft SQL Server 7.0 (на NT) і Oracle8i (на Unix, Linux).

Microsoft SQL Server 7.0

Адміністративне управління

Графічні інструменти

Простота обслуговування

Механізм даних

Робота з кількома ЦП

Прийнятно

Функція з'єднання та вибір індексів

Одночасний доступ кількох користувачів

Обробка мультимедіа-даних

Підключення до Web

Обробка аудіо, відео, зображень

Пошук за цим текстом

Функціональна сумісність

Прийнятно

Сполучення з іншими БД

Єдина реєстрація

Робота під керуванням різних ОС

Прийнятно

Можливості програмування

Прийнятно

Тримачі процедури і тригери

Внутрішня мова програмування

Побудова баз даних

Об'єктно-орієнтовані системи

Робота з філіями

Тиражування

Розподілена обробка транзакцій

Дистанційне адміністрування

Організація сховищ даних та підготовка звітів

Засоби завантаження

Засоби аналізу

DB2 (російською мовою вимовляється «Дібі два», також поширена калька з англійської «Дібіт») - сімейство програмних продуктів в області управління інформацією компанії IBM. Найчастіше, посилаючись на DB2, мають на увазі реляційну систему управління базами даних DB2 Universal Database (DB2 UDB), яку розробляє і випускає компанія IBM .

Незважаючи на доброзичливе ставлення до операційної системи Linux, яка поширюється під ліцензією з відкритим вихідним кодом, корпорація IBM поки що не планує відкривати коди своєї СУБД DB2. Про це заявив директор центру IBM Linux Technology Джим Васко на щорічній конференції Linux Foundation Collaboration Summit, що відбулася (квітень 2011 року) у Сан-Франциско. Усередині IBM триває постійна боротьба між представниками різних підрозділів, пояснив Васко. В одних випадках вибір на користь Linux або Windows означає зниження доходів від продажу програмного забезпечення, але зростання доходів від послуг, а в інших випадках може йти про доходи від продажу обладнання. Доводиться шукати оптимальне рішення, сказав він. Перехід під контроль Oracle пакетів з відкритим кодом, що розроблялися в Sun Microsystems, створив певні проблеми для IBM, повідомив Васко. Oracle намагається переконати клієнтів обміняти обладнання IBM на власні сервери Exadata і СУБД Oracle. У 2011 році директор Linux Foundation Джим Землін очікує розвитку на базі Linux спеціалізованих високопродуктивних систем на кшталт IBM Watson і готових пристроїв, що потребують мінімального налаштування.

Реалізації

В даний час, окрім комерційних продуктів сімейства, IBM поширює також безкоштовний дистрибутив DB2 Express-C для платформ Linux (x86, x86-64, POWER), Windows (x86, x86-64), Solaris (x86-64), Mac OS X (X86-64 beta). Безкоштовна версіямає обмеження на використання для роботи СУБД не більше одного двоядерного процесора та 2 Гбайт оперативної пам'яті (загальна кількість процесорів та пам'яті в системі може бути будь-яким, але ресурси понад зазначені обмеження не будуть використовуватися СУБД).

2017: Анонс доповнень для контролю над даними

Db2 on Cloud

Оновлене рішення Db2 on Cloud є повністю керованим сервісом, доступним у IBM Cloud.

Серед характеристик технології:

  • Динамічна шкала («слайдер») для встановлення параметрів продуктивності та обсягу пам'яті - за допомогою кліку мишкою можна миттєво змінювати масштаб, збільшуючи або зменшуючи продуктивність обробки даних та необхідний обсяг оперативної пам'яті, таким же способом можна збільшити обсяг пам'яті системи зберігання інформації;
  • Веб-консоль – допомагає замовникам швидше освоїти сервіс та прискорити роботу з ним.

Загалом рішення Db2 on Cloud дозволяє уникнути трудомісткого процесу узгодження та закупівлі додаткових обчислювальних ресурсів та доповнює IBM Db2 Hosted, версію бази даних, розміщену в IBM Cloud.

Db2 on Cloud Benchmark

DB2 Analytics Accelerator

Версії

2017: JSON та HTAP

DB2 10 є першим суттєвим оновленням СУБД за останні кілька років: 10-та версія системи для z/OS, щоправда, вийшла в 2010 році, але цей реліз призначений для одночасно Linux, Unix і Windows систем.

Обидва продукти містять новий функціонал. DB2 тепер підтримує формат RDF (Resource Description Framework), а InfoSphere може взаємодіяти з розгортаннями Apache Hadoop . Серед інших покращень у DB2, зокрема, можна відзначити прискорення процесів резервного копіювання та введення-виведення.

DB2 10 також є більш гнучкою. Зокрема, адміністратори СУБД отримали інструментарій для розподілу даних для зберігання різних типів носіїв: наприклад, оперативна інформація може розміщуватися на більш швидких твердотільних накопичувачів, а менш цінні дані – на більш дешевих та повільних накопичувачах на магнітній стрічці.

Нова функція під назвою time travel дозволяє ефективніше керувати тимчасовими даними, у користувачів 10-ї версії для z/OS вона мала великий успіх. З її допомогою користувач або програма можуть вивчати дані в контексті часу існування в СУБД за заданими періодами. Використання таких середовищ є актуальним для аналітики.

DB2 10 може бути завантажена безкоштовно для використання в промисловому оточенні не більше ніж двох процесорних ядрах і 2Гб пам'яті. Більше функціональні версіїобійдуться у суму, починаючи від $6180, куди входить і вартість річного обслуговування. Вартість InfoSphere базується на кількості процесорів або об'ємі даних, базові версії обійдуться близько $40 тис за Тб.

IBM DB2 10.5 версія

Історія

DB2 має довгу історію і, як деякі вважають, стала першою СУБД, яка використовує SQL.

З 1975 по 1982 рік прототип DB2 розроблявся в IBM під назвою System Relational, або System R. Мова SQL вперше була реалізована саме в IBM System R, але ця система мала дослідницький характер, а комерційний продукт, що включає SQL, першою випустила компанія Oracle в 1979 року.

СУБД DB2 отримала свою назву у 1982 році, коли був випущений перший комерційний реліз для VM під назвою SQL/DS, а потім реліз для MVS під назвою DB2. Довгий час поряд з «DB2» використовувався варіант «Database 2», що також є торговою маркою IBM. Очевидно, мало на увазі, що це друга флагманська СУБД IBM після старої ієрархічної СУБД IMS.

Розвиток DB2 сягає корінням на початок 1970-х, коли доктор Е. Ф. Кодд, який працював на IBM, розробив теорію реляційних баз даних і в червні 1970 опублікував модель маніпуляції даними. Для втілення цієї моделі він розробив мову реляційних баз даних та назвав її Alpha. IBM віддала перевагу передати подальшу розробку групі програмістів, непідконтрольній доктору Кодду. Порушивши деякі принципи реляційної моделі, вони реалізували її як «структуровану англійська мовазапитів», скорочено SEQUEL. Оскільки SEQUEL було вже зареєстрованою торговою маркою, назву скоротили до SQL – «структуровану мову запитів», і такою вона залишилася й донині.

Таким чином, історично СУБД DB2 виникла з продуктів DB2 для MVS (нащадком якого є DB2 for z/OS) і спорідненого з ним SQL/DS для VM (нащадок - DB2 Server for VSE & VM). Надалі іншим колективом розробників IBM був реалізований сервер OS/2 EE Database Manager, згодом еволюціонував в DB2 v2 для OS/2, AIX і потім Windows, а потім в DB2 UDB (його нащадок - DB2 for Linux, UNIX and Windows). Ще одним колективом була виконана інтеграція архітектури DB2 із вбудованою базою даних AS/400 (нащадок – DB2 for i). IBM поступово рухається шляхом інтеграції всіх цих гілок.

Особливості

До відмінних особливостей DB2 відноситься діалект мови SQL, що визначає, за рідкісними винятками, суто декларативний зміст мовних конструкцій, і потужний багатофазовий оптимізатор, який будує за цими декларативними конструкціями ефективний план виконання запиту. На відміну від інших діалектів SQL, у діалекті SQL DB2 практично відсутні підказки оптимізатору, мало розвинений (а довгий часвзагалі була відсутня) мова процедур, що зберігаються, і, таким чином, все спрямоване на підтримку декларативного стилю написання запитів. Мова SQL DB2 при цьому є обчислювально повною, тобто потенційно дозволяє в декларативній формі визначати будь-які відповідності, що обчислюються, між вихідними даними і результатом. Це досягається зокрема за рахунок використання табличних виразів, рекурсії та інших розвинених механізмів маніпулювання даними.

Завдяки пріоритету IBM у розвитку реляційної теорії та позиціям фірми в комп'ютерній галузі, діалект DB2 SQL значно впливає на стандарти SQL ANSI/ISO.

Збережені процедури в DB2 не дуже широко застосовуються, при цьому традиційно для написання процедур, що зберігаються, використовуються звичайні мови програмування високого рівня(Сі, Java, PL/I, Кобол і т.д.), це дозволяє програмісту легко оформляти один і той же код або як частину програми, або як процедуру, що зберігається, залежно від того, на клієнті або на сервері його доцільніше виконувати . В даний час у DB2 також реалізовано процедурне розширення SQL для збережених процедур відповідно до стандарту ANSI SQL/PSM.

Оптимізатор DB2 широко використовує статистику розподілу даних у таблицях (якщо процес її збору був виконаний адміністратором бази даних), тому один і той же запит на мові SQL може бути відтрансльований в різні плани виконання в залежності від статистичних характеристик даних, які він обробляє.

Оскільки історично DB2 розвивалася з розрахованих на багато користувачів систем на мейнфреймах, то велика увага в архітектурі DB2 приділяється питанням безпеки і розподілу ролей обслуговуючих DB2 фахівців. Зокрема, на відміну багатьох інших СУБД , в DB2 є окремі ролі адміністратора СУБД (відповідального за конфігурування програмних компонентів DB2 та його оптимальне виконання у комп'ютерної системі) і адміністратора бази даних (відповідального управління даних у конкретної базі).

Використання при необхідності у програмах статичного SQL і концепції пакетів допускає, на відміну більшості інших СУБД, реалізацію такий моделі безпеки, коли права виконання певних операцій можуть видаватися прикладним програмам за відсутності таких прав у які працюють із цими програмами користувачів. Це дозволяє гарантувати неможливість роботи користувача з базою даних в обхід прикладної програми, якщо користувач має лише права на запуск програми, але не на самостійну маніпуляцію даними.

У рамках концепції підвищення рівня інтеграції засобів безпеки в комп'ютерній системі DB2 не має власних засобів автентифікації користувачів, інтегруючись із засобами операційної системи або спеціалізованими серверами безпеки. В рамках DB2 здійснюється лише авторизація користувачів, автентифікованих системою.

DB2 є єдиною реляційною СУБД загального призначення, що має реалізації на апаратно-програмному рівні (система IBM i; також в обладнанні мейнфреймів IBM System z реалізуються засоби підтримки DB2).

Сучасні версії DB2 забезпечують розширену підтримку використання даних у формат XML, включаючи операції з окремими елементами документів XML.

    Enterprise Edition - рішення для великих організацій, які мають потребу в надійній обробці транзакцій і широких функціональних можливостях;

    Advanced Edition - ця версія підтримує необмежену кількість з'єднань, кластеризацію та забезпечує масштабованість, дозволяючи досягати високої продуктивності (версія не забезпечує двофазне підтвердження транзакцій та автоматичну відмовостійкість);

    Small Business Edition – версія призначена для підтримки інтернет-додатків. Максимальна кількість допустимих IIOP/CORBA з'єднань – десять, підходить для організацій, системи яких не потребують кластеризації, підтримки роботи з мейнфреймами, двофазного підтвердження транзакцій та автоматичної стійкості до відмови;

    Developer Edition - варіант для розробників, які займаються створенням та тестуванням додатків з використанням сервера Sybase EAServer, є повнофункціональним, але обмежений п'ятьма IIOP-з'єднаннями.

Sybase EAServer забезпечує цілу низку важливих переваг, включаючи:

    надійну роботу системи за рахунок забезпечення автоматичного відновлення працездатності на рівні серверної пам'яті, балансування навантаження, кластеризації;

    захист інвестицій за рахунок інтеграції з існуючими внутрішніми системами;

    спрощене управління за рахунок комплексного налаштування та можливостей адміністрування, таких як кешування екземплярів компонентів, управління транзакціями, кешування процесів та графічне налаштування параметрів компонентів.

Субд db2

СУБД фірми IBM DB2 вперше з'явилося на початку вісімдесятих років. Наразі версії цього продукту функціонують під керуванням ОС AS/400AIX, S/390, Windows, OS/2, AIX, HP-UX, SCO UnixWare, Linux, NUMA-Q та Sun Solaris.

СУБД DB2 Enterprise Server Edition поставляється з багатим набором інструментів для адміністрування. Механізми доступу до даних DB2 підтримують драйвери ODBC, JDBC та ADO/OLE DB, а для користувачів Microsoft Visual Studioдоступні додаткові модулі, що включаються в середу, такі як Stored Procedure Builder. Windows-версії СУБД DB2 дозволяють також створювати збережені процедури на мові Visual Basic. Засоби розробки Borland підтримують доступ до DB2 не лише за допомогою ADO/OLE DB та ODBC, але й за допомогою власних універсальних механізмів доступу до даних – Borland Database Engine та dbExpress.

СУБД DB2 підтримує створення сховищ даних і, крім засобів перенесення даних у сховище, містить у складі клієнтської частини Data Warehouse Center, що дозволяє керувати всіма процесами, пов'язаними зі створенням та підтримкою сховищ даних, включаючи створення схеми сховища, визначення джерел вихідних даних для нього, створення розкладів оновлення даних у сховищі, перевірку та виправлення некоректних даних. Для підтримки OLAP-сховищ у складі сервера DB2 Universal Database входить OLAP Starter Kit, заснований на OLAP-сервері Hyperion Essbase.

СУБД DB2 підтримує зберігання та пошук XML-документів за їх елементами та атрибутами. За допомогою протоколу SOAP можна звертатися до Web-сервісів, які надають доступ до збережених процедур та даних DB2 (Web-сервіси керуються сервером додатків IBM WebSphere).

До найважливіших технічних характеристик DB2 Universal Database слід віднести підтримку реляційних і комплексних даних за допомогою об'єктних розширень, можливість роботи на мультипроцесорних платформах, підтримку кластерів, 64-розрядну архітектуру пам'яті, розпаралелювання запитів, наявність засобів для гетерогенного адміністрування та обробки даних, підтримку виконання розподілу .

СУБД DB2 – єдина СУБД, для якої можна вести розробку на .Net, а сама при цьому здатна працювати на будь-якій платформі, включаючи Linux, мейнфрейми, Windows. DB2 має процедури, що зберігаються на Java.

Розширена підтримка Visual Studio включає підтримку Web-сервісів, повну підтримку зберігання XML-даних без їх перетворення та можливість створювати програми та Web-сайти без написання програмного коду.

СУБД DB2 будується на основі реляційних технологій і при цьому має розширену підтримку XML, що спрощує процедури розробки та інтеграції даних. XML - ключовий компонент процесу формування метаданих та засобів керування метаданими у DB2.

У СУБД DB2 версії 9 реалізовано технологію pureXML, революційну технологію стиснення даних Venom та засоби автономного управління даними. DB2 забезпечує доступ до інформації, що зберігається в СУБД Oracle та MySQL.

Реалізовані в СУБДудосконалення дозволяють розробникам значно спростити та прискорити створення додатків, що працюють одночасно зі сховищами XML та реляційних даних. Наприклад, технологія pureXML підтримує мову XQuery - стандарт, створений спеціально для обробки даних XML. Для отримання реляційних або XML-даних розробники додатків можуть використовувати мови XQuery, XPath, стандартну мову SQL - або всі три одночасно.

Комплексне середовище розробки DB2 Developer Workbench дозволяє створювати, редагувати, налагоджувати, тестувати та розгортати збережені процедури та функції, що визначаються користувачами. Середовище Developer Workbench може використовуватися для розробки програм, а також для створення, редагування та виконання SQL-операторів та XML-запитів.

Сервер БД DB2 версії 9 дозволяє забезпечити безперешкодний, паралельний рух реляційних та XML-даних, незалежно від формату, платформи та розміщення ( http://www-306.ibm.com/software/data/db2/v9/).

СУБД DB2 здійснює також компресію індексів та тимчасових таблиць, що не вміє робити сьогодні жодна інша СУБД. Реалізація відмовостійкої двосерверної конфігурації, в якій сервер із резервною БД можна використовувати для створення звітності.

СУБД DB2 випускається у двох редакціях: DB2 Workgroup та DB2 Enterprise Edition. У СУБД реалізовано розпаралелювання обробки запиту, повний набір засобів тиражування, зведені таблиці запитів підвищення продуктивності БД, можливості об'єктно-орієнтованого конструювання БД і мови Java.

СУБД DB2 оснащена повним набором мультимедіа-розширень, що дозволяють зберігати текст, звук, відео, зображення та географічні дані та маніпулювати ними. Основними недоліками СУБД DB2 є відносна складність адміністрування.

У СУБД DB2 завдяки Index Smart Guide можна здійснювати налаштування, формуючи оптимальні індекси для заданого числа звернень, що характеризує типове навантаження на БД. СУБД DB2 дозволяє генерувати зведені таблиці, що значно підвищує ефективність її роботи як сховища даних. Зведена таблиця – це тимчасова робоча область, що використовується СУБД для зберігання відповідей на запити, що часто надходять.

Розширення DB2 Spatial для роботи з просторовими даними розроблено спільно з компанією ESRI [ http://www.esri.com/partners/alliances/ibm/solutions.html,http://www.esri.com/partners/alliances/ibm/index.html].

IBM випускає відразу три редакції DB2 – для корпоративних клієнтів, для компаній малого та середнього бізнесу (DB2 Express) та для розробників (DB2 Express-C).

У фірми IBM є спрощена версія СУБД DB2 Express-Cвона реляційна, але підтримує XML.

СУБД Informix

Провідним продуктом фірми Informix до придбання її компанією IBM був сервер Informix Dynamic Server (IDS), що підтримує платформи UNIX і Windows і забезпечує ефективну роботу як на одно-, так і багатопроцесорних системах, а також в кластерах. Цей продукт має потужні засоби паралельної обробки даних. Серед основних характеристик Informix Dynamic Server слід відзначити використання управління дисковим простором, як засобів ОС; і власних функцій, дозволяють обійти обмеження ОС, управління поділом пам'яті; динамічне керування потоками; підтримку фрагментації таблиць та індексів на кількох дисках; розпаралелювання запитів; дзеркало даних. Сервер IDS підтримує двофазне завершення транзакцій, а також гетерогенні транзакції (у цьому випадку в транзакціях можуть брати участь інші сервери). Особливо слід зазначити підтримку цим сервером часових рядів.

Розширення функціональності сервера реалізуються на базі DataBlade - колекцій об'єктів БД і підпрограм мовою С, що підключаються до БД і випускаються як виробником СУБД, так і незалежними виробниками.

З механізмів доступу до даних IDS підтримує драйвери ODBC, JDBC та ADO/OLE DB. Кошти розробки Borland підтримують доступ до IDS за допомогою механізмів Borland Database Engine, dbExpress, Microsoft .NET.

Останнім часом намітився перехід від реляційних СУБД до об'єктно-орієнтованих. Informix, наслідуючи цю концепцію, представляє своє рішення в СУБД Centaur, що базується на реляційній БД Informix Dynamic Server 7.3 і об'єктно-реляційній БД Informix Universal Data Option, і поєднує в собі високу швидкодію Dynamic Server при роботі з даними з універсальністю та мультимедіа функціями Universal Option. Ця реалізація варта розробки Інтернет-систем. СУБД має гнучке середовище розробки, нарощування, що відповідає характерним для мережі Інтернет інтенсивним навантаженням, і засобами роботи з новими типами даних, які з розвитком Web стали використовуватися повсюдно. Реалізовані в цій системі засоби Java дозволять розробникам створювати цією мовою збережені процедури, програми користувача і компоненти DataBlades.

Пакет Centaur оснащений вбудованими засобами обробки об'єктів ActiveX. Це дозволяє створювати збережені процедури БД мовою Visual Basic.

Centaur є надбудовою Informix Dynamic Server і працює з традиційним для цього пакета форматом БД, так що в розпорядженні користувачів залишаються всі колишні функції, а модернізація системи до рівня нових версій не буде пов'язана з великими труднощами. Система оснащена засобами об'єктно-орієнтованого конструювання БД, створення спеціалізованих таблиць та програм індексування; дозволяє користувачам вбудовувати у запити власні функції та не покладатися виключно на стандартні засоби SQL.

Програмні засоби, що об'єднуються назвою IBM DB2 Business Intelligence (<деловой интеллект >), призначені для аналізу накопичених (історичних) даних з метою підтримки прийняття рішень. В даний час цей напрямок є одним із найбільш пріоритетних у сфері технологій управління даними. Це пов'язано, з одного боку, з тим, що використання історичних даних може допомогти (і допомагає) у пошуку найкращих рішеньу діловій діяльності, а, з іншого боку, з можливостями організувати зберігання, швидкий пошукнеобхідних даних та вилучення з них потрібної інформації (знань) за допомогою сучасних комп'ютерних засобів.

Функціонально програмні засоби цього напряму ділять на чотири групи:

  • засоби аналізу даних у реальному масштабі часу (OLAP-On-line Analytical Processing);
  • засоби створення сховищ даних (Data Warehouse);
  • засоби підтримки доступу до даних;
  • засоби інтелектуальної обробки даних, або<добычи информации>(Intelligent Miner).

Аналіз даних у реальному масштабі часу (OLAP)здійснюється з метою підтримки прийняття рішень(оперативних чи стратегічних) з управління бізнесом. Інформаційні системи , що підтримують цей вид діяльності, називають Системами підтримки ухвалення рішень (СППР).

Термін OLAP був запропонований в 1993 році Едвардом Коддім (Е. Кодд - автор реляційної моделі даних). За Кодд, OLAP - це технологія комплексного динамічного синтезу, аналізу та консолідації великих обсягів багатовимірних даних. Існує так званий<тест FASMI>, що містить основні принципи OLAP-технологій:

  • Fast(швидкий) - надання результатів аналізу за прийнятний час (зазвичай трохи більше п'яти секунд);
  • Analysis(аналіз) - можливість проведення будь-якого логічного та статистичного аналізуданих, а також збереження його результатів у доступному для користувача вигляді;
  • Shared(розділяється) - розрахований на багато користувачів доступ до даних з підтримкою механізмів блокувань і авторизованого доступу;
  • Multidimensional(багатомірний) - багатовимірне подання даних на концептуальному рівні, включаючи повну підтримку ієрархій та множинних ієрархій;
  • Information(Інформації) - можливість звертатися до будь-якої потрібної інформації незалежно від її обсягу та місця зберігання.

Для того, щоб задовольнити вимоги щодо часу аналізу даних та отримання відповіді на складні запити, знадобилося задіяти нову технологію організації та зберігання даних. Ця нова технологія отримала назву< сховище даних> (Data Warehouse).

Сховище даних. Згідно з визначенням автора концепції сховища даних Б. Інмона), це<предметно-ориентированные, интегрированные, неизменчивые, поддерживающие хронологию наборы данных, организованные для целей поддержки прийняття рішень>. У цьому визначенні під інтеграцією данихрозуміється об'єднання та узгоджене подання данихіз різних джерел.< Поддержка хронологии>означає наявність<исторических>даних, тобто. даних, що відповідають інтервалу часу, що передує поточному моменту.<Неизменчивость данных>означає, що зміна даних у сховищі здійснюється шляхом додавання нових даних, що відповідають певному часовому інтервалу, без зміни інформації, що вже знаходиться у сховищі.

До основних вимог, що пред'являються до сховищ даних, належать:

  • підтримка високої швидкості отримання даних із сховища (тобто малого часу реакцію запити);
  • підтримка внутрішньої несуперечності даних;
  • можливість отримання зрізів даних (наприклад, значень сукупності показників за певний період, значення одного показника за низку послідовних часових інтервалів тощо);
  • наявність зручних засобів для перегляду даних у сховищі;
  • повнота і достовірність даних, що зберігаються.

Сховище даних- це єдине джерело даних, що відносяться до функціонування галузі, підприємства, організації, що містить всю необхідну і достовірну інформаціюдля підтримки прийняття рішень.

Типове сховище зазвичай відрізняється від звичайної реляційної бази даних . Пояснимо це твердження шляхом розгляду логічних моделей реляційної бази данихта даних сховища.

У традиційних базах даних реляційного типу логічна модель даних- це сукупність двовимірних (плоських) таблиць, побудованих те щоб забезпечити можливість найефективнішого виконання різних операцій із даними. Нормалізована логічна модельбази даних реляційного типу характеризуються, зокрема, такими особливостями:

  • всі значення, що зберігаються в осередках таблиць (значення атрибутів), атомарні (тобто в кожному осередку таблиці розташовується лише одне значення);
  • дані не дублюються (тобто у базі даних відсутня надмірність).


Рис. 6.14.

Таке подання данихне завжди відповідає цілям підтримки прийняття рішеньколи виникає необхідність швидкого отримання відповідей на складні аналітичні запити. Більш адекватною тут є логічна модель даниху вигляді багатовимірного куба. Куб - це геометрична фігураз трьома вимірами. Куби даних практично мають від 4 до 12 вимірів; у цих випадках їх називають гіперкубами. Вимірювання у кубі - це одна з характеристик даних. Наприклад, у кубі, показаному на рис. 6.14, вимірами є<время>(2001 р., 2002 р.),< пункт назначения>(Москва, Санкт-Петербург),<груз>(Бензин, вугілля). У осередках куба (рис. 6.14) зберігаються дані про обсяги перевезень. Ці дані агреговані за іншими вимірами. Наприклад, для куба на рис.6.14, якщо існує вимір< пункт отправки>, то наведені малюнку дані слід як агреговані з цього виміру (тобто.<1000>це загальна маса вугілля, завезеного до Москви 2001 року від усіх постачальників). На багатовимірному кубі легко визначити безліч операцій, типових при аналітичній роботі: скорочення кількості вимірів (проекції), злиття (об'єднання кубів, що мають загальні виміри) тощо. Наприклад, при агрегуванні з виміру<груз>куб на рис. 6.14 перетворюється на квадрат, показаний на рис. 6.15.


Рис. 6.15.Агрегування куба Мал. 6.3.4 з вимірювання "вантаж"

Логічна модельсховища у своїй представляється безліччю багатовимірних кубів ( гіперкубів ), у випадку, з різними розмірностями, кожен із яких відповідає одному чи кільком кількісним показниками галузі, організації, підприємства.

Слід зазначити, що вимірювання багатовимірного куба може мати ієрархічну структуру. Наприклад, вимір< пункт отправки>може бути представлено трирівневою ієрархічною схемою (див. рис. 6.16).

На відміну від нормалізованої логічної моделібази даних реляційного типу, логічна модельтипу куба допускає надмірність даних, тобто. містить крім вихідних даних та деякі заздалегідь обчислені підсумкові дані (агреговані дані). Це виправдано у СППР, т.к. дозволяє зменшити час реакції системи на складні запити.


Рис. 6.16.Ієрархічна схема виміру "пункт відправки"

Ми розглянули логічну модель сховища, яка представляє дані як сукупності багатовимірних кубів. Фізична реалізація сховища зазвичай здійснюється одним із наступних способів:

  • з використанням спеціалізованих багатовимірних структур, що відрізняються від традиційних реляційних баз даних;
  • із використанням для зберігання даних реляційних баз даних;
  • гібридне рішення: детальні дані зберігаються у базах реляційного типу, а агреговані - у спеціальних багатовимірних структурах.

У IBM DB2 OLAP Serverпідтримується багатовимірна модельданих на основі реляційної СУБД DB2 UDB. Засоби підвищення продуктивності (див. розділ 6.3.2) дозволяють забезпечити потрібні часові характеристики.

Інструменти для створення сховищ данихдозволяють збирати дані із систем управління підприємством та зовнішніх джерел,<очищать>їх, перетворювати і завантажувати в сховище даних.

На етапі проектування у розпорядження користувача надається набір керованих інструментів створення сховищ даних. До його складу входять інструменти, що дозволяють генерувати різні схемиочищення та завантаження даних, а також графічно описувати дії, необхідні для побудови та супроводу сховища даних. Основний програмний продуктцієї групи - IBM DB2 Warehouse Manager; його призначення, функції та особливості наведено у таблиці 6.3.

Таблиця 6.3. Компоненти IBM Business Intelligence
№ п/п Основне призначення Продукт Функціональність та особливості
1. Аналіз даних у реальному масштабі часу (OLAP) IBM DB2 OLAP Server
  • підтримка багатовимірної моделі даних (з урахуванням реляційної СУБД);
  • підтримка операції багатовимірної агрегації даних у різних ієрархічних структурах;
  • паралельна обробка запитів;
  • використання методів оптимізації запитів
2. Створення сховищ даних (Data Warehouse) IBM DB2 Warehouse Manager
  • розширення функціональності DB2 щодо вилучення, перетворення та завантаження даних (ELT - Extraction, Transformation and Loading);
  • підтримка управління метаданими та інформаційними каталогами (репозитаріями);
  • підтримка QMF for Windows (створення запитів для DB2 з допомогою Windowsабо Web-інтерфейсу);
  • підтримка застосування<агентов>, що здійснюють переміщення даних між вихідною та цільовою системами без участі центрального сервера
3. Підтримка доступу до даних Query Management Facility (QMF)
  • створення звітівта запитів до бази даних;
  • створення запитів мовою Java для їх ініціалізації через браузер;
  • інтеграція результатів виконання запитів з електронними таблицями та персональними базами даних;
  • використання методів синтаксичного аналізузапитів на SQL;
  • контроль споживання ресурсів групами користувачів
DB2 Warehouse Manager Connector for SAP R/3
  • доступ та перенесення бізнес-об'єктів SAP у сховище DB2;
  • вилучення помірних обсягів даних SAP R3
D2 Warehouse Manager Connector to the Web
  • вилучення даних з бази даних WSA (IBM WebSphere Site Analyser) або вітрин даних та розміщення їх у сховищі;
  • перевірка виконання продуктом WSA копіювання даних про Web-трафік у цільове сховище
DB2 Warehouse Manager Sourcing Agent for z/OS
  • програма-агент, що надає можливість для IBM DB2 Warehouse Manager, що працює під Linux, UNIX або Windows, здійснювати вилучення та перетворення даних, розміщених на платформі z/OS
4. Інтелектуальна обробка даних (Intelligence Miner) DB2 Intelligent Miner Modeling
  • виявлення асоціацій;
  • кластеризація;
  • класифікація;
  • сумісність з мовою Predective Model Markup Language (PMML), версія 2.0
DB2 Intelligent Miner Visualizer
  • графічне подання результатів розв'язання задач виявлення асоціацій, кластеризації та класифікації;
  • підтримка мови PMML, версія 2.0
DB2 Intelligent Miner Scoring
  • вбудовування моделей (результатів інтелектуальної обробки, отриманих за допомогою DB2 Intelligent Miner Modeling) у додатки для використання з новими даними
DB2 Intelligent Miner for Text
  • вилучення, індексування, аналіз та класифікація інформації з текстових джерел (документи, Web-сторінки, бланки)

Засоби підтримки доступу до данихявляють собою API та сервери проміжного ПЗ, які підтримують доступ клієнтських інструментів до бізнес-інформації, а також обробку цієї інформації. Сполучні програмні серверидозволяють клієнтам отримувати прозорий доступ до численних серверів баз даних (створених як IBM, так і іншими розробниками). Основні програмні продуктицієї групи описані у таблиці 6.3.

Засоби інтелектуальної обробки даних (<добычи информации>, Intelligent Miner). Основне призначення інтелектуальної обробки даних (ІАД) - пошук даних прихованих закономірностей. Більшість методів ІАД спочатку розроблялося в рамках напряму досліджень, що отримало назву< системи штучного інтелекту>. Тільки зараз, коли утворилися великі масиви корпоративних даних, що швидко зростають, ці методи виявилися повною мірою затребуваними.

Спочатку засоби ІАД розроблялися так, що як вихідний матеріал для аналізу приймалися дані, організовані в плоскі реляційні таблиці. Застосування ІАД до даних, представлених за допомогою сховищ у вигляді гіперкуба, у багатьох випадках може виявитися ефективнішим.

Зазвичай виділяють такі п'ять типів завдань ІАД:

  • Класифікація. Найбільш поширене завдання ІАД. Вона дозволяє виявити ознаки, що характеризують однотипні групи об'єктів - класи, щоб за відомими значеннями цих ознак можна було віднести новий об'єкт до того чи іншого класу. Ключовим моментом вирішення цього завдання є аналіз множини заздалегідь класифікованих об'єктів. Найбільш типовий приклад використання класифікації – конкурентна боротьба між постачальниками товарів та послуг за певні групи клієнтів. Класифікація може допомогти визначити характеристики нестійких клієнтів, схильних перейти до іншого постачальника, що дозволяє знайти оптимальний спосібутримати їх від цього кроку (наприклад, через надання знижок, пільг або навіть за допомогою індивідуальної роботи з представниками<групп риска>).
  • Кластеризація. Логічно продовжує ідею класифікації більш складний випадок, коли самі класи не зумовлені, тобто. невідома належність заданих об'єктів тому чи іншому класу. Результатом використання методу, що виконує кластеризацію, якраз є варіант розбиття множиниоб'єктів на групи, що включають<близкие>об'єкти. Так, можна виділити родинні групи клієнтів або покупців для того, щоб вести щодо них диференційовану політику. У наведеному вище прикладі<группа риска>- категорії клієнтів, готових піти до іншого постачальника; - засобами кластеризації може бути виявлена ​​до початку процесу догляду, що дозволить вживати профілактичних, а не екстрених заходів.
  • Виявлення асоціацій. Асоціація - це зв'язок між двома або декількома подіями, що одночасно наступають. Кількісним заходом асоціації може бути, наприклад, умовна ймовірністьподії А за умови, що подія відбулася.
  • Виявлення послідовностей. Подібно до асоціацій, послідовності визначають зв'язок між подіями, але наступають не одночасно, а з деяким розривом у часі. Мірою взаємозв'язку між послідовними подіями А, В, С можуть бути умовні ймовірностіподії В за умови, що подія А відбулася, та умовна ймовірністьподії З за умови, що А та В мали місце.
  • Прогнозування. Це завдання оцінки майбутніх значень показника на основі аналізу поточних та історичних даних. Наприклад, може бути зроблено прогноз обсягу перевезень, що очікується наступного року, на основі даних, накопичених у базі виробничо-економічних показників роботи залізниці. У завданнях такого типу найчастіше використовуються традиційні методи математичної статистики.

DB2 Intelligent Miner- це набір продуктів, який надає у розпорядження користувача аналітичні інструменти, необхідні прийняття продуманих і якісних бізнес-рішень. Завдання, розв'язувані цим набором товарів, можуть призвести до вибору точнішої маркетингової стратегії, зменшення відтоку замовників, до збільшення прибутку від торгівлі через Internet . Основні продукти сімейства DB2 Intelligent Miner описані у таблиці 6.3.

 

 

Це цікаво: