Мови розмітки. Введення в XML

Мови розмітки. Введення в XML

На початку лютого 1998 року міжнародна організація W3C затвердила специфікацію "Extensible Markup Language (XML) 1.0", яка започаткувала розробку безлічі нових мов розмітки для передачі інформації через Інтернет на основі стандарту XML. По суті, це означало новий крок у розвитку мов гіпертекстової розмітки. За чотири роки свого існування XML не тільки привернув до себе досить значну увагу як з боку звичайних користувачів, так і з безлічі веб-дизайнерів, але й став невід'ємною чатом Інтернету. Вже сьогодні практично не існує серверів, які тією чи іншою мірою не використовували б цю технологію як аналог HTML. Однак говорити про те, що XML саме зараз стає основним способом трансляції гіпертексту через глобальну мережу, поки що принаймні передчасно. Сама мова ще досить молода, і деякі її елементи досі перебувають у стадії розробки. Поки що створено лише загальний каркас того, що, можливо, в майбутньому замінить Html, але в якому конкретно вигляді це буде поки сказати неможливо.

Від початку

У листопаді 1990 року, коли користувачі Інтернету вперше почули про нову технологію, назва якої цілком легко змогла вміститися всього в три літери, майже ніхто не міг уявити собі, що пройде зовсім небагато часу і ця технологія стане практично єдиним способом передачі інформації в глобальній мережі. Сьогодні вже для багатьох недосвідчених користувачів слово Інтернет міцно асоціюється з WWW, хоча насправді ці речі, звичайно, один з одним пов'язані, але все ж трохи різні.

За великим рахунком, саме неймовірна популярність World Wide Web та її невід'ємної частини HTML, безумовно, стала причиною вкрай підвищеної уваги до структур гіпертекстової розмітки документів.

Вперше поняття гіпертексту було запроваджено В.Бушем ще 1945 року. Однак реальні додатки, що використовують подібні структури даних, стали використовуватися лише починаючи з 60-х років, а справді надзвичайний сплеск активності навколо цієї технології почався лише тоді, коли виникла реальна необхідність у механізмі об'єднання безлічі інформаційних ресурсів, забезпечення можливості створення, перегляду нелінійного тексту. І прикладом реалізації цього механізму послужила та сама павутина WWW.

Безпосередньо мова розмітки документів - це набір спеціальних інструкцій, які називаються тегами (у деяких перекладних виданнях теги називають ярликами), призначених для створення в документах будь-якої структури та визначення відносин між різними елементами цієї структури. Теги мови розмітки, або, як їх іноді називають, дескриптори, що управляють, в таких документах кодуються абсолютно певним чином, виділяються щодо основного вмісту документа, після чого служать як інструкції для програми, що робить інтерпретацію і показ вмісту документа, власне кажучи, тому, хто його переглядає, якщо намагатися знайти аналогії з Інтернетом, то цим є клієнт, а програмою-інтерпретатором у найпоширенішому випадку є броузер). Вже в перших системах для позначення цих команд було вирішено використовувати символи "<" и ">", всередині яких розміщувати назви інструкцій та їх параметри. На сьогоднішній день такий спосіб позначення тегів є загальновизнаним стандартом.

Саме використання гіпертекстової розбивки текстового документа в сучасних інформаційних системах пов'язане багато в чому про те, що гіпертекст дозволяє створювати механізм так званого нелінійного перегляду інформації. Це означає, що у системах дані видаються над вигляді безперервного потоку текстових структур, а набором взаємозалежних компонентів, перехід якими здійснюється з допомогою гіперпосилань.

Найбільш популярна і відома на сьогоднішній день мова гіпертекстової розмітки - HTML, була створена спеціально для структурування та передачі інформації, що знаходиться в мережі Інтернет, і є, безсумнівно, ключовою складовою технології WWW. З використанням гіпертекстової моделі документа спосіб подання різноманітних інформаційних ресурсів у мережі став більш упорядкованим, а користувачі отримали зручний механізм пошуку та перегляду потрібної інформації. Однак першою ластівкою в цій справі все ж таки прийнято вважати значно старішу мову - SGML.

SGML (Standard Generalized Markup Language) був офіційно прийнятий у 1986 році як міжнародний стандарт (ISO 8879:1986) для опису незалежних від пристроїв введення/виведення та від обчислювального середовища методів представлення текстової інформації в електронній формі. Основою для його створення стала досить стара мова розмітки GML (Generalized Markup Language), розроблена компанією IBM ще за часів перших персональних комп'ютерів. Якщо бути точним, то SGML – це метамова, призначена для опису інших мов розмітки.

Спочатку слово розмітка, як правило, використовувалося для описів анотацій або інших позначень усередині тексту, які призначалися для вказівок укладачу документа або, як його іноді називають, "верстальнику" того, як саме конкретне місце має бути надруковано. Подібні способи можуть включати підкреслення хвилястою рисою, що позначає курсив, будь-які спеціальні значки для пропуску окремих фраз або їх друку конкретним шрифтом, і так далі. Коли з часом форматування та друк стали автоматизованими, цей термін вже охоплював всі види спеціальних кодів розмітки, які вставлялися в електронні текстові документи для управління форматуванням, печаткою або іншою обробкою.

Під мовою розмітки таким чином розуміють набір угод про принципи форматування, які застосовуються для кодування текстових блоків. Мова розмітки має чітко позначати, яка розмітка допустима саме в даному документі, яка розмітка обов'язкова, як відрізнити її елементи від простого тексту і що означає. SGML був здатний вирішувати перші три завдання, рішення останньої передбачало наявність неформального опису.

SGML, на відміну від інших мов розмітки, створених на його основі, використовує принцип так званої описової розмітки замість процедурної. Подібна система використовує елементи розмітки, які надають назви для віднесення окремих частин документа до певних категорій. Іншими словами, теги, такі як Або \end(list) просто ідентифікують порцію документа і стверджують, що "ця частина є параграфом" або що "ця частина є кінцем розпочатого списку", і т.п. Система ж, яка використовує процедурну розмітку (сюди потрапляють текстові процесори, наприклад, Microsoft Word) визначає, яка безпосередньо обробка буде виконуватися в конкретній точці текстового документа: "в цьому місці викликати таку процедуру з параметрами 5, е і z" або "пересунути" межу документа на 7 мм правіше щодо будь-якого елемента, пропустити один рядок почати наступний з червоного рядка" і т.д. У SGML інструкції, необхідні для обробки документа з певною конкретною метою (наприклад, для форматування), чітко відокремлюються від описової розмітки, яка зустрічається всередині документа. Зазвичай вони зібрані поза документом в окремих процедурах чи програмах.

При використанні описової, а не процедурної розмітки той самий документ може бути оброблений різними програмами, кожна з яких може застосовувати свої власні інструкції обробки до тих його частин, які вона вважає важливими. Наприклад, програма аналізу вмісту може повністю ігнорувати виноски, тоді як програма форматування може витягувати та збирати їх для друку в кінці кожної частини. Різні види інструкцій обробки можуть асоціюватися з однією частиною файлу. Наприклад, одна програма може вилучати з документа прізвища людей і географічні назви для створення індексу або бази даних, тоді як інша, що обробляє той же текст, може друкувати прізвища і назви шрифтом.

SGML вводить поняття типу документа, і, способи його визначення (document type definition, DTD). Документи вважаються типізованими, як і інші об'єкти, що обробляються комп'ютерами. Тип документа формально визначається його складовими частинами та його структурою. Скажімо, можна визначити тип документа таким чином, що він повинен складатися із заголовка і, можливо, імені автора, за якими слідує анотація та послідовність одного або більше абзаців. Будь-який документ без заголовка, відповідно до цього формального визначення, не буде звітом, так само як не буде ним і послідовність абзаців, за якою слідує анотація, незважаючи на те, наскільки схожий на звіт такий документ з погляду читача-людини .

Оскільки документи відносяться до відомих типів, можна використовувати спеціальну програму, яка називається аналізатором (parser), для того, щоб обробити документ, який стверджує, що він відноситься до конкретного типу, і перевірити, чи дійсно всі елементи, необхідні для даного типу документів, присутні і знаходяться у правильній послідовності та коректно структуровані. Що важливіше, різні документи одного типу можуть оброблятися уніфікованим чином. Можна писати програми, які використовують знання, що містяться в інформаційній структурі документа, які, таким чином, можуть бути інтелектуальнішими.

SGML як метамова дозволяє визначати конкретні мови (часто звані "додатками SGML"), орієнтовані на конкретне застосування. Приклад тому - мова HTML, що широко використовується на WWW. Кожен такий мову описується як DTD, визначаючи елементи та його атрибути. Отримавши такий DTD, програмне забезпечення для роботи з SGML може коректно опрацьовувати документи, написані відповідно до цього DTD.

Навіть у проекті ця мова замислювалася спеціально для реалізації тієї моделі передачі в глобальну мережу, яку ми маємо зараз. Тобто HTML - це породження Інтернету. Хоча, по суті, HTML є спрощеною версією стандартної загальної мови розмітки - SGML (Standart Generalised Markup Language), яка була затверджена ISO як стандарт ще в 80-х роках минулого століття. SGTML - це не мова у чистому вигляді, а скоріше набір якихось правил та описів для створення інших мов, він визначає допустимий набір тегів, їх атрибути та внутрішню структуру документа. Контроль за правильністю використання дескрипторів здійснюється за допомогою спеціального набору правил, які називаються DTD-описами, які використовуються програмою-інтерпретатором клієнта при розборі документа. До кожного класу документів визначається свій набір правил, що описують граматику відповідної мови розмітки. За допомогою SGML можна організовувати інформацію, що міститься в документах, описувати структуровані дані, представляти цю інформацію в стандартному форматі для подальшого використання. Однак через деяку свою складність, SGML використовувався, в основному, для опису синтаксису інших мов (найвідомішим з яких є HTML), і деякі додатки працювали з SGML-документами безпосередньо.

HTML - мова значно більш зручна і проста у використанні, ніж SGML. Він не дає змоги визначати додаткові мови на своїй основі. Використання HTML передбачає розмітку документа за стандартом, що визначається досить обмеженим набором інструкцій чи тегів. Такі інструкції призначаються, насамперед, керувати процесом виведення вмісту документа на екрані програми-клієнта і цим визначення способу представлення документа, але з його цілісної структури. У більшості випадків дані HTML подаються у звичайному текстовому файлі, який можна легко передавати через мережу з використанням протоколу http.

Однак час йде і пред'являє все більш жорсткі вимоги до популярних технологій, сучасні додатки потребують не тільки мови представлення даних на екрані клієнта, але і механізму, що дозволяє визначати структуру документа, описувати елементи, що містяться в ньому. HTML має нескладний набір команд і цілком успішно справляється із завданням опису текстової інформації та відображенням її на екрані програми перегляду - броузера. Однак дані, що відображаються, ніяк не пов'язані з тими тегами, які використовуються для форматування, тому у програм-аналізаторів немає можливості використовувати теги HTML для пошуку потрібних нам фрагментів документа. Тобто. зустрівши, наприклад, такий опис

rose,

Програма перегляду буде знати, яким кольором відобразити текст, що міститься всередині тегів і, найімовірніше, відобразить його правильно, але їй абсолютно байдуже, де документа зустрівся цей тег, які інші теги укладено поточний фрагмент, чи існують вкладені у нього фрагменти, чи правильно побудовані відносини між об'єктами. Така "байдужість" до структури документа призводить до того, що пошук або аналіз інформації всередині нього нічим не відрізнятиметься від роботи з суцільним, не розбитим на елементи текстовим файлом. А це, як відомо, не найефективніший спосіб роботи з інформацією.

Іншим істотним недоліком ідеї, що реалізується в HTML, можна назвати обмеженість набору його тегів. DTD-правила для HTML визначають фіксований набір дескрипторів і тому розробник не має можливості вводити власні, спеціальні теги. Хоча час від часу з'являються нові розширення мови (на сьогоднішній день останньою версією HTML є HTML 4.0), але довгий шлях їхньої стандартизації, що супроводжується постійними розбіжностями між основними виробниками броузерів, роблять практично неможливою швидку адаптацію мови, її використання для відображення спеціалізованої інформації (наприклад, мультимедійних, математичних, хімічних формул і т.д.).

Підсумовуючи всьому сказаному, можна стверджувати, що HTML вже сьогодні не задовольняє повною мірою вимогам, які висувають сучасні розробники до мов подібного роду. І йому на зміну була запропонована нова мова гіпертекстової розмітки: потужна, гнучкий, і, одночасно з цим, зручна мова XML.

XML (Extensible Markup Language) - це мова розмітки, що описує цілий клас об'єктів даних, які називаються XML-документами. Ця мова використовується як засіб для опису граматики інших мов та контролю за правильністю складання документів. Тобто. XML не містить жодних тегів, призначених для розмітки, він просто визначає порядок їх створення. Таким чином, якщо, наприклад, ми вважаємо, що для позначення елемента rose у документі необхідно використовувати тег , то XML дозволяє вільно використовувати тег, що визначається нами, і ми можемо включати в документ фрагменти, подібні до наступного:

rose

Набір тегів може бути легко розширений. Якщо, припустимо, ми хочемо також вказати, що опис квітки має за змістом йти всередині опису оранжереї, в якій вона цвіте, то просто задаємо нові теги і вибираємо порядок їхнього слідування:

rose

Якщо ми хочемо посадити туди ще кілька квіточок, то маємо внести такі зміни:

rose

tulip

cactus

Як видно, процес створення XML-документа дуже простий і вимагає від нас лише базових знань HTML і розуміння тих завдань, які ми хочемо виконати, використовуючи XML як мову розмітки. Таким чином, у розробників з'являється унікальна можливість визначати власні команди, що дозволяють їм найбільше ефективно визначати дані, що містяться в документі. Автор документа створює його структуру, будує необхідні зв'язки між елементами, використовуючи ті команди, які задовольняють його вимогам, і досягає такого типу розмітки, який необхідний для виконання операцій перегляду, пошуку, аналізу документа.

Ще однією з очевидних переваг XML є можливість використання його як універсальної мови запитів до сховищ інформації. Сьогодні в глибинах W3C знаходиться на розгляді робочий варіант стандарту XML-QL (або XQL), який, можливо, у майбутньому становитиме серйозну конкуренцію SQL. Крім того, XML-документи можуть виступати в якості унікального способу зберігання даних, який включає одночасно засоби для розбору інформації і подання її на стороні клієнта. У цій галузі одним з перспективних напрямків є інтеграція Java- та XML-технологій, що дозволяє використовувати потужність обох технологій при побудові машинно-незалежних додатків, які використовують, крім того, універсальний формат даних під час обміну інформацією.

XML дозволяє також здійснювати контроль за коректністю даних, що зберігаються в документах, проводити перевірки ієрархічних співвідношень усередині документа та встановлювати єдиний стандарт на структуру документів, вмістом яких можуть бути різні дані. Це означає, що його можна використовувати при побудові складних інформаційних систем, у яких дуже важливим є питання обміну інформацією між додатками, що працюють в одній системі. Створюючи структуру механізму обміну інформації на початку роботи над проектом, менеджер може позбавити себе у майбутньому багатьох проблем, що з несумісністю використовуваних різними компонентами системи форматів даних.

Також однією з переваг XML є те, що програми-обробники XML-документів нескладні, і вже сьогодні вільно поширюються різноманітні програмні продукти, призначені для роботи з XML-документами. XML підтримується сьогодні у всіх броузерах Microsoft Internet Explorer, починаючи з версії 4.0. Було заявлено про його підтримку у наступних версіях Netscape Communicator, СУБД Oracle, DB-2, у додатках MS-Office. Все це дає підстави припускати, що, швидше за все, у найближчому майбутньому XML стане основною мовою обміну інформацією інформаційних систем, замінивши собою, тим самим, HTML. На основі XML вже сьогодні створено такі відомі спеціалізовані мови розмітки, як SMIL, CDF, MathML, XSL, та список робочих проектів нових мов, що знаходяться на розгляді W3C, постійно поповнюється.

Як виглядає документ XML?

Якщо ви знайомі з HTML, вивчення XML не вимагатиме від вас особливих зусиль. Хоча XML, безумовно, сильно відрізняється за своїми можливостями та призначенням від мови гіпертекстової розмітки, обидві ці мови є підмножинами SGML, і, отже, успадковують його базові принципи.

Структура документа

Найпростіший XML-документ може виглядати так, як показано в Прикладі 1

Перший

Другий підпункт 1

Третій

Останній

Зверніть увагу, що цей документ дуже схожий на звичайну HTML-сторінку. Так само, як і HTML, інструкції, укладені в кутові дужки, називаються тегами і служать для розмітки основного тексту документа. У XML існують відкривають, закривають і порожні теги (в HTML поняття порожнього тега теж існує, але спеціального його позначення не потрібно).

Тіло документа XML складається з елементів розмітки (markup) та безпосередньо вмісту документа – даних (content). Теги XML призначені для визначення елементів документа, їх атрибутів та інших конструкцій мови. Більш детально про типи розмітки, що застосовується в документах, ми поговоримо трохи пізніше.

Будь-який XML-документ повинен завжди починатися з інструкції, всередині якої можна також задавати номер версії мови, номер кодової сторінки та інші параметри, необхідні програмі-аналізатору в процесі аналізу документа.

Правила створення XML-документу

У загальному випадку XML-документи повинні відповідати таким вимогам:

У заголовку документа міститься оголошення XML, в якому вказується мова розмітки документа, номер його версії та додаткова інформація.

Кожен відкриваючий тег, що визначає деяку область даних у документі, обов'язково повинен мати свого "напарника", що закриває, тобто, на відміну від HTML, не можна опускати закривають теги.

У XML враховується регістр символів.

Усі значення атрибутів, що використовуються у визначенні тегів, мають бути укладені у лапки.

Вкладення тегів у XML суворо контролюється, тому необхідно стежити за порядком проходження тегів, що відкривають і закривають.

Вся інформація, що знаходиться між початковим і кінцевими тегами, розглядається в XML як дані, і тому враховуються всі символи форматування (тобто прогалини, переклади рядків, табуляції не ігноруються, як у HTML).

Якщо XML-документ не порушує наведені правила, то він називається формально-правильним і всі аналізатори, призначені для розбору XML-документів, зможуть працювати з ним коректно.

Однак крім перевірки на формальну відповідність граматиці мови, в документі можуть бути засоби контролю над змістом документа, за дотриманням правил, що визначають необхідні співвідношення між елементами і формують структуру документа. Наприклад, наступний текст, будучи цілком правильним XML-документом, буде абсолютно безглуздим:

Росія Novosibirsk</country>

Для того щоб забезпечити перевірку коректності XML-документів, необхідно використовувати аналізатори, які проводять таку перевірку і називаються вірифікуючими.

На сьогоднішній день існує два основних способи контролю правильності XML-документа: DTD-визначення (Document Type Definition) та схеми даних (Semantic Schema). Більш детально про використання DTD та схем ми поговоримо наступного разу. На відміну від SGML, визначення DTD-правил у XML не є необхідністю, і ця обставина дозволяє нам створювати будь-які XML-документи, не ламаючи поки що голову над вельми непростим синтаксисом DTD.

Основний принцип

Елемент – це основна структурна одиниця XML-документа. Укладаючи слово rose в теги , ми визначаємо непустий елемент, званий , вміст якого є rose. У випадку як вміст елементів можуть виступати як просто якийсь текст, і інші, вкладені, елементи документа, секції CDATA, інструкції з обробки, коментарі, - тобто. практично будь-які частини XML-документа.

Будь-який непустий елемент повинен складатися з початкового, кінцевого тегів та даних між ними ув'язнених.

Набором всіх елементів, які у документі, визначається його структура і визначаються все ієрархічне співвідношення. Плоска модель даних перетворюється з використанням елементів на складну ієрархічну систему з безліччю можливих зв'язків між елементами.

Здійснюючи згодом пошук у якомусь документі, програма клієнта спиратиметься на інформацію, закладену у його структуру, - використовуючи елементи документа. Тобто. якщо, наприклад, потрібно знайти потрібний університет у потрібному місті, то необхідно буде переглянути вміст конкретного елемента , що знаходиться всередині конкретного елемента . Пошук при цьому, природно, буде набагато ефективнішим, ніж знаходження потрібної послідовності по всьому документу.

У XML-документі, як правило, визначається хоча б один елемент, який називається кореневим, і з нього програми-аналізатори починають перегляд документа. У наведеному прикладі цим елементом є .

У деяких випадках теги можуть змінювати та уточнювати семантику тих чи інших фрагментів документа, по-різному визначаючи одну й ту саму інформацію і тим самим надаючи додатку-аналізатору цього документа відомості про контекст використання даних, що описуються. Наприклад, прочитавши фрагмент Holliwood, ми можемо здогадатися, що в цій частині документа йдеться про місто, а ось у фрагменті Holliwood- Про забігайлівку.

Висновок

Мова форматування Web-сторінок HTML спочатку вводилася як додаток SGML. Пізніше, з бурхливим розвитком WWW, HTML почав усіляко розширюватися з метою дати автору більший контроль над зовнішнім поданням інформації. Нові елементи та атрибути, такі як або орієнтувалися на візуальне форматування. З'явилися і стали активно використовуватися засоби, що не входять власне в мову розмітки: imagemaps, Java та JavaScript, plugins та інше. Багато з'явилося також елементів HTML, які підтримуються лише певним броузером, або по-різному працюють у різних броузерах. Тому зараз вже складно стверджувати, чи є додатком HTML SGML чи ні. Дуже небагато сторінок створюються відповідно до специфікацій на HTML і відповідних DTD.

Цю проблему частково покликані полегшити стилі, що каскадуються, стандарт на які прийнятий W3-консорціумом. CSS1 відокремлює стиль, що задає візуальне подання елементів, від розмітки елементів.

Великий інтерес представляє мова XML, що іде на зміну HTML як мову розмітки Web-сторінок. Це - варіант SGML, орієнтований насамперед застосування на WWW. Він не вимагає обов'язкової наявності DTD, спрощена і сама мова за рахунок складних конструкцій, що рідко використовуються. Це дозволить зробити простими аналізатори, що уможливить активне застосування XML у броузерах. (Ймовірність чогось досить велика, враховуючи реверанси обох основних гравців на полі броузерів у бік XML).


ВЕРСІЯ ДЛЯ ДРУКУ>>
Стаття прочитана:раз. markup languages) - це набір спеціальних інструкцій, які називаються тегами, призначених для формування в документах будь-якої структури та визначення відносин між різними елементами цієї структури. Тобто розмітка показує, яка частина документа є заголовком, яка підзаголовком, що слід вважати ім'ям автора і т. д. Розмітка поділяється на стилістичну розмітку, структурну та семантичну.

Стилістична розмітка

Стилістична розмітка відповідає за зовнішній вигляд документа. Наприклад, в HTML до даного типу розмітки належать такі теги як (курсив), (жирний), (підкреслення), (перекреслений текст) тощо.

Структурна розмітка

Структурна розмітка визначає структуру документа. У HTML за цей тип розмітки відповідають, наприклад, теги (параграф), (назва),

(Секція) і т.д.

Семантична розмітка

Семантична розмітка інформує зміст даних. Прикладами цього типу розмітки є теги (ім'я документа), (код, використовується для лістингів коду), (Змінна),

(Адреса автора).

Основними поняттями будь-якої мови розмітки є теги, елементи та атрибути.

Теги та елементи.

Значення понять теги та елементи часто плутають.

Теги, або, як їх ще називають, керуючі дескриптори, служать як інструкції для програми, що робить показ вмісту документа на стороні клієнта як зробити з вмістом тега. Для того, щоб виділити тег щодо основного вмісту документа використовуються кутові дужки: тег починається зі знака "менше" (<) и завершается знаком "больше" (>), всередині яких розміщуються назва інструкцій та їх параметри. Наприклад, у мові HTML тег вказує на те, що наступний за ним текст має бути виведений курсивом.

Елемент - це теги разом із змістом. Наступна конструкція є прикладом елемента:

Цей текст виділено курсивом .

Елемент складається з тега, що відкриває (у нашому прикладі це тег ), вмісту тега (у прикладі це текст "Це текст, виділений курсивом") і закриває тега(), Правда іноді в HTML, що закриває тег можна опустити.

Атрибути

Для того, щоб при визначенні елемента задати будь-які параметри, уточнюючі характеристики даного елемента використовуються атрибути.

Атрибути складаються з пари "назва" = "значення", яку можна задавати щодо елемента в початковому тегу. Зліва та праворуч від символу рівності можна залишати прогалини. Значення атрибута вказується у вигляді рядка, укладеного в одинарні або подвійні лапки.

Будь-який тег може мати атрибут, якщо визначено цей атрибут.

У разі використання атрибуту елемент набуває наступної форми:

<имя_тега атрибут = "значение"> вміст тега

Текст вирівнюється центром

В одному тезі, що відкривається, може міститися кілька атрибутів, наприклад:

Вказано розмір та колір тексту

Історія розвитку мов розмітки.

Поняття гіпертексту було введено В.Бушем у 1945 році, а, починаючи з 60-х років, почали з'являтися перші додатки, які використовують гіпертекстові дані. Проте основний розвиток дана технологія отримала, коли виникла реальна потреба у механізмі об'єднання безлічі інформаційних ресурсів, забезпечення можливості створення, перегляду нелінійного тексту.

У 1986 році ISO було затверджено універсальну стандартизовану мову розмітки (Standardized Generalized Markup Language). Ця мова призначена для створення інших мов розмітки, вона визначає допустимий набір тегів, їх атрибути та внутрішню структуру документа. Таким чином, є можливість створювати свої власні теги, пов'язані зі змістом документа. Тепер стає очевидним, що такі документи важко інтерпретувати без визначення мови розмітки, що зберігається у визначенні типу документа (DTD - Document Type Definition). У DTD згруповані всі правила мови у стандарті SGML. Іншими словами в DTD описується зв'язок тегів між собою та правила їх застосування. Причому кожного класу документів визначається свій набір правил, що описують граматику відповідної мови розмітки. Таким чином, тільки за допомогою DTD можна перевірити правильність використання тегів, отже, його потрібно надсилати разом з SGML-документом або включати в документ.

У той час окрім SGML існували ще кілька конкуруючих між собою подібних мов, проте популярність (HTML, яка є одним із його нащадків) дала SGML незаперечну перевагу перед своїми побратимами.

За допомогою SGML можна описувати структуровані дані, організовувати інформацію, що міститься в документах, представляти цю інформацію у стандартному форматі. Але через свою складність, SGML використовувався, в основному, для опису синтаксису інших мов, і деякі програми працювали з SGML-документами безпосередньо. SGML зазвичай застосовується лише великих проектах, наприклад, до створення єдиної системи документообігу великої фірми.

Мова розмітки HTML набагато простіша і зручніша, ніж SGML, його інструкції в першу чергу призначені для управління процесом виведення вмісту документа на екрані. Мова HTML як спосіб розмітки технічних документів була створена Тімом Бернерсом-Лі (Tim Berners-Lee) в 1991 спеціально для наукового співтовариства. Спочатку він був лише одним з SGML-додатків.

Не дивлячись на те, що єдине, що вміє HTML – класифікувати частини документа та забезпечувати його правильне відображення у браузері, він є найпопулярнішою мовою розмітки. Це з тим, що HTML досить легкий вивчення. Все, що від вас вимагається, – вивчити команди HTML. DTD для HTML зберігається у браузері. До того ж слід зазначити, що HTML спроектований для роботи на різних платформах. Але він має низку істотних обмежень:

  1. HTML має фіксований набір тегів, і цей набір не можна розширити чи змінити;
  2. теги мови HTML показують лише як мають бути представлені дані, тобто зовнішній вигляд документа. HTML не несе інформації про значення змісту, укладеного в тегах, структуру документа.

Термін «розмітка» походить від традиційної практики розмітки рукописів перед публікацією (тобто додавання символічних команд на полях і між рядками паперового рукопису).

Протягом багатьох століть це робили працівники видавництва (редактори та коректори), які відзначали, яким шрифтом, стилем та кеглем мають бути набрані фрагменти тексту, а потім передавали рукопис наборщикам, які вручну здійснювали набір тексту з урахуванням символів розмітки.

Мова розмітки- це набір спеціальних інструкцій, які називаються тегами (tags), що виконують такі функції:

      завдання функцій обробки виділених елементів;

      виділення логічних елементів цього документа.

Завдання функцій обробки виділених елементів

У текстових процесорах існують вбудовані команди увімкнення/вимкнення шрифтів та інше, аналогічні командам управління розміщенням інформації на екрані або під час друку. Такий підхід називається командноїабо процедурною розміткою.

Приклади процедурної розмітки

Виділення логічних елементів документа

Служить на формування у документах будь-якої структури та визначення відносин між різними елементами цієї структури без зазначення способу обробки. Така розмітка називається описової.

Змінюючи набір процедур, що відповідає описовій розмітці, можна змінити зовнішнє подання одного й того самого документа.

Описова розмітка

Основною перевагою описової розмітки є її гнучкість, оскільки фрагменти тексту відзначені як «чим вони є» (а не «як вони мають бути відображені»).

У майбутньому може бути написане програмне забезпечення для такої обробки цих фрагментів, яке навіть не передбачалося розробниками мов. Наприклад, гіперпосилання HTML, спочатку призначені для навігації користувачами по сукупності зв'язків у мережі, надалі стали використовуватися механізмами пошуку та індексування в мережі, для оцінки популярності ресурсів і так далі.

Приклади мов розмітки

Мови розмітки використовуються скрізь, де потрібно виводити форматований текст:

    в друкарні (SGML, TeX, PostScript, PDF),

    інтерфейси комп'ютерів (MicrosoftWord,OpenOffice,troff),

    Всесвітньої мережі (HTML,XHTML,XML,WML,VML,PGML,SVG,XBRL).

Теґова структура мови розмітки

Розвиток ідей описової розмітки спричинило визначення розмітки як формальної мови.

Теги мови (керуючі дескриптори) певним чином кодуються (виділяються щодо основного вмісту документа) і служать як інструкції для програми, яка показує вміст документа на стороні клієнта.

Багато сучасних мов для позначення цих команд (теги мови) використовувалися символи< и >, всередині яких розміщувалися назви інструкцій та їх параметри (HTML та XML). У SGML можна призначати інші символи для обрамлення тега (наприклад, фігурні дужки). Крім того, існують різні системи мов-підмножин, які використовуються, з меншими можливостями, наприклад, на веб-форумах і дошках оголошень використовується мова розмітки BBCode, теги якої обмежуються символами квадратних дужок: .

Тегова модель описує документ як сукупність контейнерів, кожен із яких починається і закінчується тегами. Найчастіше теги використовуються парами. Пара складається з тегів, що відкриває (start tag) і закриває (end tag).

Синтаксис тега, що відкриває:<имя_тега [атрибуты]>

Ім'я тега, що закриває, відрізняється від імені відкриває лише тим, що перед ним ставиться похила риса:

Атрибути визначають додаткові характеристики елемента. Атрибути тега записуються у такому форматі: ім'я [="значення"]. Для деяких атрибутів значення може не вказуватись. У теги, що закриває, атрибутів не буває.

Дія будь-якого парного тега починається з тега, що відкриває, і закінчується при зустрічі відповідного закриваючого тега.

Пару, що складається з тега, що відкриває і закриває, називають контейнером, а частина тексту між ними, - елементом.

Заголовок 1 рівня

Заголовок 2 рівня

Залежно від мови розмітки, що використовується, додатково можливе застосування одиночного тега і тега порожнього елемента. Назва тега визначає тип елемента.

Синтаксис одиночного тега:<имя_тега [атрибуты] />

У деяких мовах розмітки імена тегів заздалегідь визначені (HTML). За іншими не регламентуються жорстко, тобто. користувачі можуть вводити та використовувати нові теги (XML). Наприклад, тег «persona» може визначити тип цього XML елемента, як прізвище ім'я та по батькові. Іванов Іван Іванович

У SGML елементи можуть перетинатися, тобто SGML можлива така послідовність тегів:

У XML елементи мають строгу синтаксичну структуру, тобто бути суворо вкладеними один в одного і завжди закриватися:

Крім того, в SGML, HTML вони не повинні бути закритими:

Практично у всіх мовах розмітки документів значення атрибуту інтерпретується як текстове. Значення атрибута прийнято брати у лапки.

Примітка:

Документ, написаний з використанням мови розмітки, містить не тільки сам текст (як послідовність слів і розділових знаків), а й додаткову інформацію про різні його ділянки - наприклад, вказівку на заголовки, виділення, списки і т.д.

Тобто. документ є не що інше, як звичайний АSСII-файл, з доданими до нього керуючими кодами (тегами).

У системах обробки текстів у документ включається додаткова інформація, яка називається розміткою та виконує такі функції:

Виділення логічних елементів цього документа;

Завдання функції обробки виділених елементів.

У звичайних текстових процесорах існують вбудовані команди увімкнення/вимкнення шрифтів та ін., аналогічні командам управління розміщенням інформації на екрані або під час друку (так звані Escape-послідовності).Такий підхід називається командною чи процедурною розміткою (табл. 2.1).

Альтернативний спосіб розмітки полягає у виділенні частини тексту без зазначення способу обробки виділення. Потім інші команди призначають фрагментам спосіб обробки. Така розмітка називається описовою(Дескриптивний). Вона включає мітки (tags, таги)початку та закінчення елемента тексту та вказує, як інтерпретувати даний фрагмент.

Змінюючи набір процедур, що відповідає описовій розмітці, можна змінити зовнішнє подання одного й того самого документа. Розвиток ідей описової розмітки спричинило визначення розмітки як формальної мови. Це дозволяє перевірити правильність розмітки та мінімізувати її об'єм за рахунок підстановки умовчань.

Основною перевагою описової розмітки є її гнучкість, оскільки фрагменти тексту відзначені як «чим вони є» (а не «як вони мають бути відображені»), причому в майбутньому може бути написане програмне забезпечення для такої обробки цих фрагментів, яка навіть не передбачалася розробниками мов . Наприклад, гіперпосилання HTML, спочатку призначені для навігації користувачами по сукупності зв'язків у мережі, надалі стали використовуватися також механізмами пошуку та індексування у мережі, для оцінки популярності ресурсів тощо.

Описова розмітка також полегшує завдання переформатування документа за потреби, оскільки опис формату пов'язаний із змістом. Наприклад, курсивможе використовуватися або виділення тексту, або позначки іноземних (або жаргонних) слів, або інших цілей.

Однак, якщо слова просто виділені (дескриптивно або процедурно) як курсив у цій двозначності не можна повністю розібратися. Якщо ці два випадки були по-різному розмічені на самому початку, кожен може бути переформатований незалежно від інших. Родовидова (generic markup) розмітка – інше найменування для описової розмітки.

Практично елементи різних класів розміток зазвичай співіснують у конкретній системі. Наприклад, HTML містить елементи розмітки, які є процедурними (b для напівжирного шрифту), так і інші, які є описовими («blockquote», або «href», - ознака). HTML також включає елемент pre, який обмежує область тексту, яка буде розташована так, як надруковано.



Найсучасніші системи описової розмітки розглядають документи як ієрархічні структури (дерева), а також забезпечують деякі засоби для вбудованих перехресних посилань. Тому такі документи можуть трактуватися та оброблятися як бази даних, структура яких досить добре визначена (проте, оскільки вони не мають таких суворих схем, як реляційні бази даних, їх зазвичай називають «слабоструктурованими базами даних»).

З настанням ІІІ тисячоліття виник інтерес до документів неієрархічних структур. Наприклад, давня та релігійна література зазвичай має риторичну структуру чи структуру прози (оповідання, розділ, параграф тощо), а також включає довідкову інформацію (книги, розділи, строфи, рядки). Так як межі цих модулів часто перетинаються, вони не можуть бути повністю закодовані з використанням системи розмітки з деревоподібною структурою. Серед систем моделювання документів, що підтримують такі структури, - MECS, TEI Guidelines, LMNL, та CLIX.

Термін «розмітка» походить від традиційної практики розмітки рукописів перед публікацією (тобто додавання символічних команд на полях і між рядками у паперовому рукописі), протягом багатьох століть це робили працівники видавництва (редактори та коректори) які відзначали, яким шрифтом, стилем та кеглем повинні бути набрані фрагменти тексту, а потім передавали рукопис наборщикам, які здійснювали вручну набір тексту з урахуванням символів розмітки.



В даний час існує безліч мов розмітки (табл. 2.2), серед найбільш широко відомих - DocBook,

MathML, SVG, Open eBook, XBRL та ін. В основному вони призначені для представлення різних текстових документів, але спеціалізовані мови можуть використовуватися в багатьох інших областях. Безумовно, найбільш добре відома мова розмітки HTML (мова розмітки гіпертексту), одна з основ WWW (Всесвітньої павутини).

Розглянемо деякі із систем розмітки.

RUNOFF була першою системою форматування текстів, яка набула значної популярності. Вона була розроблена в 1964 для операційної системи CTSS Джеромом X. Салтзером (Jerome H. Saltzer) з використання асемблера MAD.

Продукт фактично складався з кількох програм:

TYPSET, який був переважно редактором документів;

RUNOFF – процесор виведення.

RUNOFF здійснював підтримку розбиття на сторінки та розміщення заголовків, а також вирівнювання тексту. RUNOFF - прямий попередник програми форматування документів в ОС Multics, яка у свою чергу була предком програм форматування для ОС Unix (roff та nroff), та їхніх нащадків. Він був також предком FORMAT для OS/360 IBM, і звичайно опосередковано для всіх наступних програм та систем обробки текстів. Назва, як передбачається, виходила із фрази, популярної на той час - I'll run off a copy.

ТіХ – абревіатура від τεχνη (TEXNH – techne), грецький термін для «мистецтв, ремесла, вміння», джерело для слова «технічний». Англійською вимовляється «тек» (як у слові technology).

ТіХ - набірна система, створена Дональдом Нутом (Donald Knuth). Разом з мовою METAFONT для опису шрифту та Computer Modern typeface (Комп'ютерного Сучасного шрифту) він був спроектований для двох основних цілей - по-перше, надати кожному користувачеві можливість створювати високоякісні книги в межах розумних трудовитрат, по-друге, щоб така система давала ідентичні результати на будь-яких комп'ютерах як у час, і у майбутньому. ТеХ - безкоштовне програмне забезпечення, популярне в академічному співтоваристві, особливо серед математиків, фізиків інформатиків, економістів та технічних спільнотах. Воно значною мірою конкурує з іншим популярним форматизатором ТІХ - Unix troff, і в багатьох інсталяціях Unix вони використовуються спільно.

Визнано, що ТЕХ є найкращим шляхом створення та роздрукування складних математичних формул, але тепер воно також використовується для багатьох інших набірних завдань, особливо у формі LaTeX та інших програмних засобів форматування.

Команди ТІХ зазвичай починаються зі зворотної косою межі і групуються в блоки зігнутими фігурними дужками. Однак майже всі синтаксичні властивості ТІХ можуть бути змінені при виконанні програми, що ускладнює обробку входу ТІХ іншими програмами. ТеХ - мова на основі макросів і лексем і багато команд, включаючи найчастіше визначені користувачем, розширюються при виконанні, поки не залишаться тільки лексеми, що не розширюються, які і виконуються.

Базовий варіант ТІХ включає приблизно 300 команд, названих примітивами. Однак ці команди низького рівня рідко використовуються безпосередньо користувачами, більшість функціональних можливостей забезпечується файлами формату (копії пам'яті ТІХ після того, як було завантажено великі набори макрокоманд). Початковий формат Нута (за замовчуванням), який додає приблизно 600 команд, називається Plain ТеХ. Більш широко використовуваним форматом є LaTeX, спочатку розроблений Леслі Лампортом, який включає стилі документа для книг, листів, слайдів тощо, а також додає підтримку посилань та автоматичної нумерації формул та розділів.

Інший широко використовуваний формат - AMS-TeX, розроблений Американським математичним товариством (American Mathematical Society) та передбачає додатково багато дружніх команд, які можуть бути змінені видавництвами, щоб забезпечити їхній фірмовий стиль. Більшість особливостей AMS-TeX може застосовуватися в LaTeX під час використання AMS «packages» (що називається AMS-LaTeX).

Щоб написати програму друку рядка «Programming» у Plain TeX, необхідно створити файл myfile.tex з таким змістом:

\bye% end of the file; no shown in the final output.

За умовчанням все, що слідує за знаком відсотка на рядку, - коментар, який ігнорується інтерпретатором ТеХ. Якщо виконати ТЕХ на цьому файлі (наприклад, набираючи tex myfile.tex у режимі командного рядка), то буде створено вихідний файл з ім'ям myfile.dvi, який представляє вміст сторінки незалежно від пристроїв формату (Device Independent Format - DVI). Результати можуть бути надруковані безпосередньо із засобу перегляду інтерактивної цифрової відеосистеми або перетворені на більш загальний формат, типу PostScript, використовуючи програму dvips. Такі варіанти ТЕХ, як PDFTeX, безпосередньо виробляють файли формату PDF.

Розглянемо форматування математичної формули. Наприклад, щоб написати відомий вираз для кореня квадратного рівняння, можна ввести:

У quadratic formula is $-b \pm \sqrt(b^2 - 4ac) \over 2a$ \bye

Це приведе до висновку такого тексту:

Декілька систем обробки документів засновані на ТЕХ, особливо jadeTeX, який використовує ТЕХ як внутрішній для того, щоб друкувати з виходу James Clark's DSSSL Engine, і Texinfo, обробник документації системи GNU. ТЕХ був офіційним наборним пакетом для операційної системи GNU з 1984 р .

Відомі численні розширення та супутні програми для ТЕХ, серед них BibTeX для бібліографій (поширюється спільно з LaTeX), PDFTeX, який обходить формат DVI і здійснює прямий висновок в Adobe Systems "Portable Document Format (pdf), і Omega, яка дозволяє ТЕХ використовувати набір символів Unicode Більшість розширень ТЕХ може бути отримано безкоштовно у Всебічній Мережі Архів ТЕХ (Comprehensive ТЕХ Archive Network - CTAN).

У багатьох технічних областях, таких як прикладна інформатика, математика та фізика, ТІХ став фактичним стандартом. Багато тисяч книг було видано, використовуючи ТЕХ, такими видавництвами, як Addison-Wesley, Cambridge University Press, Elsevier, Oxford University Press or Springer. Численні журнали у цих галузях зроблено з використанням ТеХ іл LaTeX, причому авторам дозволено представляти рукописи у форматі ТеХ.

Починаючи з версії 3, ТеХ використовував специфічну систему нумерації версій, де оновлення позначалися за допомогою додаткової цифри до десяткового числа так, щоб номер версії асимптотично наближався до л. Це - відображення того факту, що ТЕХ є дуже стійким і очікуються лише незначні оновлення. Поточна версія ТеХ – 3.141592; це було останнє оновлення у грудні 2002 року.

Іноді можна почути про "програмування" Web-сторінки, проте форматування тексту у вікні броузера фактично не стосується програмування. Як випливає з мов форматування, вони відносяться до мов розмітки (markup languages). Іншими словами, вони складаються з різних символів, вставлених у тіло документа, що вказують, як має виглядати файл під час друку або відображення або для визначення його логічної структури (наприклад, абзаців та маркованих списків). Якщо не використовувати мову розмітки, дані, що відображаються, є неструктурованим текстом (raw text), без форматування символів або абзаців.
Мови розмітки визначають зовнішній вигляд документа за допомогою кодів, які називаються дескрипторами або тегами (tags), які мають приблизно таку форму: . Перший дескриптор вказує точку початку форматування, а другий (з похилою) - закінчення коду. Якщо опустити другий дескриптор, кодування, яке задається першим дескриптором, застосовується до кінця документа.

Примітка:
Мова розмітки можна застосувати до неструктурованого тексту або вручну, або за допомогою текстового редактора (наприклад, Notepad), або за допомогою графічного інструменту, що додає код, коли ви візуально впорядковуєте текст на власний смак.
Початківцям простіше працювати з графічними інструментами, які не такі точні, як текстові редактори.

Мова розмітки гіпертексту (HTML)

Мова HTML (HyperText Markup Language – мова розмітки гіпертексту) – основа кодування та "становий хребет" більшості Web-сторінок. HTML дозволяє публікувати текст та малюнки, вміст електронних таблиць та навіть створювати звіти на основі баз даних для читання в інтерактивному режимі. Він чудово підходить для організації та форматування статичної інформації будь-якого типу, оскільки дозволяє:

● встановлювати розмір та шрифт тексту;
● форматувати текст жирним шрифтом, курсивом або виділяти підкресленням;
● задавати посилання на інші сторінки;
● вставляти зображення;
● створювати заголовки сторінок;
● створювати таблиці;
● вставляти метадані, необхідні для роботи машин пошуку.

Примітка:
Метаданими (metadata) називають приховані дані, які не відображаються на Web-сторінці, проте можуть бути виявлені машиною пошуку (engine search), що дозволить потрапити на цей вузол.

Використовуються дескриптори HTML трьох типів.

● Для форматування тексту або окремих символів.
● Для форматування абзаців або інших великих текстових блоків.
● Невидимі дескриптори, які забезпечують інші функціональні засоби, наприклад метадані, для пошуку.

Основна перевага HTML перед іншими мовами розмітки - приголомшлива універсальність. Поточну версію HTML підтримує практично будь-який броузер (зрозуміло, сучасний та підтримуючий графічні засоби). Це не завжди вірно для динамічного HTML (DHML), XML, Java та ActiveX. Якщо ви хочете, щоб ваші Web-вузли були доступні для броузерів різних типів, рекомендуємо використовувати HTML.

Динамічний HTML (DHML)

Динамічний HTML (Dynamic HTML - DHML) більш гнучкий порівняно з HTML.
Замість того, щоб виставляти на загальний огляд статичну веб-сторінку, ви можете використовувати DHTML і створити веб-сторінку, яку користувач зможе налаштовувати без порушення виду вихідного документа. Наприклад, сторінка, підготовлена ​​за допомогою DHTML, може містити різні елементи, які користувач зможе переміщати по сторінці, щоб перегрупувати її вміст (на власний смак). Однак при оновленні (refreshing) зображення на сторінці зміни пропадають, і вона набуває початкового вигляду.
DHTML підтримує такі засоби, що відсутні в HTML.

● Динамічні стилі.
● Точне позиціонування.
● Прив'язування даних.
● Динамічний вміст.

Вам не зрозуміло, що це таке? Не турбуйтеся – нижче наведено пояснення.

Застосування стилів до документів Web. Динамічні стилі (dynamic styles) засновані на принципах каскадування таблиць стилів (CSS — cascading style sheets), коли вони застосовуються до сторінки взагалі замість ручного форматування окремих частин сторінки.
Якщо ви працювали з сучасними текстовими процесорами, то, можливо, знайомі з таблицями стилів (style sheets), що дозволяють автоматично сформатувати текстові блоки тим чи іншим способом залежно від стилю, який ви їм задали. Форматування передбачає зміну кольору тексту, шрифту, розміщення, видимості - взагалі практично всього, що стосується реквізитів тексту. CSS (і DHTML) робить те ж саме, тільки застосовується для обробки Web-сторінок, а не для текстів.
У динамічних стилях, що реалізуються за допомогою DHTML, передбачено засоби, відсутні в текстових процесорах. Наприклад, при створенні посилань можна розмітити текст так, що його колір автоматично змінюватиметься при наведенні на нього покажчика миші або відображатиметься, коли ви проводите курсор над певною областю екрана.
Єдиний недолік цих стилів полягає в тому, що ви повинні включати таблиці стилів у більшість документів. Це трудомістка робота, особливо для тих, хто недосвідчений у роботі з таблицями стилів або займається конвертацією документів.

Розміщення тексту у потрібному місці. Ще одна перевага DHML - його здатність точно вказати місце розташування елемента на сторінці. Для вказівки положення об'єкта використовують горизонтальну (х), вертикальну (у) і навіть об'ємну (z) координати. (Визначення положення об'єкта в тривимірній системі координат дозволяє "перекривати" об'єкти.) Точне позиціонування дозволяє розташувати текст навколо зображення, а також переміщувати об'єкти в межах вікна броузера.

Примітка:
HTML без CSS не забезпечує точного розміщення об'єктів. І тут розміщення елементів визначається броузером.

Вставлення даних на сторінку. Щоб надати користувачам доступ до деякої внутрішньої інформації (back-end information), наприклад, що зберігається у базі даних, звичайні сторінки HTML мають бути пов'язані з сервером, де знаходяться вихідні дані, і потрібно запитувати дозвіл на маніпулювання цими даними. DHTML дозволяє прив'язати дані до конкретної сторінки, допускаючи роботу з прив'язаними (або точніше - пов'язаними) даними (bound data) без порушення вихідних даних і навіть без взаємодії з сервером, що їх зберігає. Для цього джерела даних вводять у сторінку (їх можна сортувати та фільтрувати так само, як і вміст будь-якої бази даних). Це не тільки знижує завантаження сервера, але також дозволяє користувачам переглядати та маніпулювати даними без надання їм доступу до джерела даних.

Створення динамічного вмісту. Таблиці стилів (style sheets) дають можливість видавцеві (publisher) Web легко змінювати зовнішній вигляд сторінки або набору сторінок.
Динамічне вміст дозволяє користувачеві Web змінювати зовнішній вигляд (подання) сторінки виконанням сценарію, щоб:

● вставляти або приховувати елементи сторінки;
● модифікувати текст;
● змінювати структуру тексту;
● переміщувати дані з внутрішніх джерел (back-end sources) та відображати їх на запит користувача.

На відміну від мови HTML, яка дозволяє змінювати вміст сторінки лише до її завантаження в броузер користувача, DHTML може сприймати зміни в будь-який час.
Динамічний вміст дає змогу забезпечити високий рівень інтерактивності, якщо використовується разом зі сценаріями, що дозволяють користувачам визначати елементи, які потрібно переглянути.

Порада:
У розділі "Організація зборів" (див. вище) згадана карта будівлі, створена на основі Web-даних, що відображає розташування конкретного офісу та портрет службовця, якого користувач намагається відшукати. Ця карта створена за допомогою DHTML-засобів мови розмітки для створення динамічного вмісту.

Розширювана мова розмітки (XML)

Мова XML (Extensible Markup Language - мова розмітки, що розширюється) не замінює HTML (принаймні, він рідко зустрічається на Web-сторінках), проте підтримує його, дозволяючи дещо підвищити універсальність Web-сторінок.
Ідея така: коли ви форматуєте сторінку за допомогою HTML, то можете змінити зовнішній вигляд тексту дескрипторами, що його форматують напівжирним шрифтом, курсивом, підкресленням, абзацами і т.д. Однак самі дескриптори практично ніяк не пов'язані зі змістом тексту, а лише з його форматуванням. Мова XML має дескриптори, що визначають зовнішній вигляд тексту. Ви можете з їх допомогою вказати, що означає цей текст (імена, адреси, назви продуктів і т.д.).
Навіщо це потрібно? Насамперед, ці метадані дозволяють машинам пошуку знайти попередньо задані елементи. Якщо ви проведете у Web-сайті вашої корпорації (створеному за допомогою мови HTML) пошук за словом "name", переглядаючи всі згадані в ньому імена, то в результаті повернеться всі екземпляри слова "name", але не самі імена. Однак якщо під час створення вузла використовувалося кодування за допомогою мови XML, в результаті буде повернено будь-який текст, який має дескриптор імені "name". По-друге, забезпечені дескриптором частини тексту можуть бути корисними, якщо вам необхідно застосувати якийсь засіб (наприклад, колір або мову) лише до окремих частин документа Web. Нехай, наприклад, інтерактивний документ є коротким оповіданням іспанською мовою з перекладом англійською. Тоді замість перемикання документа з підтримки іспанської мови на підтримку англійської можна визначити ці частини оповідання дескрипторами та застосувати правила іспанської мови тільки до цих частин, а переклади залишити англійською.
Фактично, застосування мови XML значно полегшує розробку Web-сторінки, особливо якщо деякі її частини необхідно створити як ізольовані елементи.

Взаємодія
Wi-Fi-сертифікація є гарантією того, що мережеві адаптери та точки доступу від різних виробників спільно працюватимуть без проблем, але існує кілька функцій і кон...

Терміни на літеру V
Virtual Machines – віртуальні машини. Програмне забезпечення, яке імітує роботу фізичного устрою. У Windows 98 воно використовується, щоб "обманним шляхом" змусити програму з...

Що роблять драйвери мережевих плат
Драйвери мережних плат (мережеві драйвери) відповідають за керування всіма зовнішніми зв'язками комп'ютера, в тому числі і доступом в Internet для кожної моделі мережевої плати, що використовується, необхідно встановити...

 

 

Це цікаво: