Який формат має текстовий документ? Текстові формати файлів

Який формат має текстовий документ? Текстові формати файлів

Програмне забезпечення обробки текстових та графічних даних.

Однією з найпоширеніших функцій сучасного комп'ютера є підготовка різноманітних текстових документів.

Розрізняють дві основні групи програм підготовки текстових документів: текстові редактори та текстові процесори.

Текстовими редакторами, в основному, називають програми, що створюють текстові файли без елементів форматування (тобто не дозволяють виділяти частини тексту різними шрифтами та гарнітурами). Редактори такого роду незамінні під час створення текстів комп'ютерних програм.

Текстові процесоривміють форматувати текст, вставляти в документ графіку та інші об'єкти, які не належать до класичного поняття "текст". Слід зазначити умовність такого поділу - різноманітність програм обробки тексту дозволяє знайти редактор з будь-яким набором функцій.

Деякі текстові процесори є так званими редакторами WYSIWYG. Назву отримано за першими буквами фрази What You See Is What You Get - те, що ти бачиш, є те, що ти отримаєш. Коли кажуть, що це WYSIWYG-редактор, гарантують повну відповідність зовнішнього вигляду документа на екрані комп'ютера та його друкованої копії. До редакторів такого типу відносяться Word та StarWriter.

Деякі сучасні редактори підтримують концепцію "майже" WYSIWYG. Вигляд документа на екрані при цьому трохи відрізняється від того, як виглядатиме надрукований документ, але робиться це спеціально з метою ефективнішого використання робочого вікна документа. Прикладами "майже" WYSIWYG-редакторів є Netscape Composer та KLyX.

Формати текстових файлів

Текстові файли- Найпоширеніший тип даних у комп'ютерному світі. Існує кілька проблем, пов'язаних з текстовими файлами. Перша – надзвичайно велика кількість символів, потрібних для підтримки різних мов. Американські програмісти для роботи зі 128 символами використовують набір символів US ASCII (американський стандартний код обміну інформацією). Для підтримки інших мов часто-густо не вистачає і 256 символів, тому зараз здійснюється поступовий перехід до кодування Unicode, в якій для зберігання одного символу відводиться вже два байти (тобто є можливість закодувати 65 536 різних символів).

Друга проблема полягає в тому, що люди хочуть, щоб документи, що роздруковуються, містили графіки, діаграми, примітки, заголовки і щоб при цьому використовувалися різні шрифти. Документи, що розповсюджуються в Інтернет (онлайнові документи), можуть містити мультиплікацію, посилання на різні мережеві ресурси та звуковий супровід.

Багато текстові файли передаються як простого тексту (plain text). Простий текст складно зробити привабливим і легко читати, тому що в ньому немає шрифтів різних накреслень, графіки, заголовків, підзаголовків і т. д. Ці додаткові особливості звуться розмітки тексту (markup).

Говорячи про розмітку тексту, виділяють поняття фізичної та логічної розмітки. З використанням фізичної розмітки тексту вказується точний вигляд кожного фрагмента. Наприклад, "центрований текст, 14-м кеглем, жирний, гарнітура Times". При логічній розмітці вказується логічне значення даного фрагмента, наприклад, це заголовок глави. Ці два способи розмітки призначаються, як правило, для використання в різних ситуаціях. Щоб роздрукувати текст на принтері, потрібно використовувати фізичну розмітку. Повинні бути прийняті рішення про розмір полів та абзацні відступи. Ранні версіїтекстових процесорів використовували лише фізичний тип розмітки. При цьому для кожного фрагмента вказувався шрифт, розмір та стиль.

Під час обміну інформацією з іншими людьми фізичне оформлення тексту накладає низку обмежень, особливо для онлайнових документів. Розмір екрана, роздільна здатність, шрифти різні для різних систем. З цих причин дедалі частіше використовується логічне оформлення тексту. У деяких випадках логічне оформлення практично необхідне: під час створення електронних документівтипу сторінок WWW або під час створення та публікації об'ємних праць, таких як книги.

Для збереження розмітки документів під час передачі текстової інформації від машини до машини застосовують різні способи. Текстові процесори та видавничі системи використовують спеціально розроблені формати файлів, що містять не лише текст, а й інформацію про те, як він має бути оформлений. Основна проблема тут у несумісності таких форматів, хоча найскладніші програми зазвичай можуть читати файли у форматах програм-конкурентів. Прикладами такого підходу є текстові процесори Word та StarWriter.

За іншого підходу безпосередньо до тексту документа вставляються спеціальні команди розмітки. Навіть якщо у вас немає програмного забезпечення, що підтримує такий формат, ви все ж таки зумієте в ньому розібратися. Існує чимало способів подібного представлення розмітки тексту, зокрема:

HyperText Markup Language (HTML), що використовується в World Wide Web;

TeX і LaTeX, що користуються популярністю у багатьох академічних видань, а також математиків, фізиків, хіміків і навіть музикантів.

Прикладами програм, які дозволяють розмітити текст подібним чином, є Netscape Composer і LyX (KLyX).

Файли, створені різними редакторами, мають унікальні розширення, що дозволяють, не заглядаючи всередину документа, здогадатися про способи розмітки тексту. Так, файли, створені редакторами підготовки plain-тексту, часто мають розширення .txt, а підготовлені в редакторі Lyx - .lyx. Текстовий процесор Word за замовчуванням створює файли у форматі MS Word (розширення.doc), але підтримує інші формати, наприклад RTF (расширение.rtf). Документи, що містять команди розмітки HTML, мають розширення.html або.htm.

Очевидно, що неможливо перерахувати всі текстові редактори. Багато хто з них "заточений" під ту чи іншу специфічну діяльність. У списку, розглянутому нижче, представлено лише невелику частину текстових редакторів.

Редактори неформатованих текстів

NotePad - вбудований в операційну систему Windows, зрозумілий і простий у використанні;

McEdit - має схожість з редактором Edit із MS DOS, компонента файлового менеджера mc (Midnight Commander) ОС Linux;

KEdit - найпростіший текстовий редактор, що входить до складу KDE Linux;

KWrite - текстовий редактор, що має низку додаткових налаштувань у порівнянні з іншими найпростішими текстовими редакторами;

Emacs - поєднує у собі функції файлового менеджера та текстового редактора; одною з відмінних рисє можливість створення макрокоманд (макросів); є у всіх клонах Unix, у тому числі Linux; Emacs можна використовувати й у MS Windows.

Редактори, які створюють текст із елементами розмітки

Word - служить до створення різноманітних друкованих документів, є компонентом офісних додатків у MS Windows;

StarWriter – входить до складу програми StarOffice, зовнішнім виглядомі функціональністю він нагадує Word, однаково добре працює як і MS Windows, і у ОС Linux;

LyX (KLyX в KDE) - сучасний текстовий редактор, призначений для людей, які хочуть отримати документ, що виглядає професійно, але витратити на його створення мінімум часу; редактор вставляє текст команди розмітки TeX і LaTeX;

Netscape Composer - вставляє у текст команди розмітки мови HTML, існують версії як ОС Linux, так MS Windows.

При обробці інформації, пов'язаної із зображенням на моніторі, прийнято виділяти три основних напрямки: розпізнавання образів, обробку зображень та машинну графіку.

Основне завдання розпізнавання образов полягає в перетворенні вже наявного зображення формально зрозумілою мовою символів. Розпізнавання образів або система технічного зору (COMPUTER VISION) - це сукупність методів, що дозволяють одержати опис зображення, поданого на вхід, або віднести задане зображення до деякого класу (так роблять, наприклад, при сортуванні пошти). Одним із завдань COMPUTER VISION є так звана скелетизація об'єктів, при якій відновлюється якась основа об'єкта, його «скелет».

Обробка зображень(IMAGE PROCESSING) розглядає завдання у яких і вхідні та вихідні дані є зображеннями. Наприклад, передача зображення з усуненням шумів та стисненням даних, перехід від одного виду зображення до іншого (від кольорового до чорно-білого) тощо. Таким чином, під обробкою зображень розуміють діяльність над зображеннями (перетворення зображень). Завданням обробки зображень може бути як покращення залежно від певного критерію (реставрація, відновлення), так і спеціальне перетворення, що кардинально змінює зображення.

При обробці зображень є такі групи задач:

Обмежимося роботою лише з цифровим зображенням. Цифрові перетворення за метою перетворення можна розділити на два типи:

Реставрація зображення – компенсація наявного спотворення (наприклад, погані умови фотозйомки);

Покращення зображення - це спотворення зображення з метою покращення візуального сприйняття або перетворення на форму, зручну для подальшої обробки.

Комп'ютерна (машинна) графіка(COMPUTER GRAPHICS) відтворює зображення у випадку, коли вихідною є інформація про невиразну природу. Наприклад, візуалізація експериментальних даних як графіків, гістограм чи діаграм, виведення інформації на екран комп'ютерних ігор, синтез сцен на тренажерах.

Комп'ютерна графіка нині сформувалася як наука про апаратне та програмне забезпечення для різноманітних зображень від простих креслень до реалістичних образів природних об'єктів. Комп'ютерна графіка використовується майже у всіх наукових та інженерних дисциплінах для наочності та сприйняття, передачі інформації. Застосовується в медицині, рекламному бізнесі, індустрії розваг і т.д. комп'ютерної графікине обходиться жодна сучасна програма. p align="justify"> Робота над графікою займає до 90% робочого часу програмістських колективів, що випускають програми масового застосування.

Кінцевим продуктом комп'ютерної графіки є зображення.Це зображення може використовуватися в різних сферах, наприклад, воно може бути технічним кресленням, ілюстрацією із зображенням деталі в посібнику з експлуатації, простою діаграмою, архітектурним виглядом передбачуваної конструкції або проектним завданням, рекламною ілюстрацією або кадром з мультфільму.

Комп'ютерна графіка - це наука, предметом вивчення якої є створення, зберігання та обробка моделей та його зображень з допомогою ЕОМ, тобто. це розділ інформатики, який займається проблемами отримання різних зображень (малюнки, креслення, мультиплікації) на комп'ютері.

У комп'ютерній графіці розглядаються такі завдання:

Подання зображення у комп'ютерній графіці;

Підготовка зображення до візуалізації;

Створення зображення;

Здійснення дій із зображенням.

Під комп'ютерною графікою зазвичай розуміють автоматизацію процесів підготовки, перетворення, зберігання та відтворення графічної інформації за допомогою комп'ютера. Під графічною інформацією розуміються моделі об'єктів та його зображення.

Якщо користувач може управляти характеристиками об'єктів, то говорять про інтерактивної комп'ютерної графіки, тобто. здатність комп'ютерної системи створювати графіку та вести діалог із людиною. Нині майже будь-яку програму вважатимуться системою інтерактивної комп'ютерної графіки.

Інтерактивна комп'ютерна графіка- це так само використання комп'ютерів для підготовки та відтворення зображень, але при цьому користувач має можливість оперативно вносити зміни в зображення безпосередньо в процесі відтворення, тобто. передбачається можливість роботи з графікою у режимі діалогу у реальному масштабі часу.

Інтерактивна графіка є важливим розділом комп'ютерної графіки, коли користувач має можливість динамічно керувати вмістом зображення, його формою, розміром і кольором на поверхні дисплея за допомогою інтерактивних пристроїв керування.

Історично першими інтерактивними системами вважаються системи автоматизованого проектування (САПР), що виникли у 60-х роках. Вони є значним етапом в еволюції комп'ютерів та програмного забезпечення. У системі інтерактивної комп'ютерної графіки користувач сприймає на дисплеї зображення, що представляє деякий складний об'єкт, і може змінювати опис (модель) об'єкта. Такими змінами можуть бути як введення та редагування окремих елементів, так і завдання числових значень для будь-яких параметрів, а також інші операції із введення інформації на основі сприйняття зображень.

Растрова графіка, загальні відомості

Комп'ютерне растрове зображення представляється як прямокутної матриці, кожна осередок якої представлена ​​кольоровою точкою.

Основою растрового представлення графіки є піксель(точка) із зазначенням її кольору. При описі, наприклад, червоного еліпса на білому тлі, необхідно вказати колір кожної точки еліпса і фону. Зображення представляється як великої кількості точок - що їх більше, тим візуально якісніше зображення і більше розмір файла. Тобто. одна і навіть картинка може бути представлена ​​з кращою або найгіршою якістю відповідно до кількості точок на одиницю довжини - роздільною здатністю (зазвичай, точок на дюйм - dpi або пікселів на дюйм - ppi).

Растрові зображення нагадують аркуш картатого паперу, у якому будь-яка клітина зафарбована або чорним, або білим кольором, створюючи разом малюнок. Піксел – основний елемент растрових зображень. Саме таких елементів складається растрове зображення, тобто. растрова графікаописує зображення з використанням кольорових точок (пікселі), розміщених на сітці.

У разі редагування растрової графіки Ви редагуєте пікселі, а не лінії. Растрова графіка залежить від роздільної здатності, оскільки інформація, що описує зображення, прикріплена до сітки певного розміру. При редагуванні растрової графіки якість її подання може змінитися. Зокрема, зміна розмірів растрової графіки може призвести до «розкушування» країв зображення, оскільки пікселі будуть перерозподілятися на сітці. Виведення растрової графіки на пристрої з нижчою роздільною здатністю, ніж роздільна здатність самого зображення, зменшить його якість.

Крім того, якість характеризується ще й кількістю кольорів та відтінків, які може набувати кожна точка зображення. Чим більшою кількістю відтінків характеризується зображення, тим більше розрядів потрібно їх описи. Червоний може бути кольором номер 001, а може і - 00000001. Таким чином, чим якісніше зображення, тим більший розмір файлу.

Растрове подання зазвичай використовують для зображень фотографічного типу з великою кількістю деталей або відтінків. На жаль, масштабування таких картинок у будь-який бік зазвичай погіршує якість. При зменшенні кількості точок губляться дрібні деталі і деформуються написи (щоправда, це може бути помітно при зменшенні візуальних розмірів самої картинки - тобто. збереженні дозволу). Додавання пікселів призводить до погіршення різкості та яскравості зображення, т.к. новим точкам доводиться давати відтінки, середні між двома і більше квітами, що межують.

За допомогою растрової графіки можна відобразити та передати всю гаму відтінків та тонких ефектів, властивих реальному зображенню. Растрове зображення ближче до фотографії, воно дозволяє більш точно відтворювати основні характеристики: освітленість, прозорість і глибину різкості.

Найчастіше растрові зображення отримують за допомогою сканування фотографій та інших зображень, за допомогою цифрової фотокамери або "захоплення" кадру відеозйомки. Растрові зображення можна отримати безпосередньо в програмах растрової або векторної графіки шляхом перетворення векторних зображень.

Поширені формати .tif, .gif, .jpg, .png, .bmp, .pcx та ін.

Векторна графіка, загальні відомості

Векторна графіка описує зображення з використанням прямих та вигнутих ліній, званих векторами, а також параметрів, що описують кольори та розташування. Наприклад, зображення деревного листа (див. рис. 1.) описується точками, якими проходить лінія, створюючи цим контур листа. Колір листа визначається кольором контуру та області всередині цього контуру.

На відміну від растрової графіки у векторній графіці зображення будується за допомогою математичних описів об'єктів, кіл та ліній. Хоча на перший погляд це може здатися складніше, ніж використання растрових масивів, але для деяких видів зображень використання математичних описів є більш простим способом.

Ключовим моментом векторної графіки є те, що вона використовує комбінацію комп'ютерних команд та математичних формул для об'єкта. Це дозволяє комп'ютерним пристроям обчислювати та поміщати у потрібному місці реальні точки при малюванні цих об'єктів. Така особливість векторної графіки дає їй ряд переваг перед растрової графікою, але водночас причиною її недоліків.

Векторну графіку часто називають об'єктно-орієнтованою графікоюабо креслярською графікою. Прості об'єкти, такі як кола, лінії, сфери, куби тощо називається примітивами, і використовуються при створенні складніших об'єктів. У векторній графіці об'єкти створюються шляхом поєднання різних об'єктів.

Для створення векторних малюнків необхідно використовувати один із численних ілюстраційних пакетів. Перевага векторної графіки в тому, що опис є простим і займає мало пам'яті комп'ютера. Однак недоліком є ​​те, що детальний векторний об'єкт може бути занадто складним, він може надрукуватися не в тому вигляді, в якому очікує користувач або не надрукується взагалі, якщо принтер неправильно інтерпретує або не розуміє векторні команди.

У разі редагування елементів векторної графіки змінюються параметри прямих та вигнутих ліній, що описують форму цих елементів. Можна переносити елементи, змінювати їх розмір, форму і колір, але це не вплине на якість їх візуального представлення. Векторна графіка залежить від дозволу, тобто. може бути показана у різноманітних вихідних пристроях з різною роздільною здатністю без втрати якості.

Векторне уявлення полягає в описі елементів зображення математичними кривими із зазначенням їх кольорів та заповнюваності.

Ще одна перевага – якісне масштабування в будь-який бік. Збільшення чи зменшення об'єктів здійснюється збільшенням чи зменшенням відповідних коефіцієнтів у математичних формулах. На жаль, векторний формат стає невигідним під час передачі зображень з великою кількістю відтінків або дрібних деталей (наприклад, фотографій). Адже кожен найменший відблиск у цьому випадку буде не сукупністю одноколірних точок, а найскладнішою математичною формулою або сукупністю графічних примітивів, кожен з яких є формулою. Це призводить до обтяження файлу. Крім того, переведення зображення з растрового у векторний формат (наприклад, програмою Adobe Strime Line або Corel OCR-TRACE) призводить до спадкування останнім неможливості коректного масштабування у велику сторону. Від збільшення лінійних розмірів кількість деталей чи відтінків на одиницю площі не стає. Це обмеження накладається роздільною здатністю вступних пристроїв (сканерів, цифрових фотокамер та ін.).

Елементи (об'єкти) векторної графіки. Об'єкти та їх атрибути

Основним логічним елементом векторної графіки є геометричний об'єкт. Як об'єкт приймаються прості геометричні фігури (так звані примітиви - прямокутник, коло, еліпс, лінія), складові фігури або фігури, побудовані з примітивів, заливки кольорів, у тому числі градієнти.

Важливим об'єктом векторної графіки є сплайн. Сплайн - це крива, з якої описується та чи інша геометрична фігура. На сплайнах побудовані сучасні шрифти TryeType та PostScript.

Об'єкти векторної графіки легко трансформуються і модифікуються, що практично ніякого впливу якість зображення. Масштабування, поворот, викривлення можуть бути зведені до пари-трійки елементарних перетвореньнад векторами.

Якщо растровой графіці базовим елементом зображення є точка, то векторної графіці - лінія. Лінія описується математично як єдиний об'єкт, тому обсяг даних для відображення об'єкта засобами векторної графіки істотно менше, ніж у растрової графіці.

Лінія – елементарний об'єкт векторної графіки. Як і будь-який об'єкт, лінія має властивості: форму (пряму, криву), товщину, колір, накреслення (суцільну, пунктирну). Замкнуті лінії набувають властивості заповнення. Простір, що охоплюється ними, може бути заповнений іншими об'єктами (тектури, карти) або вибраним кольором. Найпростіша незамкнена лінія обмежена двома точками, іменованими вузлами. Вузли мають властивості, параметри яких впливають на форму кінця лінії і характер сполучення з іншими об'єктами. Інші об'єкти векторної графіки складаються з ліній. Наприклад, куб можна скласти із шести пов'язаних прямокутників, кожен з яких, у свою чергу, утворений чотирма зв'язаними лініями.

Набір правил, за якими зберігаються дані файлу, називається форматом файла. Різні типифайли, такі як текстові файли, растрова графіка тощо, використовують різні формати. У випадку для одного типу файлів може бути визначено кілька різних форматів, хоча часто під типом файлу і форматом розуміють те саме. Формат файлу визначається розширенням імені файлу, яке додається до імені файлу при його збереженні в певному форматі, наприклад, DOC, GIF і т.д.

Як правило, формати файлів створюються для використання в певній прикладній програмі. Наприклад, графічні об'єкти, створювані у відомому пакеті векторної графіки CorelDRAW, зберігаються як файли з розширенням CDR, а зображення, що формуються іншим графічним пакетом, CorelXara записуються на диск як файли з розширенням XAR. Деякі формати не пов'язуються з конкретними програмами, тобто є універсальними. Одним із найбільш відомих універсальних форматів є формат TXT (формат текстових файлів DOS).

Часто використовують стиск комп'ютерних файлівдля економії місця на носії. Існує багато способів стиснення файлів. Ці методи залежать від вихідного формату файлів. Як правило, чим вищий ступінь стиснення, тим повільніше виконуються операції читання та запису.

Що стосується алгоритмів стиснення, то є як алгоритми стиснення без втрати даних, так і алгоритми, при використанні яких можлива втрата даних.



Стиснення без втрат гарантує, що всі дані, які були у файлі до стиснення, будуть присутні і після розпакування файлу. Механізми стиснення без втрат використовуються при збереженні тексту або числових даних, наприклад, електронних таблиць або файлів документів. Прикладами алгоритмів стиснення без втрат можуть бути загальновідомі алгоритми ZIP, ARJ, та інші.

Дамо короткий опис основних форматів:

§ American Standard Code for Information Interchange ASCII (TXT). Формат текстових файлів розроблений Американським інститутом стандартів (American National Standards Institute). Підтримується всіма операційними системами та всіма програмами. Є текстовим файлом в DOS-кодуванні, немає функції вставити малюнок, немає форматування, працює у всіх машинах, можливо створити тільки файли малого обсягу.

§ ANSI (TXT). Формат текстових файлів у кодуванні ANSI (для кодової сторінки Microsoft Windows)

§ MsWord для DOS, Windows (.DOС). Формат документів, розроблений корпорацією Microsoft, підтримується програмами для MS-DOS та більшістю текстових процесорів. Він зберігає вихідне форматування документів, а також стилі зображення символів. Крім текстової інформації, файли цього формату можуть містити графічні зображення з різними параметрами. Підтримує 256 кольорів. Не підтримує стиснення. Використовується в основному для обміну форматованими текстовими даними між різними платформами та програмами.

§ Hypertext Markup Language HTML (HTM, HTML). Мова розмітки гіпертекстових документів. Всі сторінки, розташовані в Інтернеті, створені з використанням цієї спеціальної мови. HTML-документи є ASCII-файли, доступні для перегляду та редагування в будь-якому текстовому редакторі. Відмінністю від звичайного текстового файлу є те, що в HTML-документах є спеціальні команди-теги, які визначають правило форматування документа. Якщо вам вдалося освоїти мова HTML, Ви можете створити сторінки для Internet. Додаючи теги (мітки) до звичайного тексту, ви змушуєте програму перегляду відображати цей текст певним чином та розміщувати на сторінці зображення. Якщо ви вивчили Java і JavaScript, знаєте, як розширити можливості HTML, поміщаючи всередині тегів команди, написані мовою сценаріїв.

§ Portable Document Format PDF (.PDF). Цей формат зберігання документів, розроблений Adobe, претендує на роль відкритого друкарського стандарту для Web. Він сприймається як альтернатива HTML. Недоліком HTML є те, що документи, перекладені HTML, зазвичай не зберігають початковий формат, причому HTML пропонує при перегляді дуже обмежену кількість гарнітур. Навпаки, користувачі Acrobat та PDF-інструментарію для створення, розповсюдження та перегляду документів у початковому форматі, знають, що читачі побачать публікацію саме такою, якою вона була зроблена. Формат PDF незамінний, якщо потрібно отримати точну копію документа. Як приклад успішного застосування PDF для документів на російській мові наведемо сервер "Московських новин" в Internet. Представлені на ньому в електронному вигляді матеріали повністю повторюють паперовий оригінал, надрукований друкарським способом.

§ Standard Generalized Markup Language (SGML). Розвиток HTML перекладається як стандартна мова узагальненої розмітки. Є інструментальним набором механізмів створення структурованих документів, розмічених за допомогою дескрипторів (tags). У порівнянні з HTML він забезпечує більш гнучкі та різнобічні можливості форматування в Web. Однак SGML відрізняється і підвищеною швидкістю, тому як простіший засіб застосовується PDF. Могутність SGML полягає у його міжплатформному структурному підході до опису змісту документів. SGML є власне метамовою, тобто. призначений для опису мов розмітки, які застосовуються під час створення документів.

З текстовими файлами (документами) ми стикаємося майже щодня. Однак у цьому питанні не слід плутати розширення текстового файлу та текстовий формат даних, це різні речі. Спробуємо визначитися, що являють собою файли такого типу, і якими вони бувають.

Розширення текстового файлу: що таке?

Почнемо з того, що зазвичай більшість файлів такого типу мають розширення у вигляді трьох літер після роздільника (точки). Найпростіший і найбільш часто зустрічається тип - це файли з розширенням. системах Windowsза допомогою стандартного блокноту.

Однак, незважаючи на загальноприйняті правила, розширення файлів текстових документів можуть містити не три літери, а більше (їх число може досягати дванадцяти, але не більше), наприклад файли електронних книг.djvu. Крім того, у розширенні можуть бути цифри.

Що дає нам розгляд класифікації текстового файлу (документу) щодо їх ідентифікації? А те, що один погляд дозволяє миттєво вирішити важливе питання: яке розширення мають текстові файли, така й програма, зіставлена ​​їм для відкриття чи редагування. Тут же у багатьох випадках майже завжди можна визначити початкову програму, в якій такий файл був створений.


Однак не варто забувати, що сьогодні можна зустріти досить велику кількість файлів з однаковими розширеннями, але створені в інших програмах або зіставлені різним програмам. Здавалося б, звичайний файл із розширенням.doc (.docx) спочатку відповідає текстовому редактору Microsoft Word. Але відкрити його або зберегти в такому вигляді можна і в іншому навіть на «яблучних» комп'ютерах. Сюди можна віднести і, так би мовити, змішаний тип - файли формату.pdf, що містять вже не тільки текст, а й графіку. Але ж і документи Wordможуть містити вставлені зображення.

Саме це і є показником того, що розширення текстового файлу свідчить про універсальність самого формату, який є найбільш «читабельним» незалежно навіть від застосовуваної операційної системи. Те саме стосується і будь-якого типу.

Типи розширення файлів: текстові

Взагалі, на сьогодні відомо таку величезну кількість текстових форматів та їх розширень, що, напевно, практично жоден фахівець не візьметься порахувати їхню повну кількість.


Так, звичайно, універсальність таких документів не викликає сумнівів, особливо якщо в них використовується найпростіша. Але іноді проблема може полягати в тому, що не всяке кодування підтримується певною системою або програмою. Саме тому на екрані замість звичних літер з'являється набір символів.

Що ж до різновидів текстових файлів, їх все й не перелічиш. Найбільш поширеними є такі: .txt, .doc, .tex, .text, .pdf, .log, .apt, .ttf, .err, .sub, .djvu, .odt, .rtf та багато інших. Цей список можна продовжувати до безкінечності.

Що найцікавіше, багатьом файлам в системі відводиться різна роль. Наприклад, крім звичайного файлу субтитрів.sub, їх перегляд при відкритті відео може відповідати звичайний текстовий документ.txt, й у відношенні багато формати взаємозамінні.


Зауважте, що навіть виконувані файли можуть мати текст як вміст. Найпростіший приклад- файл.bat, створюваний у звичайному «Блокноті» і містить текст як набору команд. При запуску відбувається виконання команд, а редагування використовується меню «Відкрити з допомогою…», якщо спочатку цьому процесу не зіставлено інше действие.


Подібна ситуація спостерігається і з документами, що використовують розмітку або мови програмування, скажімо, файли .html, .htm, .xml і т.д. Навіть веб-сторінки можна в багатьох редакторах відкрити спочатку як текстові файли, що містять інші елементи.

Зміна розширень текстових файлів

Що ж до зміни розширення, іноді його можна змінити, наприклад, .txt в.doc і назад. Редактор Word відкриє будь-який тип. Те саме стосується пари.txt - .bat при відкритті в «Блокноті». Але в інших випадках краще такі маніпуляції не робити, це просто ні до чого не приведе, і інша програма перейменований файл відкрити не зможе. Зміну формату доведеться проводити за допомогою спеціальних програм-конверторів.

Замість післямови

Як відомо, розширення текстового файлу може мати безліч варіацій, залежно від цього, який саме програмі було створено документ. Зате, як і в інших випадках, по самому розширенню практично завжди можна визначити спочатку йому зіставлений додаток, у крайньому випадку відкрити будь-якою іншою програмою, що підтримує роботу з таким типом даних, навіть якщо оригінальна програма на комп'ютері відсутня. І як уже, напевно, зрозуміло, саме текстові файли, по суті, є в комп'ютерному світі найпоширенішими та універсальними, незалежно від програмних пакетів та операційних систем, що використовуються.

Кожен користувач ПК постійно стикається з різними форматами текстових файлів, але навряд чи замислюється про те, наскільки багата історія цих форматів і програм, які подарували людині можливість читати книги, працювати з текстом і створювати всю необхідну документацію прямо на комп'ютері.

Історія текстових файлів не набагато молодша за самих персональних комп'ютерів- вже їхні шедеври були написані у перших аналогах сучасного блокноту. Тож які бувають формати текстових файлів та програми для роботи з ними? Для початку потрібно зрозуміти, навіщо потрібні текстові файли, які між ними відмінності і що вони спільного. Об'єднує всі текстові формати їх основне завдання - збереження текстової інформації. Розрізняються вони можливостями обробки і доступом до інформації, що зберігається у файлах, у плані сумісності з іншими програмами.

Найпростішим текстовим форматом зазвичай є формат TXT. Він же найскромніший і найстаріший текстовий формат. Завдяки своїй простоті (можливості TXT обмежуються набором тексту та розбивкою його на абзаци), саме цей формат часто використовується величезною кількістю додатків та програм на різних платформах.

З розповсюдженням персональних комп'ютерів та збільшенням їх продажів компанія Microsoft створює ще один популярний формат, який отримав назву Rich Text Format (або просто RTF). Він є текстом, який розмічений за допомогою певних «керуючих слів», що дозволяють не тільки виробляти, а й зберігати складні елементи форматування та вставляти в текст формули, таблиці, малюнки, колонтитули та виноски.

Однак RTF досить сильно поступається у можливостях формату DOC, також створеному компанією Microsoftспеціально для пакета програм під назвою Microsoft Office. Створений понад п'ятнадцять років тому DOC включає величезну кількість можливостей для форматування та обробки тексту, створення, редагування та розміщення зображень, діаграм, таблиць та інших елементів. Слід зазначити, що коректно ці функції працюватимуть лише у програмі MS Word. Це пов'язано в першу чергу з тим, що Microsoft не має поточних специфікацій формату DOC і не дає своїм конкурентам та незалежним розробникам використовувати можливості цього формату повною мірою. Саме цей факт і є однією з основних причин того, що, крім формату DOC, у наш час широко використовуються й інші формати текстових файлів.

Головною відмінністю формату DOC від текстових і TXT служить його бінарність, через яку він стає нечитабельним у таких найпростіших як Wordpad, Lexicon, Atlantis. Більш того, в деяких випадках можна спостерігати і несумісність файлів DOC, створених у різних версіях програми MS Word.

Формати текстових файлів відкривати і редагувати можна у великій кількості програм. Крім раніше згаданого MS Word, найпоширенішими є StarOffice, що випускається компанією Sun Microsystems, WordPerfect від Corel і безкоштовний пакет OpenOffice.org.

З поширенням електронних пристроїв-читалок популярність набирають інші формати текстових файлів, наприклад, FB2 і LRF.

Для того, щоб отримати можливість використання різних текстових форматів на різних платформах, створено велику кількість програм, які називаються конверторами. Конвертори текстових файлів дозволяють зберігати вихідний текст з одного формату в інший і використовувати його надалі різних пристрояхта платформах.

Конвертори застосовуються не тільки для збереження тексту з одного в інший формат, але й для створення файлів, які, на відміну від їх вихідних джерел, можна використовувати на пристроях, які не здатні прочитати оригінальні файли. Наприклад, деякі електронні книги, які не підтримують популярні формати текстових файлів, здатні запросто розпізнавати формати LRF або FB2, отримані з вихідних файлівза допомогою програм-конверторів.


Для чого вам текст?

Сьогодні існує три найпоширеніші текстові формати – TXT, RTF та DOC. У чому їхня відмінність і що їх об'єднує? Загальне вони одне: всі вони зберігають текстову інформацію. Відмінність полягає в тому, які можливості форматування та обробки тексту вони надають, а також – наскільки доступна інформація, що зберігається в них щодо сумісності програм.

Найпростіший текстовий формат

Найстаріший і найскромніший за можливостями формат. Все, що можна робити з текстом у цьому форматі – це власне вводити текст і зберігати розбиття на абзаци. Ця простота в певних ситуаціях набуває важливості універсальності та прозорості: TXT легко доступний для читання в різних додатках та на різних платформах. Крім того, багато програм, що навіть не мають своїм безпосереднім завданням роботу з текстом, вміють зберігати текст у форматі TXT.

TXT-процесори

З DOS-івських часів багато хто пам'ятає текстовий процесор Lexicon, який умів обробляти TXT-формат на досить високому рівні. Сьогодні основним інструментом для роботи з TXT є стандартний Блокнот Windows. Той, кому його функцій здається недостатньо, завжди може знайти собі редактор за смаком та потребами у всесвітньому павутинні, у тому числі безкоштовно. Наприклад, використовуючи freeware-програму Vega Костянтина Шереметьєва, ви навряд чи побачите повідомлення про те, що текстовий файл, що відкривається, занадто великий; як запевняє автор, Vega версії 2.04 відкриває файли об'ємом до 2 Gb (!), а сама програма займає при цьому всього 9,5 kb (порівняйте, Блокнот у Windows XP «важить» близько 65 kb); при цьому Vega навіть зручніша за Блокнот і не вимагає установки. А ось інший зразок можливостей опрацювання «простого тексту». Текст, який ви читаєте, було набрано у процесорі UltraEdit від IDM Computer Solutions. Його сильна сторона – спеціальне відображення та обробка синтаксису мов програмування, але і з найпростішим текстом він може творити дива. Поціновувачам зручних русифікованих програм, ергономічних і, головне, «знають толк» у специфіці кириличних кодувань, варто познайомитися з програмою Патріот.

Форматування та універсальність

Rich Text Format – так розшифровується абревіатура, що стоїть у назві формату, створеного корпорацією Microsoft. RTF являє собою текст, розмічений за допомогою спеціальних «керуючих слів», що дозволяє робити і зберігати досить складне форматування, вставляти виноски, колонтитули, малюнки, таблиці та формули, хоча в обробці цих додаткових об'єктів RTF поступається формату DOC. Поступається він DOC і обсяг файлів: використання для форматування тексту «керуючих слів» замість стильової таблиці не призводить до компактності. Проте, RTF виграє суперечку з DOC щодо безпеки, т.к. його внутрішня організація передбачає зберігання макрокоду і, отже, невразлива до макровирусам.

RTF-процесори

RTF використовується як основний або підтримуваний формат у багатьох, якщо не в більшості програм обробки тексту. Хорошим інструментом може бути, наприклад, Hieroglyph Михайла Морозова. У програмі реалізована як перевірка правопису російської, а й функція автоматичної зміни мовної розкладки клавіатури. Текстовий процесор Atlantis від Rising Sun Solutions, що існує як у комерційній, так і в безкоштовній версіях, напевно влаштує багатьох користувачів продуманістю інтерфейсу, наявністю великої кількості швидких клавіш, змінною інструментальною панеллю та ін. функціями. З RTF вміє працювати і вже згадуваний редактор Patriot.

Найбільший текстовий формат

У формат DOC включені найширші можливості обробки та форматування тексту, включаючи створення виносок та коментарів, а також можливості створення, розміщення та редагування таблиць, діаграм, зображень та інших елементів. Правда, в повному обсязі і найбільш коректно всі ці можливості реалізовані тільки в MS Word, чому сприяє позиція Microsoft, яка не розкриває поточні специфікації популярного формату. Незважаючи на те, що DOC "розуміють" та інші програми, їх виробникам не завжди вдається забезпечити його коректне розпізнавання. На відміну від TXT і RTF, DOC є бінарним форматом, що робить його нечитабельним у простих текстових редакторах і, більше, не забезпечує повної сумісності його власних версій.

DOC-процесори

Основним і, зважаючи на згадані причини, «незамінним» текстовим процесором для роботи з DOC є MS Word, який найповніше реалізує всі можливості цього формату. Чимало продуктивності та функціональності Ворду додають сторонні розробки – всілякі доповнення, макроси та програми існують у великій кількості на просторах мережі. Конкуренцію Ворду забезпечують, наприклад, WordPerfect компанії Corel, StarOffice від Sun Microsystems та безкоштовний OpenOffice.org. Працюючи і в Word, і в інших програмах, слід пам'ятати про проблему сумісності форматів і зберігати документ у DOC, лише якщо ви впевнені, що несумісності не виникне.

Застосовність форматів

Безпідставно стверджувати, що один із розглянутих форматів гірший за інші, не враховуючи особливостей завдань, для вирішення яких слід їх використовувати. Оскільки ми не ставитимемо перед собою завдання верстки в текстовому процесорі, то вибір практично однозначний. Для підготовки обсягів тексту від середніх до дуже великих та забезпечення «повного розуміння» набраного будь-якою програмою верстки найбільш зручним є використання найпростішого, компактного та універсального засобу набору та зберігання тексту – формату TXT. Що ж до використання у верстці інших текстових форматів, то дуже залежить від реалізації їх підтримки у конкретній програмі макетування.
OpenOffice.org – міжнародний проект із відкритими вихідними кодами, спрямований на створення універсального офісного пакету, що працює на різних операційних платформах, що має відкритий API та формат файлів, заснований на XML. По суті OpenOffice.org це набір програм, розроблений в рамках даного проекту. До нього входять: текстовий процесор, електронні таблиці, графічний редактор, система презентацій та система доступу до даних. За своїми можливостями він можна порівняти з аналогічними комерційними програмами і цілком може розглядатися як альтернатива їм. В даний час OpenOffice.org випускається під подвійним ліцензуванням: GPL та SISSL. Незважаючи на відмінності цих ліцензій, для кінцевого користувача OpenOffice.org є вільним.

OpenOffice.org веде своє походження від офісного пакету StarOffice, розробленого німецькою фірмою StarDivision у середині 90-х років. Восени 1999 корпорація Sun купила StarDivision. У червні 2000 року вже під торговою маркою Sun вийшов StarOffice 5.2 під MS Windows, Linux і Solaris. 13 жовтня 2000 року були відкриті вихідні тексти StarOffice (за винятком коду деяких модулів, розроблених третіми фірмами) і цей день офіційно вважається днем ​​народження OpenOffice.org. Сьогодні над кодом OpenOffice.org працюють як добровольці з усього світу, і програмісти корпорації Sun.

В даний час з одного вихідного коду, що розробляється спільнотою OpenOffice.org, випускаються два продукти: StarOffice, до якого додаються компоненти під пропрієтарною ліцензією і вільний OpenOffice.org. У OpenOffice.org більшість пропрієтарних компонентів, що є у StarOffice, замінено їх вільними аналогами.

(За інформацією cnews.ru.)

 

 

Це цікаво: