XHTML
В 1999 году W3C опубликовала спецификации версии HTML версии 4.0. Затем, в 1999 году был опубликован стандарт HTML 4.01. На этом развитие языка HTML закончилось окончательно.
На смену HTML в 2000 году пришла спецификация XHTML 1.0. Буква «X» здесь означает XML.
XML (от англ. eXtensible Markup Language — расширяемый язык разметки, компактное упрощённое подмножество языка SGML) — рекомендованный W3C язык разметки, представляющий собой свод общих правил, нацеленных на создание описаний данных.
Язык XML является универсальным средством для создания структур данных, которые можно использовать для самых разных надобностей, в том числе, хранить в XML-файле настроечные данные для компьютерной программы или… использовать для создания гипертекстовой страницы.
XHTML — это попытка обеспечить описания данных с помощью выразительных средств сложного XML, сохранив при этом простоту и удобство HTML.
Завершение эпохи совершенствования HTML не означает отказ разработчиков от использования этого языка. HTML продолжает свою жизнь, и в качестве подмножества XHTML, и в «чистом» виде, — как простой инструмент разработки сайтов.
На уровне первой версии язык XHTML не даёт практически никаких преимуществ по сравнению с последней версией языка HTML, но синтаксические требования в языке XHTML существенно выше, что с одной стороны усложняет использования этого языка, а с другой — дисциплинирует разработчиков, которые привыкли относиться к гипертекстовому коду небрежно, считая, что браузер додумает за них (что он и делает, исправляя ошибки в HTML-коде по своему усмотрению).
Язык CSS по-прежнему решает задачу представления информации на устройствах вывода, как с паре с HTML, так и в паре с XHTML.
Отметим синтаксические особенности языка XHTML.
- Названия тегов и атрибутов нужно записывать в нижнем регистре.
- Значения атрибутов в обязательном порядке заключаются в кавычки.
- Все атрибуты должны иметь значения.
- Каждый элемент должен заканчиваться закрывающим тегом.
-
Одиночные теги (вроде
img
) тоже необходимо закрывать с помощью прямого слеша в конце тега (<img scr="pic.gif" />
) - Нельзя использовать двойной дефис внутри комментария.
И это практически все. Очень легко преобразовать HTML-код в код на XHTML, причём совсем не обязательно делать это вручную. В сети можно найти много программ (например, бесплатная HTML Tidy: www.w3.org/People/Raggett/tidy), которые выполнят это автоматически.
Значит… Берём свой ужасный HTML-код, напускаем на него автоматический преобразователь и… Получаем прекрасный структурированный код на XHTML, в соответствие со стандартами W3C?
Конечно, нет. Что имели, то и получили. Плохой код на входе — плохой код на выходе.
Но если на входе был хороший код HTML, на выходе будет получен хороший код XHTML.
Так какой язык выбрать? XHTML или HTML 4.1. Сегодня разницы, практически, нет. Но HTML замер на цифре 4 и больше развиваться не будет, а XHTML в начале пути.
Что выбрать, решение за вами.
Лично мне в XHTML не нравится только запись тегов в нижнем регистре. Мелкосимвольные имена тегов сливаются с обычным текстом, и это затрудняет чтение кода. Правда, подкрашивание, принятое в редакторах кода, компенсирует эту утрату.