среда, 13 августа 2008 г.

От гипертекста к гиперписьменности

Вначале был гипертекст. Инженер Тим Бёрнерс Ли преобразовал идеи Ванневара Буша и Теда Нельсона в практический простой текстовой формат HTML и такой же простой протокол HTTP. Эта гениальная простота привела к быстрому распространению "всемирной паутины" среди обычных пользователей. И первоначальное накопление информационного капитала в сети WWW произошло практически без участия коммерческого и корпоративного сектора, представители которого только потом с удивлением обнаружили у себя под боком это "безобразие".


Прошло некоторое время, и язык гипертекста усложнился. В результате творческих поисков сообщества, корпоративных и браузерных войн он оброс многими диковинными вещами - java, javascript, flash и т.д. Сам HTML уже активно используется не только как формат данных, но и как визуальный интерфейс к веб-приложениям. Сейчас некоторые особо радикальные флэш-кодеры даже совсем призывают отменить "устаревший" html и совершить культурный прыжок, перейдя исключительно на Flash и Silverlight. Но культурные революции, как показывает история некоторых государств, - это не есть истинное дао.


Если говорить образно, то я бы сравнил современный web с морем. Например, на море есть пляжи, где повсюду красивые девушки, где ночные казино и где развлекаются отдыхающие потребители. Java, Flash, Silverlight и прочие мультимедийные форматы - это и есть пляжи моря web. Именно на них основан весь развлекательный сектор Интернета. Здесь вам и те же казино, и игры, и мультимедиа с соблазнами и рекламой. И именно здесь самые дорогие веб-дизайнеры.


Но настоящие морские богатства находятся не на пляжах, а на глубине, куда заплывают только настоящие мореманы. Истинная стихия web - это письменность.


Письменность - это совокупность письменных средств общения: система графики, алфавит, орфография, а также совокупность письменных и литературных памятников какого-либо народа и всего человечества, в целом. Письменность имеет длительную историю и пережила несколько эпох. Web следует рассматривать также как письменную эпоху, что завершила предыдущую эпоху Гуттенберга, являясь переходом от бумаги к цифре.


В свою очередь, и эпоха Бёрнерса Ли уже пережила несколько периодов своей эволюции. Все, что можно было легко переделать из бумаги в цифру, было переделано. Это, например, известная "Библиотека Мошкова" и различные инициативы библиотек по оцифровке своих архивов. Но тут же определились и основные трудности. С одной стороны делу активно мешали и мешают интеллектуальные собственники и издательские гильдии. С другой стороны, не все тексты удается оцифровать в приемлемом для размещения в Интернете виде.


Конечно же, художественную литературу и беллетристику представить в цифровом виде просто. Для этого достаточно возможностей даже ASCII-кодировки. Но вот тексты, содержащие специальные, музыкальные или древние символы, формулы математики, физики, химии и т.д., всё это представить в Интернете значительно сложнее. Эти типы текстов обычно преобразовывают в форматы pdf, djvu или обычные графические форматы, которые нужно скачивать и просматривать в отдельных от браузера программах. А для публикации непосредственно на веб-страницах до сих пор используются маленькие картинки этих специфических символов.


Можно было бы обходиться и дальше исключительно djvu, pdf, gif, png. Но, во-первых, это не очень удобно. А главное, наступил период web-2, когда содержание веб-сайта создается не столько автором ресурса, сколько посетителями этого ресурса, и им возиться с картинками не очень захочется.


Рассмотрим показательный пример. Вот имеется ресурс Habrahabr.ru, на котором айтишники публикуют свои идеи, мнения и всё такое. Программерам легко вставлять в свои сообщения код примеров из какой-нибудь библиотеки javascript. Для этого за глаза хватает ASC-латиницы. Но представьте подобный "Хабру" ресурс не для программистов, а для математиков с их "птичьим" языком. Прикажете им с картиночками тыкаться?


Что касается математики, то давно существует стандарт MathML, позволяющий использовать математический язык непосредственно на веб-странице посредством специальных XML-тегов. На основе этого можно вполне создать какой-нибудь специализированный вариант BB-кода для математических форумов, wiki. Вот только работа с MathML в современных браузерах хоть и декларируется, но весьма далека от идеала.

Я провёл небольшое тестирование на предмет поддержки MathML. Есть специальный тест на www.3w.org, в котором представлены несколько сотен примеров MathML с готовым кодом, а также изображениями для проверки. Я протестировал браузеры Firefox 2, Opera 9.5 и IE 7. Из 785 примеров Firefox более-менее осилил 610, Opera - 150. Отдельная песня IE. Сам по себе "ишак" MathML не обрабатывает, но после установки специального плагина показал 750 правильных отображений. Как видим, стопроцентного результата не показал никто. А для математики необходимым и достаточным условием являются именно все сто процентов. Причем работать это должно, как говорится, из коробки, а не через плагины.


Да что там математика, юникод, которому уже скоро шестнадцать лет, не полностью поддерживается в некоторых операционных системах (догадайтесь, в какой именно). Возьмем кириллицу. В юникоде, кроме символов современного русского языка, содержатся ещё и старославянские символы. В результате уже сейчас можно писать html-странички с текстами о старославянской письменности и с цитатами из старославянских, церковно-славянских источников. Но отображаться они будут только в браузерах под Linux. Причем под Linux не нужно устанавливать в систему дополнительно старославянские шрифты - кое-как со всей юникодной таблицей справляются и обычные шрифты по умолчанию. В IE7 под Windows XP дополнительная кириллица отображается в виде пресловутых квадратиков. Кстати, это одна из причин моего выбора Linux.


Вывод из вышесказанного довольно-таки простой, хотя для некоторых жестоких флэш-кодеров, может быть, и неожиданный. Именно полная поддержка основных и специализированных видов письма и есть главное направление дальнейшего развития Интернета. Flash и Silverlight, всякие аяксы и вебдванольности, как бы они не поражали чье-то воображение, всегда останутся нишевыми продуктами. Потому что Интернет - для письменности, а не письменность для Интернета.

Причём поддержка письменности во всех её проявлениях необходима не только на уровне форматов данных, но и на уровне протоколов. Вот сейчас международная организация ICANN, регулирующая регистрацию интернет-адресов, выступила за разрешение доменов на национальных языках. Технократы - веб-программисты, сисадмины - практически в большинстве против этого. Действительно, айтишникам из всей письменности для своих нужд вполне хватает и латиницы. А я скажу больше, настоящему программисту для своих нужд нужно всего шестнадцать клавиш для шестнадцатиричного кода и все. Но в том-то и дело, что Интернет создавался не для нужд жестоких веб-кодеров, а для всего остального человечества. Поэтому мнение технократов про решение ICANN никого не интересует. Рано или поздно и протокол доменных имен будет поддерживать любой письменный язык.


1 комментарий:

  1. Термин "Гиперписьменность", аналог гипертекста, скорее как и он связываю с термином Деррида "Нелинейное письмо". Подробности в моём блоге http://giperpismennost.blogspot.com/

    ОтветитьУдалить