Стра[тег].ру | Версия для печати | Адрес документа в интернете: http://stra.teg.ru/library/global/it/1

Проект Гутенберг

Дата: 10:16 30.12.2003
Источник публикации: ИНТ

Что такое ПГ?

История и философия проекта Гутенберг

 

© Август 1992

  

Начало

 Проект Гутенберг родился в 1971 году. В этом году Майкл Харт, сотрудник лаборатории исследований материалов (Materials Research Lab) университета Иллинойса, получил доступ к ЭВМ Xerox Sigma V и время работы на ней на общую сумму в $ 100 000 000.

 По счастливому совпадению двое из четырех помогающих Майклу операторов оказались лучшими друзьями Майкла и его брата. Так как компьютерного времени было в избытке, и не было представления о том, что с ним можно делать, группа операторов получила возможность делать все, что угодно в надежде добиться полезных результатов для своей работы.

Майкл решил  использовать остающееся машинное время. Он объявил, что наиболее ценными считает хранение, обработку и поиск материалов, хранящихся в наших библиотеках.

 Сначала он напечатал «Декларацию Независимости» и попытался разослать ее всем пользователям сети наподобие современного Интернет-вируса.

Так первый раз в истории был разослан электронный текст. Началом проекта Гутенберг принято считать заявление Майкла о том, что, разослав «Декларацию Независимости», он «заработал» $ 100 000 000, так как копия Декларации Независимости станет обычным явлением в компьютерных библиотеках будущего, пользователями которых будет более 100 000 000 человек.

Возникновение философии Гутенберг

 В основу проекта Гутенберг Майкл заложил следующую идею: все, что можно ввести в компьютер, можно воспроизводить до бесконечности. Процесс был назван «Технологией Дубликата». и его концепция была очень простой -  поскольку книгу или любой другой материал (включая изображения, звуки и даже трехмерные объекты) можно хранить в компьютере, то вполне возможно изготовить и любое количество копий этих материалов. Каждый человек на земле и с помощью спутниковых сигналов за ее пределами ( имеет возможность получить копию книги, хранящейся в компьютере.

 Из этой основной идеи можно выделить две главные мысли:

1.      Электронные тексты (Е-тексты), созданные в рамках проекта Гутенберг, должны быть доступны в самых простых для использования формах.

2.      Не стоит с легкостью отвергать идеи о создании более сложных текстовых форм, но, тем не менее, Е-тексты из проекта Гутенберг представляют собой так называемую форму «Plain Vanilla ASCII». Речь идет о нижнем уровне Американского Стандартного Кода для обмена информацией: подобные же знаки вы читаете на обычной печатной странице – курсив, подчеркнутые строчки и жирный шрифт написаны заглавными буквами.

 Причина использования формы «Plain Vanilla ASCII» заключается в том, что 99% программного обеспечения может распознавать и искать подобные файлы.

 Вариант Plain Vanilla ASCII доступен огромному числу пользователей Apple, Atari, Z80, Mac, UNIX и больших ЭВМ.

 Проект Гутенберг отбирает Е-тексты по принципу «мгновенного удара» – выбираются Е-тексты, которые  могут немедленно понадобиться большей части пользователей.

 Проект избегает выполнять просьбы и требования о создании «образцовых изданий». Он не работает для тех читателей, которым жизненно важно узнать, стояло ли в определенной фразе у Шекспира “,” или  “;’’.  Проект стремится выпускать Е-тексты, на 99,9% точные в глазах обычного читателя.

Одна из первых задач проекта – обеспечить как можно более быстрый  доступ к Е-текстам после их попадания в публичный доступ согласно закону о защите авторских прав. Период ожидания, который должен пройти между смертью писателя и появлением его работы в публичном доступе в виде электронного издания, был увеличен после начала проекта до 50 лет, и это внесло существенные проблемы в осуществление планов проекта. (Срок действия обычного авторского права в США – 14 лет).

 Философия проекта Гутенберг

 Основная цель проекта Гутенберг – предоставлять информацию, книги и прочие материалы в форме, доступной для обработки подавляющему большинству компьютеров, программ и пользователей.

 Отсюда вытекает ряд пояснений: 

1. Е-тексты проекта Гутенберг должны быть Такими дешевыми, что вопрос цены вообще не должен привлекать никакого внимания. Они должны требоватьстандартного размера памяти, распространенного в средствах массовой информации своего времени.

 К примеру, в начале существования проекта файл должен был занимать очень мало места, так как стандартная книга из 300 страниц обходилась в 1М, а такого объема памяти в компьютерах  1971 года еще не было. Именно поэтому и было правильно начать с Декларации Независимости США, которая заняла всего 5К дисковой памяти. За ней последовали Билль о правах и вся Конституция США (1973 год). Затем появились отдельные книги Библии и пьесы Шекспира, а потом и общие научные и литературные труды и справочники.

 К тому времени, когда проект Гутенберг обрел известность, на дискете помещалось уже 360К текста, поэтому было решено обратиться к таким произведениям как «Алиса в стране Чудес» и «Питер Пен». Теперь стандартный объем памяти – 1,44М, ZIP – самая распространенная программа для сжатия информации, а реальный размер файла – около трех миллионов знаков, гораздо больше, чем содержится в средней книге.

 Новые стандарты хранения графических файлов предоставляют возможность включать в книги и иллюстрации.

 2. Е-тексты проекта Гутенберг должны быть предельно доступными: не стоит заставлять читателей тратить время на разрешение вопроса о том, как  читать, обрабатывать или цитировать электронные материалы.

 Создатели проекта решили предоставлять Е-тексты в форме «Plain Vanilla ASCII», как они назвали ее много лет назад.

 Объяснение подобного шага весьма простое – только в форме текста легко работать с материалом на экране компьютера и читать его с листа.

 Е-текст, созданный в формате «Plain Vanilla ASCII», является основой для множества его воспроизведений в будущем. Вы можете внести в материал свои коррективы, не переверстывая книгу заново целиком. Е-текст проекта Гутенберг используется как базискоторый позволит вам  продвигаться в любом направлении.

 Все жалобы на то, что в текстах проекта Гуттенбергнеправильно используются курсив, жирный шрифт и подчеркивание, что не следовало выделять то или иное место в тексте  др., сотрудники проекта отправляют назад с предложением исправлять «ошибки» по своему усмотрению.

 Список машин, которым могут быть доступны тексты проекта расширяется: Amiga, Apple, Atari, IBM, Mac, TRS-80,…

 Е-тексты проекта распространяются во многих сетях и BBS, получить файл в нужном вам формате и переслать его адресату не представляет особого труда.

И главное– это то, что год от года проект Гутенберг набирает силы в то время, как программное обеспечение, операционные системы и компьютеры повторяют историю динозавров. Это не распространяется на Е-тексты формата «Plain Vanilla ASCII», которые входят в состав проекта Гуттенберг.. Через десять лет у нас будут уже другие операционные системы и программы, и все виды Е-текстов, кроме формата «Plain Vanilla ASCII», безнадежно устареют. Необходимо перевести все Е-тексты в файлы, которые можно будет обрабатывать программой Plain Vanilla. Это не означает, что не может быть никаких других форматов, просто эти файлы должны легко конвертироваться в формат Plain Vanilla.

 Ценность Plain Vanilla ASCII неоспорима, этот формат превосходит большинство прочих форматов, существующих сегодня. До тех пор, пока не появится какой-либо новый стандарт, остается опасность многое потерять, если не сохранить копии всех Е-текстов именно в данном формате.

 «Алиса в стране Чудес», Библия, Шекспир, Коран и многие другие шедевры будут существовать до тех пор, пока цивилизация не исчезнет. К сожалению, операционные системы, программы и компьютеры – нет.

 Имеется ряд требований к сжатию файлов в определенный формат. Для наиболее широкого использования подходят только два: Plain Vanilla ASCII (файлы с расширением .txt) и ZIP (с расширением .zip). Прочие форматы могут быть применены лишь для очень узкой аудитории. Однако, файлы можно сжимать и в любом требуемом формате, но на сервере может храниться только одна копия Е-текста.

 Отбор электронных текстов для проекта Гутенберг

 На сегодняшний день в Библиотеке Проекта Гутенберг существует три подразделения:

 Легкая (художественная) литература – такая как «Алиса в стране Чудес», «Алиса в Зазеркалье», «Питер Пен», Басни Эзопа и т.д.

 Серьезная литература – Библия и другие религиозные труды, Шекспир, «Моби Дик», «Потерянный рай» и т.д.

 Справочники – такие как Тезаурус Роджета, альманахи, энциклопедии, словари и т.д.

Коллекция легкой литературы создана с целью привлечь читателя, вне зависимости от того школьник он или пенсионер, к компьютеру. Мы рады слышать, что бабушки, дедушки и внуки садятся читать «Питера Пена», возвратившись из кинотеатра, или обращаются к «Алисе в стране Чудес», посмотрев ее по телевизору. Мы с радостью узнали, что почти в каждой серии киноэпопеи «Стар Трэк» использовались Е-тексты проекта Гутенберг (из «Моби Дика»- в серии «Гнев Кхана»; а совсем недавно был «Питер Пен»). Стоит упомянуть также ссылки на «Алису в Зазеркалье» в фильме «JFK». Это и была наша основная задача, когда мы подбирали книги для нашей библиотеки.

 Мы хотим, чтобы люди с легкостью находили цитаты, которые они слышали в разговоре, кинофильме, песне или встречали в другой книге. 

(оригинал текста расположен по адресу http://www.intmedia.ru/edu/pg.htm)

Комментарии:

1. Можно посмотреть биографию человека чье имя дало название данному проекту, мало кто знает, что Гутенберг был знаком с Николаем Кузанским, который оказал на него большое влияние.

2. Немного о самой истории внедрения книгопечатания можно посмотреть здесь. Иоган Гутенберг

Наверх


© 2001-2002, Стра-тег. При перепечатке ссылка на сайт "Стра-тег" обязательна.