Что такое ПГ?
© Август 1992
Проект Гутенберг родился в 1971 году. В этом году Майкл Харт, сотрудник лаборатории исследований материалов (Materials Research Lab) университета Иллинойса, получил доступ к ЭВМ Xerox Sigma V и время работы на ней на общую сумму в $ 100 000 000.
По счастливому совпадению двое из четырех помогающих Майклу операторов оказались лучшими друзьями Майкла и его брата. Так как компьютерного времени было в избытке, и не было представления о том, что с ним можно делать, группа операторов получила возможность делать все, что угодно в надежде добиться полезных результатов для своей работы.
Майкл решил использовать остающееся машинное время. Он объявил, что наиболее ценными считает хранение, обработку и поиск материалов, хранящихся в наших библиотеках.
Сначала он напечатал «Декларацию Независимости» и попытался разослать ее всем пользователям сети наподобие современного Интернет-вируса.
Так первый раз в истории был разослан электронный текст. Началом проекта Гутенберг принято считать заявление Майкла о том, что, разослав «Декларацию Независимости», он «заработал» $ 100 000 000, так как копия Декларации Независимости станет обычным явлением в компьютерных библиотеках будущего, пользователями которых будет более 100 000 000 человек.
В основу проекта Гутенберг Майкл заложил следующую идею: все, что можно ввести в компьютер, можно воспроизводить до бесконечности. Процесс был назван «Технологией Дубликата». и его концепция была очень простой - поскольку книгу или любой другой материал (включая изображения, звуки и даже трехмерные объекты) можно хранить в компьютере, то вполне возможно изготовить и любое количество копий этих материалов. Каждый человек на земле и с помощью спутниковых сигналов за ее пределами ( имеет возможность получить копию книги, хранящейся в компьютере.
Из этой основной идеи можно выделить две главные мысли:
1. Электронные тексты (Е-тексты), созданные в рамках проекта Гутенберг, должны быть доступны в самых простых для использования формах.
2. Не стоит с легкостью отвергать идеи о создании более сложных текстовых форм, но, тем не менее, Е-тексты из проекта Гутенберг представляют собой так называемую форму «Plain Vanilla ASCII». Речь идет о нижнем уровне Американского Стандартного Кода для обмена информацией: подобные же знаки вы читаете на обычной печатной странице – курсив, подчеркнутые строчки и жирный шрифт написаны заглавными буквами.
Причина использования формы «Plain Vanilla ASCII» заключается в том, что 99% программного обеспечения может распознавать и искать подобные файлы.
Вариант Plain Vanilla ASCII доступен огромному числу пользователей Apple, Atari, Z80, Mac, UNIX и больших ЭВМ.
Проект Гутенберг отбирает Е-тексты по принципу «мгновенного удара» – выбираются Е-тексты, которые могут немедленно понадобиться большей части пользователей.
Проект избегает выполнять просьбы и требования о создании «образцовых изданий». Он не работает для тех читателей, которым жизненно важно узнать, стояло ли в определенной фразе у Шекспира “,” или “;’’. Проект стремится выпускать Е-тексты, на 99,9% точные в глазах обычного читателя.
Одна из первых задач проекта – обеспечить как можно более быстрый доступ к Е-текстам после их попадания в публичный доступ согласно закону о защите авторских прав. Период ожидания, который должен пройти между смертью писателя и появлением его работы в публичном доступе в виде электронного издания, был увеличен после начала проекта до 50 лет, и это внесло существенные проблемы в осуществление планов проекта. (Срок действия обычного авторского права в США – 14 лет).
Основная цель проекта Гутенберг – предоставлять информацию, книги и прочие материалы в форме, доступной для обработки подавляющему большинству компьютеров, программ и пользователей.
Отсюда вытекает ряд пояснений:
1. Е-тексты проекта Гутенберг должны быть Такими дешевыми, что вопрос цены вообще не должен привлекать никакого внимания. Они должны требоватьстандартного размера памяти, распространенного в средствах массовой информации своего времени.
К примеру, в начале существования проекта файл должен был занимать очень мало места, так как стандартная книга из 300 страниц обходилась в 1М, а такого объема памяти в компьютерах 1971 года еще не было. Именно поэтому и было правильно начать с Декларации Независимости США, которая заняла всего 5К дисковой памяти. За ней последовали Билль о правах и вся Конституция США (1973 год). Затем появились отдельные книги Библии и пьесы Шекспира, а потом и общие научные и литературные труды и справочники.
К тому времени, когда проект Гутенберг обрел известность, на дискете помещалось уже 360К текста, поэтому было решено обратиться к таким произведениям как «Алиса в стране Чудес» и «Питер Пен». Теперь стандартный объем памяти – 1,44М, ZIP – самая распространенная программа для сжатия информации, а реальный размер файла – около трех миллионов знаков, гораздо больше, чем содержится в средней книге.
Новые стандарты хранения графических файлов предоставляют возможность включать в книги и иллюстрации.
2. Е-тексты проекта Гутенберг должны быть предельно доступными: не стоит заставлять читателей тратить время на разрешение вопроса о том, как читать, обрабатывать или цитировать электронные материалы.
Создатели проекта решили предоставлять Е-тексты в форме «Plain Vanilla ASCII», как они назвали ее много лет назад.
Объяснение подобного шага весьма простое – только в форме текста легко работать с материалом на экране компьютера и читать его с листа.
Е-текст, созданный в формате «Plain Vanilla ASCII», является основой для множества его воспроизведений в будущем. Вы можете внести в материал свои коррективы, не переверстывая книгу заново целиком. Е-текст проекта Гутенберг используется как базискоторый позволит вам продвигаться в любом направлении.
Все жалобы на то, что в текстах проекта Гуттенбергнеправильно используются курсив, жирный шрифт и подчеркивание, что не следовало выделять то или иное место в тексте др., сотрудники проекта отправляют назад с предложением исправлять «ошибки» по своему усмотрению.
Список машин, которым могут быть доступны тексты проекта расширяется: Amiga, Apple, Atari, IBM, Mac, TRS-80,…
Е-тексты проекта распространяются во многих сетях и BBS, получить файл в нужном вам формате и переслать его адресату не представляет особого труда.
И главное– это то, что год от года проект Гутенберг набирает силы в то время, как программное обеспечение, операционные системы и компьютеры повторяют историю динозавров. Это не распространяется на Е-тексты формата «Plain Vanilla ASCII», которые входят в состав проекта Гуттенберг.. Через десять лет у нас будут уже другие операционные системы и программы, и все виды Е-текстов, кроме формата «Plain Vanilla ASCII», безнадежно устареют. Необходимо перевести все Е-тексты в файлы, которые можно будет обрабатывать программой Plain Vanilla. Это не означает, что не может быть никаких других форматов, просто эти файлы должны легко конвертироваться в формат Plain Vanilla.
Ценность Plain Vanilla ASCII неоспорима, этот формат превосходит большинство прочих форматов, существующих сегодня. До тех пор, пока не появится какой-либо новый стандарт, остается опасность многое потерять, если не сохранить копии всех Е-текстов именно в данном формате.
«Алиса в стране Чудес», Библия, Шекспир, Коран и многие другие шедевры будут существовать до тех пор, пока цивилизация не исчезнет. К сожалению, операционные системы, программы и компьютеры – нет.
Имеется ряд требований к сжатию файлов в определенный формат. Для наиболее широкого использования подходят только два: Plain Vanilla ASCII (файлы с расширением .txt) и ZIP (с расширением .zip). Прочие форматы могут быть применены лишь для очень узкой аудитории. Однако, файлы можно сжимать и в любом требуемом формате, но на сервере может храниться только одна копия Е-текста.
На сегодняшний день в Библиотеке Проекта Гутенберг существует три подразделения:
Легкая (художественная) литература – такая как «Алиса в стране Чудес», «Алиса в Зазеркалье», «Питер Пен», Басни Эзопа и т.д.
Серьезная литература – Библия и другие религиозные труды, Шекспир, «Моби Дик», «Потерянный рай» и т.д.
Справочники – такие как Тезаурус Роджета, альманахи, энциклопедии, словари и т.д.
Коллекция легкой литературы создана с целью привлечь читателя, вне зависимости от того школьник он или пенсионер, к компьютеру. Мы рады слышать, что бабушки, дедушки и внуки садятся читать «Питера Пена», возвратившись из кинотеатра, или обращаются к «Алисе в стране Чудес», посмотрев ее по телевизору. Мы с радостью узнали, что почти в каждой серии киноэпопеи «Стар Трэк» использовались Е-тексты проекта Гутенберг (из «Моби Дика»- в серии «Гнев Кхана»; а совсем недавно был «Питер Пен»). Стоит упомянуть также ссылки на «Алису в Зазеркалье» в фильме «JFK». Это и была наша основная задача, когда мы подбирали книги для нашей библиотеки.
Мы хотим, чтобы люди с легкостью находили цитаты, которые они слышали в разговоре, кинофильме, песне или встречали в другой книге.
(оригинал текста расположен по адресу http://www.intmedia.ru/edu/pg.htm)
Комментарии:
1. Можно посмотреть биографию человека чье имя дало название данному проекту, мало кто знает, что Гутенберг был знаком с Николаем Кузанским, который оказал на него большое влияние.
2. Немного о самой истории внедрения книгопечатания можно посмотреть здесь. 