Я стал твоим врагом, потому, что говорю тебе правду.
“Свободен лишь тот, кто может позволить себе не лгать”. А. Камю
“Можно обманывать часть народа всё время, и весь народ – некоторое время, но нельзя обманывать весь народ всё время”. А. Линкольн.
Израиль. Проект MiDRASH получил грант в размере 11,5 миллионов долларов США на выведение исследований средневековой еврейской литературы на новый уровень.
Фрагмент молитвенника Йом-Киппур, найденного в Каирской генизе и датируемого XI или XII веками н. э. (Коллекция Национальной библиотеки Израиля)
В ходе нового исследовательского проекта, в рамках которого израильские и международные ученые провели цифровую расшифровку текстов, содержащихся в сотнях тысяч фрагментов знаменитой Каирской генизы , а также тысяч дополнительных еврейских рукописей, сообщила в понедельник Национальная библиотека Израиля.
Проект, получивший название MiDRASH (что приблизительно соответствует «Миграции текстовых и писцовых традиций посредством крупномасштабного компьютерного анализа средневековых рукописей на иврите»), был запущен в 2023 году после получения гранта в размере 10 миллионов евро (11,5 миллионов долларов США) сроком на шесть лет от Европейского исследовательского совета ЕС (ERC).
Практически все 400 000 фрагментов генизы были сфотографированы и оцифрованы ранее. Однако менее 15% из них были расшифрованы, а многие никогда не были как следует прочитаны, не говоря уже об изучении.
«Наша цель — реконструировать еврейскую средневековую книжную культуру, и мы начинаем с расшифровки огромной коллекции виртуальных рукописей, собранной в Национальной библиотеке Израиля», — сказал Даниэль Штокль Бен Эзра, профессор древнееврейского и арамейского языков в Высшей практической школе высших исследований (PSL) в Париже, один из ведущих ученых, участвующих в проекте.
Согласно еврейскому закону, запрещено выбрасывать или уничтожать документы, содержащие имя Бога. На протяжении почти тысячелетия евреи Каира хранили рукописи, письма, старые молитвенники и многое другое в комнате городской синагоги Бен-Эзра, первоначальное здание которой, как считается, существовало ещё до IX века нашей эры.
Сохранившаяся благодаря сухому климату Египта сокровищница документов — Каирская гениза — привлекла внимание европейских ученых в 1896 году. В последующие годы большая часть артефактов была перевезена в Англию.
«Этот материал чрезвычайно важен, поскольку 90% евреев [в Средние века] жили на территориях, контролируемых мусульманами, а не в Европе, и тем не менее большинство их рукописей было утеряно», — рассказал Штёкль газете The Times of Israel в телефонном интервью. «После того как была открыта Каирская гениза мы узнали множество новых текстов, множество новых версий уже известных нам текстов, и узнали очень многое».
Ученые, принимающие участие в проекте MiDRASH по расшифровке средневековых еврейских рукописей, посетят Бодлианскую библиотеку в Оксфорде во время своей ежегодной встречи в декабре 2024 года. (Элиша Розенцвейг/Проект MiDRASH)
Наличие цифровой транскрипции документа означает многое: можно осуществлять поиск слов, группировать жанры, легко сравнивать языки и многое другое.
В конечном итоге все транскрипции будут доступны на сайте NLI, каждая из которых будет сопровождаться фотографиями оригинальных рукописей.
По словам доктора Цафры Сью, руководителя научно-исследовательского отдела NLI, MiDRASH представляет собой новую главу в основной миссии библиотеки по сохранению книг на иврите.
«В 1950 году Давид Бен-Гурион, первый премьер-министр Израиля, основал Институт микрофильмированных еврейских рукописей», — вспоминал Сью. «Идея заключалась в том, чтобы спасти как можно больше еврейских рукописей, и, поскольку физически перевезти их в Иерусалим не представлялось возможным, институт начал фотографировать все рукописи на микроплёнку. Так появилась первая коллекция фотографий».
За прошедшие десятилетия к проекту было добавлено около 1 500 книжных коллекций со всего мира. Фрагменты Каирской генизы были оцифрованы в рамках инициативы « Проект Фридберг-гениза», начавшейся в 2006 году.
«В 2014 году мы начали оцифровывать нашу фотоколлекцию и создавать веб-сайт, позволяющий пользователям искать и просматривать все оцифрованные рукописи», — сказал Сью. «Это был настоящий прорыв».
«Проект MiDRASH — это следующий технологический скачок», — добавила она.
В настоящее время NLI работает над созданием инфраструктуры веб-сайта и выясняет, как загружать все материалы, что является непростой задачей.
На вопрос о том, сколько времени потребуется, чтобы транскрипции стали доступны онлайн, Сью ответила, что сказать сложно, но она надеется, что это произойдет «меньше чем через год».
«Сотрудничество с Национальной библиотекой дало нам огромное преимущество, поскольку она уже проделала всю предварительную работу по сбору этой огромной коллекции», — сказал Штёкль. «Если бы вы работали на арабском языке, у вас были бы миллионы рукописей, но они были бы разбросаны по всему миру, и потребовались бы десятилетия, прежде чем они все были бы собраны в одной электронной библиотеке».
В междисциплинарную группу учёных MiDRASH входят палеографы (исследователи исторических сочинений), специалисты по информатике, лингвисты, специалисты по ивритской литературе и иудаике. Помимо Штёкля, ведущими исследователями являются профессор Нахум Дершовиц из Тель-Авивского университета, доктор Ави Шмидман из Университета Бар-Илан и профессор Джудит Ольшови-Шлангер из Оксфордского университета. В проекте также участвуют группы из Хайфского университета и Национального библиотечного института под руководством доктора Моше Лави и Сью. Дополнительную поддержку проекту оказывает проект «Гениза» Принстонского университета под руководством профессора Марины Рустов.
Группа использовала платформу с открытым исходным кодом для автоматической транскрипции печатных изданий и рукописей eScriptorium, чтобы разработать модель сегментации и транскрибирования материалов, написанных еврейским письмом (тексты написаны не только на иврите, но также на арамейском и иудео-арабском языках, которые используют еврейские символы). Модель обучалась на основе существующих транскрипций, созданных вручную учёными.
По словам Штёкля, в течение следующих нескольких месяцев они планируют расшифровать еще 10 миллионов изображений еврейских рукописей.
Однако, подчеркнул ученый, транскрипция — это лишь первый шаг.
«Транскрипция — это только начало процесса», — сказал он. «Транскрипции нужны нам для проведения других видов анализа. Мы хотим провести лингвистический анализ, чтобы определить, кто кого цитирует, кто кого перефразирует и кто у кого какие идеи заимствует, чтобы мы могли проследить идеи, мотивы и комментарии на протяжении веков. Основная задача проекта — после транскрипции».
Фрагмент еврейского текста, найденный в Каирской генизе, и его транскрибированная версия. (Проект MiDRASH)
Хотя транскрипции, вероятно, будут содержать ошибки, особенно на первом этапе, они позволят осуществлять поиск и сравнение текстов. Система сможет распознавать, содержит ли фрагмент отрывок из Библии, страницу Талмуда, другой известный текст, личное письмо и так далее.
Одна из целей Штёкля — изучить, как мидраши, или раввинские рассказы и толкования, взятые из Библии, менялись по мере их распространения в мусульманской или христианской среде и развивались с течением времени.
По словам Штёкля, результаты проекта в конечном итоге будут опубликованы в рецензируемых научных журналах.
Тем временем, чтобы помочь ученым улучшить транскрипции и системы, NLI запустила «Transcribe-a-thon» в Иерусалиме и онлайн, который начался 24 и продлится до 27 ноября, призывая волонтеров с соответствующими навыками просматривать и улучшать автоматические транскрипции, созданные платформой, тем самым совершенствуя ее модель, основанную на машинном обучении.
Ученые уверены, что в конечном итоге им удастся раскрыть множество новых секретов, хранящихся в рукописях.
«[Этот проект] позволяет нам задавать новые вопросы, более масштабные и глубокие, — сказал Сью. — На вопросы, на которые можно ответить, только полностью изучив коллекцию еврейских рукописей».
Я родился свободным, поэтому выбора, чем зарабатывать на жизнь, у меня не было, стал предпринимателем.
Не то, чтобы я не терпел начальства, я просто не могу воспринимать работу, даже в хорошей должности и при хорошей зарплате, если не работаю на себя и не занимаюсь любимым делом.