Дигитална револуција средњовековних јеврејских рукописа

  • Међународни пројекат промовише аутоматску транскрипцију стотина хиљада средњовековних јеврејских рукописа, са централним фокусом на Каирску генизу.
  • Национална библиотека Израела и платформа Ktiv воде дигитализацију и отворено објављивање текстова, уз финансијску подршку Европског истраживачког савета.
  • Иницијатива MiDRASH комбинује вештачку интелигенцију и хуманистичке науке како би реконструисала средњовековну јеврејску књижевну културу и олакшала нове академске студије.
  • Заједничке сесије транскрипције и прегледа омогућавају побољшање модела вештачке интелигенције и отварају архиву истраживачима и јавности широм света.

средњовековни јеврејски рукописи

Огромна колекција средњовековни јеврејски рукописи Каирска гениза, како је позната, доживљава прекретницу захваљујући вештачкој интелигенцији. Након деценија у којима је само мали део материјала био лако доступан, комбинација... масовна дигитализација И системи за препознавање текста заиста почињу да отварају ову јединствену архиву истраживачима и широј јавности.

Оно што је донедавно изгледало као сан за филологе и историчаре — способност да претражи, читај и упореди Идеја да се стотине хиљада средњовековних хебрејских фрагмената учини доступним са било ког рачунара постала је конкретан пројекат. Преко платформе Ktiv Националне библиотеке Израела и програма MiDRASH, генерисани су прелиминарни транскрипти готово свих фрагмената Генизе, а сада су у току припреме за њихову ревизију, побољшање и отворено објављивање.

Гигантска средњовековна архива, коначно читљива

збирка средњовековних јеврејских рукописа

ла лламада Каирска гениза Сматра се највећом и најразноврснијом колекцијом средњовековних јеврејских докумената сачуваних у свету. Скоро хиљаду година, јеврејска заједница египатске престонице је тамо депоновала верске, правне, комерцијалне и књижевне текстове, који, због традиције неуништавања списа у име Бога, нису могли једноставно бити одбачени. Резултат је била колекција за коју се данас процењује да има око [недостаје број]. 400.000 фрагмената, очуван углавном захваљујући сувој клими Египта.

Упркос свом значају, колекција је само делимично искоришћена: донедавно је мање од трећине материјала било каталогизовано и једва 10-15% је имало транскрипт читљив. Остатак, иако дигитализован и доступан у облику слике, остао је тежак за систематски рад, јер читање средњовековних курзивних или полукурзивних хебрејских рукописа захтева много искуства и времена.

Нова фаза пројекта мења овај пејзаж. Надовезујући се на инфраструктуру Ktiv-а — дигиталне базе података свих познатих хебрејских рукописа којима управља Национална библиотека Израела — међународни тим је развио системи за аутоматску транскрипцију способан да претвори те фрагменте у претраживи дигитални текст, барем у првој верзији која ће потом бити усавршена.

Према подацима које је објавила институција, прелиминарни транскрипти су већ генерисани за практично све елементе Каирске генизе, поред хиљаде додатних хебрејских рукописа пореклом из других средњовековних колекција. За област која је радила део по део више од једног века, скок у обиму је тешко преценити.

MiDRASH: Вештачка интелигенција и хуманистичке науке у служби хебрејских рукописа

У средишту ове трансформације је MiDRASH (Миграције текстуалних и писачких традиција путем велике рачунарске анализе средњовековних рукописа на хебрејском писму), интердисциплинарни пројекат који окупља стручњаке из Израела и Европе. Иницијатива је започета 2023. године захваљујући гранту ERC Synergy од 10 милиона евра који је доделио Европски истраживачки савет за период од шест година, првом те врсте посебно посвећеном јеврејским студијама.

Циљ MiDRASH-а није ограничен само на преписивање старих текстова. Како објашњава један од његових директора, професор Данијел Стокл Бен Езра, амбиција је Реконструкција средњовековне јеврејске књижевне културе књиге, пратећи који аутори цитирају друге, како рабински коментари (мидрашим) циркулишу између муслиманских и хришћанских заједница или како се писане традиције трансформишу током векова.

Да би ово омогућио, тим је одлучио да ради у оквиру платформе отвореног кода. СкрипторијумДизајниран за аутоматску транскрипцију рукописа и натписа, систем развија специфичне моделе за средњовековно хебрејско писмо, обучене на хиљадама транскрипција које су стручњаци ручно састављали током многих година. Резултат је систем који може да сегментира линије и речи у древним сликама и да их претвори у текст који се може уређивати.

Надлежни наглашавају да, иако почетни транскрипције садрже грешке — нешто што је неизбежно код неправилног рукописа, поломљених фрагмената или избледелог мастила — њихови практична корисност Огромно је: омогућавају вам да брзо пронађете библијске одломке, делове Талмуда, писма, уговоре или литургијске текстове, нешто што је раније захтевало стрпљиво читање страницу по страницу.

Од микрофилмова до отворених платформи: дуг пут

дигитализација средњовековних јеврејских рукописа

Тренутна дигитална револуција средњовековни јеврејски рукописи Није се појавио ниоткуда. Сама Национална библиотека Израела подсећа да је још 1950. године, под иницијативом премијера Давида Бен-Гуриона, основан Институт за микрофилмоване хебрејске рукописе. Пошто није било реално физички преместити све колекције у Јерусалим, решење је било фотографисање што већег броја колекција на микрофилм, постављајући темеље за велику визуелну архиву.

Током деценија, неки су били укључени 1.500 колекције Из различитих извора, а почев од 2006. године, материјал из Каирске генизе је интегрисан у такозвани пројекат Фридбергова гениза, што је убрзало његову систематску дигитализацију. Национална библиотека је 2014. године почела да претвара своју фотографску архиву у дигиталну колекцију доступну онлајн, омогућавајући по први пут сваком кориснику да претражује и прегледа хиљаде хебрејских рукописа онлајн.

MiDRASH се директно надовезује на тај претходни рад. Користећи Ktiv-ову инфраструктуру — која је већ консолидовала већину познатих хебрејских рукописа у једну базу података — тим примењује алгоритме аутоматско учење да идентификују слова, речи и текстуалне структуре. Ова комбинација централизоване архиве и напредних рачунарских алата избегава један од главних проблема који постоје у другим областима, као што је проучавање арапских рукописа, где је материјал много више распршен.

Др Цафра Сју, шеф истраживачких пројеката у Националној библиотеци, дефинише MiDRASH као прави тачка прегиба за свакога ко ради са средњовековним хебрејским рукописима. По његовом мишљењу, корак напред није само у олакшавању приступа, већ и у омогућавању врста анализе које су, због саме величине, биле немогуће када је сваки документ морао да се чита ручно и готово сам.

Међународне радионице сарадње и транскрипције

Пројекат MiDRASH функционише као међународни конзорцијум који комбинује техничку и хуманистичку стручност. Главни истраживачи су професор Нахум Дершовиц (Универзитет у Тел Авиву), др Ави Шмидман (Универзитет Бар-Илан) и професорка Џудит Олшови-Шлангер (Универзитет у Оксфорду), заједно са тимовима са Универзитета у Хаифи, Националне библиотеке Израела и Пројекат Принстон Гениза, у режији професорке Марине Рустоу.

Далеко од тога да је ограничена само на лабораторијски рад, иницијатива такође отвара могућности за учешће јавности. Од 24. до 27. новембра, у Јерусалиму је организован велики догађај са онлајн стримовањем. „Транскриб-а-тон“ фокусиран на средњовековне и модерне хебрејске рукописе у курзивном и полукурзивном писму. Током ових сесија, обучени волонтери прегледају и исправљају транскрипције које је генерисала вештачка интелигенција.

Овај колаборативни приступ тежи двоструком циљу. С једне стране, побољшању квалитет и прецизност С једне стране, сами текстови се анализирају; с друге стране, људске корекције се користе за даље усавршавање модела препознавања, тако да се у будућности смањи број грешака и да се чак и најпроблематичније руке боље препознају. Идеја је да систем учи, мало по мало, из акумулираног искуства филолога, палеографа и стручњака за хебрејски језик.

Национална библиотека Израела је назначила да ће коначни транскрипти Каирске генизе бити укључени у Ктив и доступни јавности заједно са оригиналне слике сваког рукописа. На овај начин, сваки истраживач може упоредити оно што машина види са оним што је видљиво у факсимилу, одржавајући транспарентност и омогућавајући нова очитавања или будуће исправке.

Нова питања за стару причу

Када се фаза масовне транскрипције заврши, руководиоци пројекта теже да иду далеко даље од пуког приступа. План је да буду у могућности да спроведу лингвистичка и текстуална анализа на великој скали: откривање ланаца цитата, идентификовање парафраза, реконструкција токова идеја или праћење еволуције одређених теолошких и правних мотива кроз векове.

У пракси, то значи да средњовековни јеврејски рукописи престају да буду само изоловани делови на полицама или у дигиталним архивама и почињу да функционишу као међусобно повезана мрежа текстоваВештачка интелигенција помаже у проналажењу образаца, сличности и понављања који би се изгубили у чисто индивидуалном читању, док стручњаци пружају историјски и филолошки контекст како би протумачили шта те везе значе.

Нека од специфичних интересовања тима укључују праћење путање мидраша, рабинских наратива и коментара који су кружили међу јеврејским заједницама на муслиманским и хришћанским територијама. Могућност мапирања како се верзије истог текста разликују у зависности од региона или ере отвара врата бољем разумевању... културни контакти, унутрашњи сукоби и доктринарна преинтерпретације који су се догодили у средњем веку.

Истраживачи инсистирају на томе да је машинска транскрипција, чак и са својим несавршеностима, само почетак. Даљи развој биће могућ на основу ове основе. компаративне студије вокабулар, синтакса или стилови писања, али и друштвене и економске анализе засноване на писмима, трговачким уговорима или правним документима које су до сада једва систематски истражене.

Глобални утицај и могућности за Европу

Иако је пројекат настао и координисан је из Израела, његови ефекти се у потпуности протежу на европску академску заједницу. Грант ERC Synergy који финансира MiDRASH део је политике Европске уније од подршка дигиталним инфраструктурама за хуманистичке науке, а неколико главних истраживача ради на универзитетима у Француској, Уједињеном Краљевству и другим земљама.

За европске стручњаке за медитеранску историју, средњовековни јудаизам или класични ислам, поседовање тако свеобухватне и претраживе базе података представља значајну промену. До сада је реконструкција живота јеврејских заједница које су живеле на муслиманским територијама – где су муслимани чак и живели – била сложен подухват. 90% средњовековног јеврејског становништва— То је захтевало путовања и ограничен приступ архивама. Постепеним отварањем Ktiv-а, велики део тог материјала постаје доступан са било ког кампуса или истраживачког центра.

Штавише, методологија развијена у MiDRASH-у нуди модел који се може проширити на друге европске документарне колекције: од колекција латинских рукописа до нотарских или црквених архива. Идеја комбиновања дигитализације, аутоматске транскрипције и јавне сарадње појављује се као реплицирана рута да се сачувају и проуче друга места наслеђа која су у опасности од пропадања.

Руководиоци пројекта су уверени да ће објављивање резултата у рецензираним научним часописима учврстити овај приступ у оквиру академских стандарда. У међувремену, отворени приступ Слике и транскрипције обећавају да ће олакшати заједнички рад између универзитета у Израелу, Европи и Америци, стварајући шире истраживачке мреже око средњовековних јеврејских рукописа.

Напредак вештачке интелигенције примењен на Каирску генизу и друге хебрејске рукописе трансформише готово неуправљиву архиву у живи и растући изворОно што је некада захтевало године педантног читања сада се може пратити за неколико секунди, без умањивања значаја стручног рада, већ напротив: ослобађа се време за постављање сложенијих питања и дубинско тумачење наслеђа које, мало по мало, престаје да буде скривено благо и постаје заједнички ресурс на глобалном нивоу.

рукописи-0
Повезани чланак:
Нова открића и технологије у проучавању историјских рукописа