Skip to content

O projektu

Projekt Razvoj i primjena modela za normalizaciju grafije starih latiničnih tiskanih tekstova (MONOGRAF) provodi se od 1. siječnja 2024. do 31. prosinca 2027. u Institutu za hrvatski jezik kao projekt koji financira Europska unija – NextGenerationEU u okviru Nacionalnoga plana oporavka i otpornosti 2021. – 2026. Voditelj je projekta dr. sc. Vuk-Tadija Barbarić, a suradnica je dr. sc. Marijana Horvat. Prethodio mu je projekt u okviru osnovne djelatnosti Instituta za hrvatski jezik Razvoj modela za normalizaciju grafije starih latiničnih tiskanih tekstova, koji se provodio od 1. siječnja 2021. do 31. prosinca 2023.

Više o projektu

Velika prepreka stvaranju hrvatskih povijesnih jezičnih resursa jest povijesna tropismenost, a unutar nje posebno složenost latiničnih grafija. Predloženim projektom razvit će se model kojim će se prevladati navedeni problem, što će pokazati put do bržeg stvaranja povijesnojezičnih korpusa te posljedično ubrzati i inače mukotrpnu tekstološku produkciju. U korpus za analizu uključit će se dovoljno digitaliziranih starih latiničnih knjiga kako bi se došlo do brojke od milijun pojavnica, a među njima će se naći i neke gramatike. Knjige će se digitalizirati u izvornoj grafiji s pomoću OCR-a (optical character recognition) uz provođenje procedure koja će znatno umanjiti mogućnost pogrešaka u digitaliziranoj građi. Projekt će iznjedriti vjerno digitalizirane knjige visoke kvalitete (kvalitetu kontroliraju iskusni filolozi, a ne samo tehnički osposobljeno osoblje).

Projekt financira Europska unija iz fonda NextGenerationEU.