CLARIN Common Language Resources and Technology Infrastructure / European Research Infrastructure for Language Resources and Technology

dr hab. Piotr Pęzik - Wydział Filologiczny  

Uniwersytet Łódzki jest członkiem konsorcjum CLARIN-PL - polskiej części ogólnoeuropejskiej infrastruktury naukowej CLARIN - Common Language Resources and Technology Infrastructure, obejmującej cyfrowe archiwa tekstów oraz narzędzia do ich automatycznej analizy. 

CLARIN jest częścią Europejskiej Mapy Drogowej Infrastruktury Naukowej (ESFRI - European Roadmap for Research Infrastructures, European Strategy Forum on Research Infrastructures). Ma dostarczyć zaawansowane narzędzia badawcze w dziedzinie analizy tekstu i mowy dla szeroko pojętych nauk humanistycznych i społecznych. 

Konsorcjum CLARIN-PL tworzą polskie uniwersytety i instytuty badawcze, w których powstają repozytoria tekstów pisanych i mówionych w języku polskim oraz tekstów równoległych w innych językach. Celem konsorcjum jest wypełnienie braków w obszarze przystosowania technologii językowych dla języka polskiego, umożliwienie dostępu do bogatych zasobów w języku polskim, widocznych z dowolnego punktu w Europie, zachęcenie do prowadzenia badań z uwzględnieniem polskojęzycznych materiałów oraz promocja języka i kultury Polski w Europie i na świecie. 

W ramach projektu powstają programy, które pomocne będą m.in. w ustalaniu autorstwa tekstów anonimowych, określaniu profilu psychologicznego autora, automatycznym streszczaniu, wydobywaniu z tekstów wiedzy i informacji, badaniu powiązań w biznesie, polityce i nauce. 

Więcej na stronie.