25 marca 2020 r. podpisaliśmy umowę na realizację projektu pn. „CLARIN – Wspólne zasoby językowe i infrastruktura technologiczna”.
Celem bezpośrednim projektu CLARIN jest rozszerzenie infrastruktury badawczej CLARIN-PL do platformy badawczo-rozwojowej do przetwarzania języka naturalnego i eksploracji wielkich danych językowych. Zapewni ona dostęp do uniwersalnych komponentów technologii językowej oraz mechanizmy ich łączenia na potrzeby konstruowania systemów analizy tekstu, dzięki czemu powstanie infrastruktura do konstrukcji skutecznych i wydajnych systemów eksploracji wielkich danych językowych (tekstów i mowy).
Projekt realizowany będzie w latach 2020 – 2023, którego konstrukcja rozszerzonej infrastruktury składać się będzie z następujących etapów:
- Utworzenie systemu do gromadzenia i przechowywania danych językowych.
- Dostosowanie narzędzi językowych do standardów komercyjnych i rozszerzenie ich funkcjonalności.
- Budowa podstawowych zasobów językowych dla języka polskiego połączonych z zasobami angielskimi i Linked Open Data.
- Budowa narzędzi do analizy wydźwięku oraz emocji.
- Budowa środowiska informatycznego do tworzenia systemów dialogowych.
- Budowa narzędzi do wydobywania informacji z danych tekstowych.
- Przygotowanie narzędzi do wydobywania wiedzy bazujących na semantycznej analizie tekstu oraz elementach analizy dyskursu.
- Opracowanie ogólnego systemu do odpowiadania na pytania w języku naturalnym.
Projekt realizowany jest przez konsorcjum składające się z pięciu instytucji naukowych, którego Liderem jest Politechnika Wrocławska.
Koszty całkowite projektu: 136 098 860,13 zł
Koszty kwalifikowalne: 131 824 669,42 zł
Dofinansowanie: 105 066 667,00 zł