CLARIN – Wspólne zasoby językowe i infrastruktura technologiczna

Aktualności
25 marca 2020 r. podpisaliśmy umowę na realizację projektu pn. „CLARIN – Wspólne zasoby językowe i infrastruktura technologiczna”.

25 marca 2020 r. podpisaliśmy umowę na realizację projektu pn. „CLARIN – Wspólne zasoby językowe i infrastruktura technologiczna”.

Celem bezpośrednim projektu CLARIN jest rozszerzenie infrastruktury badawczej CLARIN-PL do platformy badawczo-rozwojowej do przetwarzania języka naturalnego i eksploracji wielkich danych językowych. Zapewni ona dostęp do uniwersalnych komponentów technologii językowej oraz mechanizmy ich łączenia na potrzeby konstruowania systemów analizy tekstu, dzięki czemu powstanie infrastruktura do konstrukcji skutecznych i wydajnych systemów eksploracji wielkich danych językowych (tekstów i mowy).

Projekt realizowany będzie w latach 2020 – 2023, którego konstrukcja rozszerzonej infrastruktury składać się będzie z następujących etapów:

  1. Utworzenie systemu do gromadzenia i przechowywania danych językowych.
  2. Dostosowanie narzędzi językowych do standardów komercyjnych i rozszerzenie ich funkcjonalności.
  3. Budowa podstawowych zasobów językowych dla języka polskiego połączonych z zasobami angielskimi i Linked Open Data.
  4. Budowa narzędzi do analizy wydźwięku oraz emocji.
  5. Budowa środowiska informatycznego do tworzenia systemów dialogowych.
  6. Budowa narzędzi do wydobywania informacji z danych tekstowych.
  7. Przygotowanie narzędzi do wydobywania wiedzy bazujących na semantycznej analizie tekstu oraz elementach analizy dyskursu.
  8. Opracowanie ogólnego systemu do odpowiadania na pytania w języku naturalnym.

Projekt realizowany jest przez konsorcjum składające się z pięciu instytucji naukowych, którego Liderem jest Politechnika Wrocławska.

Koszty całkowite projektu: 136 098 860,13 zł

Koszty kwalifikowalne: 131 824 669,42 zł

Dofinansowanie: 105 066 667,00 zł