Universal Dependencies (UD) para o Português do Brasil

Universal Dependencies (UD) (de Marneffe et al., 2021) é um modelo internacional para anotação gramatical que conta com a participação de uma grande quantidade de pesquisadores de todo o mundo. O modelo prevê principalmente a anotação de atributos morfológicos, etiquetas morfossintáticas e dependências sintáticas, visando ser aplicável para línguas tipologicamente diferentes. A iniciativa tem mais de 300 colaboradores e quase 200 treebanks em mais de 100 idiomas, como pode ser visto na página web do projeto.

Para a língua portuguesa, recursos, ferramentas e aplicações que fazem uso da UD têm surgido. Por exemplo: há recursos como corpora anotados e léxicos; ferramentas de apoio à anotação, análise e validação de dados; etiquetadores morfossintáticos (part of speech taggers) e analisadores sintáticos (parsers); e aplicações em detecção de notícias falsas e análise de sentimentos. Também há vários estudos linguísticos sobre o uso de UD para o português, incluindo, por exemplo, manuais com diretrizes de anotação e investigações sobre fenômenos específicos, como verbos auxiliares, conjunções, numerais e construções comparativas, entre muitos outros.

É crescente o interesse da comunidade brasileira em UD e nos tópicos relacionados, havendo pesquisas conduzidas por diferentes grupos de instituições variadas (como a USP, a UFSCar, a UFMG e a PUC-Rio), investimentos feitos por empresas e workshops científicos dedicados ao tema. Esse portal web pretende ser uma vitrine para os trabalhos com UD realizados para o português brasileiro, em suas mais variadas perspectivas (teóricas ou práticas), visando ser um ponto de acesso para os interessados no assunto.

Last updated