Corpora

PetroGoldarrow-up-right (Souza e Freitas, 2022arrow-up-right): treebank revisado manualmente que consiste de textos acadêmicos da área de petróleo e gás em português do Brasil.

CINTIL-UDeparrow-up-right (Branco et al., 2022arrow-up-right): banco de dependências do português, obtido pela fusão e conversão automática para UD dos corpora CINTIL-DependencyBank e CINTIL DependencyBank PREMIUM.

Porttinariarrow-up-right (Duran et al., 2023arrow-up-right; Pardo et al., 2021arrow-up-right): treebank multigênero para o português do Brasil, com uma parcela manualmente revisada, constituído de textos jornalísticos e conteúdo gerado por usuário (user-generated content).

Bosque-UDarrow-up-right (Rademaker et al., 2017arrow-up-right): criado com base na conversão do Bosque, que faz parte da Floresta Sintática(c)tica, com variantes europeias (CETEMPúblico) e brasileiras (CETENFolha).

PUDarrow-up-right (Zeman et al., 2017arrow-up-right): parte dos treebanks criados para a avaliação conjunta realizada no CoNLL 2017 sobre análise multilíngue.

GSDarrow-up-right (McDonald et al., 2013arrow-up-right): traduzido do Google Universal Dependency Treebank v2.0arrow-up-right.

Last updated