Package: ucto (0.30-3 and others) [debports]
Links for ucto
Debian Resources:
Download Source Package :
Not foundMaintainers:
External Resources:
- Homepage [languagemachines.github.io]
Similar packages:
suddivisione in token per Unicode
Ucto può suddividere in token file di testo in codifica UTF-8 (cioè separare parole dalla punteggiatura, suddividere frasi, generare n-grammi) e offre svariati altri passi di preelaborazione di base che rendono il testo adatto ad un'ulteriore elaborazione come indicizzazione, etichettatura di parti del discorso o traduzione automatica.
Questo pacchetto fornisce lo strumento a riga di comando vero e proprio.
Ucto è stato scritto da Maarten van Gompel e Ko van der Sloot. Il lavoro su Ucto è stato finanziato dalla NWO, la Netherlands Organisation for Scientific Research, come parte del progetto Implicit Linguistics, del programma CLARIN-NL e del progetto CLARIAH.
Ucto è un prodotto del Centre of Language and Speech Technology (Radboud University Nijmegen), e in precedenza dell'ILK Research Group (Tilburg University, Paesi Bassi).
Se si è interessati nell'analisi automatica di file di testo in codifica UTF-8, ad esempio per fare ricerca scientifica nel campo dell'elaborazione del linguaggio naturale, ucto sarà probabilmente utile.
Other Packages Related to ucto
|
|
|
|
-
- dep: libc6 (>= 2.34)
- Libreria C GNU: librerie condivise
also a virtual package provided by libc6-udeb
-
- dep: libfolia19 (>= 2.17)
- Implementation of the FoLiA document format
-
- dep: libgcc-s2 (>= 4.2.1)
- libreria di supporto a GCC
-
- dep: libicu72 (>= 72.1~rc-1~)
- International Components for Unicode - componenti internazionali per Unicode
-
- dep: libstdc++6 (>= 13.1)
- libreria GNU Standard C++, versione 3
-
- dep: libticcutils9 (>= 0.34)
- utility functions used in the context of Natural Language Processing (library)
-
- dep: libucto6 (>= 0.30)
- suddivisione in token per Unicode - runtime
-
- dep: uctodata
- file dei dati per Ucto
Download ucto
Architecture | Version | Package Size | Installed Size | Files |
---|---|---|---|---|
m68k (unofficial port) | 0.30-3+b1 | 23.0 kB | 82.0 kB | [list of files] |