... | @@ -49,16 +49,3 @@ Vous pouvez déposer ici un fichier XSL utilisant la syntaxe XSLT 1.0 ; La tran |
... | @@ -49,16 +49,3 @@ Vous pouvez déposer ici un fichier XSL utilisant la syntaxe XSLT 1.0 ; La tran |
|
|
|
|
|
### Langues Tesseract
|
|
### Langues Tesseract
|
|
Permet de renseigner des codes langue qui seront utilisés par Tesseract. Voir liste des "Lang Code" sur https://tesseract-ocr.github.io/tessdoc/Data-Files.html . A écrire dans ce format > "fra eng", sans les guillemets. |
|
Permet de renseigner des codes langue qui seront utilisés par Tesseract. Voir liste des "Lang Code" sur https://tesseract-ocr.github.io/tessdoc/Data-Files.html . A écrire dans ce format > "fra eng", sans les guillemets. |
|
|
|
|
|
### Schéma JSON
|
|
|
|
TACT vous permet d’inclure un schéma de transcription (c’est-à-dire un ensemble d’éléments et d’attributs prédéfinis) en fonction de vos objectifs. Si vous utilisez un schéma, il doit respecter le format JSON interne à TACT. Si vous n’utilisez pas de schéma de transcription, alors les contributeurs ne pourrons que transcrire du texte seul.
|
|
|
|
[Voir la documentation dédiée au schéma](Schéma)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
-------------
|
|
|
|
**Bon à savoir**
|
|
|
|
|
|
|
|
Dans le cas, où vous disposez d'un schéma TEI (au format RNG, obtenu avec l'outil ROMA), vous pouvez utiliser [https://gitlab.com/litt-arts-num/tei2json](le script Python) mis à votre disposition pour générer un fichier JSON
|
|
|
|
|
|
|
|
Si vous choisissez d’inclure un schéma de transcription, veillez à le restreindre au maximum pour que seuls les éléments correspondant aux phénomènes que vous souhaitez annoter soient disponibles pour vos contributeurs. |
|
|