... | @@ -42,9 +42,12 @@ Vous pouvez ici définir quelles sont sont utilisées dans le corpus. Ces langue |
... | @@ -42,9 +42,12 @@ Vous pouvez ici définir quelles sont sont utilisées dans le corpus. Ces langue |
|
### XSL
|
|
### XSL
|
|
Vous pouvez déposer ici un fichier XSL utilisant la syntaxe XSLT 1.0 ; La transformation sera alors appliquée à l’export des fichiers de transcription. Un exemple de fichier .xsl est disponible sur la plateforme TACT : https://tact.demarre-shs.fr/data/xsl-exemple.xsl.
|
|
Vous pouvez déposer ici un fichier XSL utilisant la syntaxe XSLT 1.0 ; La transformation sera alors appliquée à l’export des fichiers de transcription. Un exemple de fichier .xsl est disponible sur la plateforme TACT : https://tact.demarre-shs.fr/data/xsl-exemple.xsl.
|
|
|
|
|
|
|
|
### Langues Tesseract
|
|
|
|
Permet de renseigner des codes langue qui seront utilisés par Tesseract. Voir liste des "Lang Code" sur https://tesseract-ocr.github.io/tessdoc/Data-Files.html . A écrire dans ce format > "fra eng", sans les guillemets.
|
|
|
|
|
|
### Schéma JSON
|
|
### Schéma JSON
|
|
TACT vous permet d’inclure un schéma de transcription (c’est-à-dire un ensemble d’éléments et d’attributs prédéfinis) en fonction de vos objectifs. Si vous utilisez un schéma, il doit respecter le format JSON interne à TACT. Si vous n’utilisez pas de schéma de transcription, alors les contributeurs ne pourrons que transcrire du texte seul.
|
|
TACT vous permet d’inclure un schéma de transcription (c’est-à-dire un ensemble d’éléments et d’attributs prédéfinis) en fonction de vos objectifs. Si vous utilisez un schéma, il doit respecter le format JSON interne à TACT. Si vous n’utilisez pas de schéma de transcription, alors les contributeurs ne pourrons que transcrire du texte seul.
|
|
|
|
|
|
Bon à savoir : Dans le cas, où vous disposez d'un schéma TEI (au format RNG, obtenu avec l'outil ROMA), vous pouvez utiliser [https://gitlab.com/litt-arts-num/tei2json](le script Python) mis à votre disposition pour générer un fichier JSON
|
|
Bon à savoir : Dans le cas, où vous disposez d'un schéma TEI (au format RNG, obtenu avec l'outil ROMA), vous pouvez utiliser [https://gitlab.com/litt-arts-num/tei2json](le script Python) mis à votre disposition pour générer un fichier JSON
|
|
|
|
|
|
Si vous choisissez d’inclure un schéma de transcription, veillez à le restreindre au maximum pour que seuls les éléments correspondant aux phénomènes que vous souhaitez annoter soient disponibles pour vos contributeurs. |
|
Si vous choisissez d’inclure un schéma de transcription, veillez à le restreindre au maximum pour que seuls les éléments correspondant aux phénomènes que vous souhaitez annoter soient disponibles pour vos contributeurs. |
|
\ No newline at end of file |
|
|