Propriétés de base
Nom
Nom du projet, tel qu'il s'affichera sur la page d'accueil de TACT, et dans le bandeau supérieur sur la majorité des pages liées au projet.
Description
Assez brève pour que les utilisateurs comprennent ce à quoi ils vont participer et en quoi leurs contributions seront utiles à votre projet de recherche. C’est ici que vous expliquez à vos contributeurs ce que vous attendez d’eux. Attention, ceci n’est pas une description scientifique de votre projet !
Inscription libre
Si vous cochez la case, tout utilisateur pourra s’inscrire à votre projet et commencer à transcrire ; sinon, l’inscription sera modérée et vous devrez valider l’inscription d’un utilisateur à votre projet pour qu'il puisse accéder aux médias et participer à la transcription.
Phrase d'accroche
Le slogan de votre projet TACT. Ce sera affiché en dessous l'image, sur la page d'accueil de votre projet.
Instructions de transcription
Déposez ici un document rédigé par vos soins spécifiant concrètement ce que vous attendez de vos contributeurs, en indiquant :
- ce qu'ils doivent transcrire : texte, retours à la ligne ou pas, erreurs d’orthographe corrigées ou non… selon votre projet.
- si vous avez un schéma de transcription, les phénomènes à annoter et les balises et attributs correspondants.
Nombre de relectures nécessaire par fiche
Au bout d’un certain nombre de relectures que vous définissez ici (obligatoirement supérieur ou égal à 1), une transcription est considérée comme “terminée”, elle n’est plus proposée à l'édition.
Image du projet
Image en lien avec votre projet pour donner envie aux utilisateurs de participer. Elle est affichée en bandeau dans l’espace dédié à votre projet ainsi qu'en miniature sur la page d’accueil de TACT.
Veillez à utiliser une image dont vous disposez des droits ou libre de droits, et préférez un ratio de 4:1, sans quoi l’image sera rognée automatiquement.
Propriétés avancées
CSS inline
Vous pouvez ici définir des règles CSS afin d’améliorer la mise en forme de la transcription en mode « Prévisualisation ». Bien penser à préfixer par #preview
pour contraindre la surcharge à cet élément et ses enfants.
Exemple de sélecteur:
#preview tei\:hi {
color:red;
}
Tesseract languages
Vous pouvez ici définir quelles sont sont utilisées dans le corpus. Ces langues seront utilisées par tesseract afin d'améliorer les résultats de l'OCR. Les codes langues sont disponibles dans la documentation de tesseract
XSL
Vous pouvez déposer ici un fichier XSL utilisant la syntaxe XSLT 1.0 ; La transformation sera alors appliquée à l’export des fichiers de transcription. Un exemple de fichier .xsl est disponible sur la plateforme TACT : https://tact.demarre-shs.fr/data/xsl-exemple.xsl.
Langues Tesseract
Permet de renseigner des codes langue qui seront utilisés par Tesseract. Voir liste des "Lang Code" sur https://tesseract-ocr.github.io/tessdoc/Data-Files.html . A écrire dans ce format > "fra eng", sans les guillemets.