Aller au contenu

Caractères spéciaux

Tous les caractères spéciaux sont codés en Unicode et sont représentés à l’aide de la police SDS Lexia Fontes pour l’écriture latine et du Libertinus Serif pour les écritures grecque et hébraïque.

Accents et diacritica

Règles générales

Les caractères diacritiques et les lettres de textes allemands sont reproduits fidèlement.

Les signes de distinction sur u, qui sont censés empêcher la confusion avec n dans les textes allemands, ne sont pas reproduits.

Une distinction est faite entre l’e caudata () et le e ordinaire.

En raison des hyper corrections, les chercheurs des XVIIe et XVIIIe siècles avaient tendance à préférer la diphtongation.

Si un original médiéval est préservé, l’orthographe du texte de départ doit être conservée, i. e. ę, qui a probablement été écrit en copies ultérieurs en tant que æ, devrait être reproduit. Si seulement la copie ultérieure existe, il faut adhérer à l’orthographe de cette copie et reproduire fidèlement la diphtongue.

Les signes diacritiques du français et de l’italien sont utilisés en fonction de l’usage moderne, à condition qu’il n’y ait aucune exception.

Lors de la définition de l’accent, un système cohérent doit être utilisé dans un corpus de texte, qui est basé sur les coutumes graphiques et typographiques du temps respectif autant que possible.

Règles spéciales pour les textes français

Dans le cas des manuscrits français médiévaux, aucun accente ne doit être ajouté, sauf si les homophones peuvent être évités en raison de la e atonale et tonique. De cette façon, les syllabes de fin reçoivent un accent sur -e ou -es.

Exemples :
afr. aprés représente fr. après (nach)
afr. apres représente fr. âpres (bitter)
afr. leve représente fr. lève,
alors que afr. levé est le participe du verbe afr. lever

L’article afr. des est toujours transcrit inchangé, donc des et pas dés.

Pour les textes français du XVIe siècle (jusqu’à environ 1580), les normes qui ont été fixées pour l’édition des textes français médiévaux s’appliquent. Seul l’accent sur la lettre e est utilisé pour faire la distinction entre e tonique et atonique.

Exemples :
mfr. , tombé, vous avés, aprés, procés

Les terminaisons sur -ee ne sont pas soulignées.

Exemples :
mfr. nee, armee

Lors du traitement des manuscrits français du XVIIe siècle (jusqu’à environ 1715), les accents peuvent être utilisés dans une plus grande mesure. En particulier, les fins sur -ée sont soulignées.

Exemples :
fr. née, armée

L’accent sur les lettres a, e et u dans les prépositions et les adverbes monosyllabiques est utilisé pour les distinguer des mots homographes.

Exemples :
fr. à, , dès, lès,

En revanche, la lettre e n’est pas soulignée en un seul mot.

Exemples :
fr. maniere, pere, present

L’utilisation de la langue d’aujourd’hui est appliquée aux manuscrits français du XVIIIe siècle.

Certains diacritica dans les textes français

Fondamentalement, un trema devrait être supprimé dans des mots qui sont écrits aujourd’hui sans trema. Il en va de même pour (voir normalisation).

Exemples :
fr. queüe, veü

Dans les textes littéraires médiévaux, le Trema peut avoir une fonction phonétique, dans ce cas, il est conservé.

Le c, qui a une valeur phonétique comme /s/, doit être ajouté une cedille.

Exemples :
François et pas Francois
il sçait et pas il scait

Afin de clarifier le sens d’un texte et de le rendre plus compréhensible, l’ajout d’apostrophène est essentiel.

P. ex., l’orthographe se pour c’est avec s’e doit être reproduite.

Puisque le pronom à la troisième personne du singulier et du pluriel est souvent réduit à i, il doit être précédé d’une apostrophe lorsqu’il est combiné avec un pronom relatif ou une conjonction afin que qui ne soit pas confondu avec qu’il.

Exemple :
Item ledit detenu a dit et confesé que illiaz quattre ans qu’i deroba une boiste avec l’estuy.

L’exemple mentionné ci-dessus montre également qu’une apostrophe doit être ajoutée pour séparer l’article spécifique qui pourrait être connecté à un nom.

Exemple :
l’estuy et pas lestuy

Si la combinaison Quil agit comme une préposition relative, elle doit être transcrite.

Exemple :
Item for celuy quil allat querir le maistre d’ovre

Ligatures

Dans l’impression, les ligatures sont dissoutes dans des lettres individuelles et également dans des textes manuscrits, l’utilisation de ligatures est généralement dispensée.

Exceptions : les propres signes peuvent être utilisés pour les ligatures Æ, æ, Œ, œ et ß

Par exemple, au lieu d’e caudata (ę), l’orthographe æ peut survenir dans une copie ultérieure par hyper correction.

L’éditeur doit être conscient que les æ et ae dans le traitement de texte numérique n’ont pas la même valeur et ne sont pas reconnus comme un graphème identique.

D’autres ligatures qui ont principalement un caractère typographique ne sont pas codées avec leurs propres unicodmarks, mais simplement par les deux lettres de terrain consécutives, c’est-à-dire : ff, fi, fl, ffi, ffl et pas , , , , .

Fractures

Bien qu’Unicode comporte un certain nombre de symboles de fractions spéciaux destinés aux fractions les plus courantes, ceux-ci ne doivent pas être utilisés car ils ne couvrent pas tous les cas qui apparaissent dans le texte. Au lieu de cela, les fractures doivent être codées avec <num>.

Exemples :
<num value="0.5">1/2</num> et pas ½
<num value="0.75">3/4</num> et pas ¾

Tableau de code pour les caractères spéciaux

Le tableau ci-dessous montre comment les caractères individuels doivent être codés.

Pour certains des caractères spécifiés, il a plusieurs options de codage: P. ex., l’e caudata peut être codé sous la forme d’un seul caractère ę (U+0119) ou sous la forme d’une lettre de base e (U+0065) avec un Ogonek combinant ę (U+0328). P. ex., Ą ą Ę ę Į į Ǫ ǫ Ų ų peut être généré en entrant d’abord la lettre de base puis en Ogonek combinant, comme avec l’e caudata.

Si nécessaire, plusieurs personnages combinés avec une lettre terrestre peuvent également être utilisés, p. Ex. ā̧ (= a + Macron combinant + Cedille combinante) oder uͦ̈ (= o + superscrit o + trema combinant).

Fondamentalement, la variante de combinaison est préférée car les caractères de combinaison peuvent être attachés à tous les registres terrestres. Exception: Par souci de simplicité, les umlauts allemands Ä ä Ö ö Ü ü peuvent être entrés directement sous forme de signes individuels et n’ont pas à être enregistrés comme une lettre terrestre avec un trema combinant (U+0308).

Dans le tableau, le a est utilisé comme exemple dans la combinaison des caractères, l’entrée est analogue aux autres lettres.

Description Caractère spécial Unicode
Ligatures
A+E-ligature Æ U+00C6
a+e-ligature æ U+00E6
O+E-ligature Œ U+0152
o+e-ligature œ U+0153
s+z-ligature ß U+00DF
Diacritica combinants
Lettre avec accent grave Lettre + U+0300
Lettre avec accent aigu Lettre + U+0301
Lettre avec circonflexe Lettre + U+0302
Lettre avec tilde Lettre + U+0303
Lettre avec macron Lettre + U+0304
Lettre avec point Lettre + U+0307
Lettre avec trema Lettre + U+0308
Lettre avec caron Lettre + U+030C
Lettre avec ligne verticale Lettre + U+030D
Lettre avec cedille Lettre + U+0327
Lettre avec ogonek Lettre + U+0328
** Lettres écrites dessus**
Lettre avec a dessus Lettre + U+0363
Lettre avec e dessus Lettre + U+0364
Lettre avec i dessus Lettre + U+0365
Lettre avec o dessus Lettre + U+0366
Lettre avec u dessus Lettre + U+0367
Lettre avec v dessus Lettre + U+036E
Lettre avec w dessus a Lettre + U+F03C
Autres lettres modifiées
i avec ligne (= un et demi) ɨ U+0268
i avec deux lignes U+E8A1
j avec ligne ɉ U+0249
j avec deux lignes U+E8A2
q avec ligne U+A757
t avec ligne ŧ U+0167
v avec ligne (= quatre et demi) U+E8BB
v avec ligne diagonale U+A75F
v avec deux ligne U+E8BC
x avec ligne dessus U+E8BD
x avec ligne dessous (= neuf et demi) U+E8BE
x avec deux lignes dessous U+E8CE
Devises et unités
Florin U+F2E8
Gulden U+F2E9
h mit Strich (= Haller) ħ U+0127
Helbling U+F2FB
Krone U+F2FA
Krone (alternativ) U+F2FC
Pfennig/Denar U+20B0
Pfund (Währung) U+F2EA
Pfund (Gewicht) U+2114
Schilling U+F2F7
Scudo U+F2F9
Autres symboles
Symbole de main pointée U+261E
Symbole de paragraphe § U+00A7
Symbole de paragraphe U+00B6
Croix U+2020
Double croix U+2021
Triple croix U+F1D2
Symbole de mariage U+26AD
Symbole circulaire U+25CB
Symbole pour Mars (Abbr. pour Mardi) U+2642
Symbole de droit d’auteur © U+00a9
Signes de ponctuation etc.
Point . U+002E
Virgule , U+002C
Point-virgule ; U+003B
Côlon : U+003A
Point culminant · U+00B7
Apostrophe U+2019
Point d’exclamation ! U+0021
Point d’interrogation ? U+003F
Ellipse U+2026
Un point avant deux U+2056
Un point sur deux U+2235
Quatre points U+2058
Ligne en demi-tiret U+2013
Ligne verticale simple | U+007C
Double ligne verticale U+2016
Double solidus U+2AFD
Guillemet à gauche U+2039
Guillemet à droite U+203A
Guillemets à gauche « U+00AB
Guillemets à droite » U+00BB
Croix de multiplication × U+00D7
Caractère ordinal (1º, 2º, etc.) º U+00BA

Script grec et hébreu

Les passages dans le script grec et hébreu sont également codés directement dans Unicode. Cela s’applique que les accents grecs, les spiritus ainsi que le iota subscriptum ou adscriptum et les signes de vocalisation hébraïque avec des caractères combinés doivent être montrés. L’alpha grec et l’hébreu Alef en servent d’exemples.

Description Caractère spécial Unicode
Lettres grecques
Alpha Α, α U+0391, U+03B1
Beta Β, β U+0392, U+03B2
Gamma Γ, γ U+0393, U+03B3
Delta Δ, δ U+0394, U+03B4
Epsilon Ε, ε U+0395, U+03B5
Zeta Ζ, ζ U+0396, U+03B6
Eta Η, η U+0397, U+03B7
Theta Θ, θ U+0398, U+03B8
Iota Ι, ι U+0399, U+03B9
Kappa Κ, κ U+039A, U+03BA
Lambda Λ, λ U+039B, U+03BB
My Μ, μ U+039C, U+03BC
Ny Ν, ν U+039D, U+03BD
Xi Ξ, ξ U+039E, U+03BE
Omikron Ο, ο U+039F, U+03BF
Pi Π, π U+03A0, U+03C0
Rho Ρ, ρ U+03A1, U+03C1
Sigma Σ, ς, σ U+03A3, U+03C2, U+03C3
Tau Τ, τ U+03A4, U+03C4
Ypsilon Υ, υ U+03A5, U+03C5
Phi Φ, φ U+03A6, U+03C6
Chi Χ, χ U+03A7, U+03C7
Psi Ψ, ψ U+03A8, U+03C8
Omega Ω, ω U+03A9, U+03C9
Diacritica grecques
Lettre avec accent grave ὰ Lettre + U+0300
Lettre avec accent aigu ά Lettre + U+0301
Lettre avec circonflexe ᾶ Lettre + U+0342
Lettre avec spiritus lenis ἀ Lettre + U+0313
Lettre avec spiritus asper ἁ Lettre + U+0314
Lettre avec iota sub- bzw. adscriptum ᾳ Lettre + U+0345
Lettre avec spiritus et accent aigu ἅ Lettre + U+0314 + U+0301
Lettre avec spiritus, accent aigu et iota subscriptum ᾅ Lettre + U+0314 + U+0301 + U+0345
Lettres hébraïques
Alef א U+05D0
Bet ב U+05D1
Gimel ג U+05D2
Dalet ד U+05D3
He ה U+05D4
Waw ו U+05D5
Sajin ז U+05D6
Chet ח U+05D7
Tet ט U+05D8
Jud י U+05D9
Kaf כ, ך U+05DA, U+05DB
Lamed ל U+05DC
Mem מ, ם U+05DD, U+05DE
Nun נ, ן U+05DF, U+05E0
Samech ס U+05E1
Ajin ע U+05E2
Pe פ, ף U+05E3, U+05E4
Zade צ, ץ U+05E5, U+05E6
Kuf ק U+05E7
Resch ר U+05E8
Sin, Schin ש U+05E9
Taw ת U+05EA
Diacritica hébraïques
Lettre avec Schwa אְ Lettre + U+05B0
Lettre avec Schwa et Seggol אֱ Lettre + U+05B1
Lettre avec Schwa et Patach אֲ Lettre + U+05B2
Lettre avec Schwa et Qamäz אֳ Lettre + U+05B3
Lettre avec Chiriq אִ Lettre + U+05B4
Lettre avec Sere אֵ Lettre + U+05B5
Lettre avec Seggol אֶ Lettre + U+05B6
Lettre avec Patach אַ Lettre + U+05B7
Lettre avec Qamäz אַָ Lettre + U+05B8
Lettre avec Choläm אֹ Lettre + U+05B9
Lettre avec Qubbuz אֻ Lettre + U+05BB