World Intellectual Property Organization

Instructions administratives du Traité de coopération en matière de brevets

Annexe C, appendice 2

Symboles des nucléotides et des acides aminés et tableau des caractéristiques

Tableau 5 : liste des clés de caractérisation concernant les séquences de nucléotides

Clé Description
allele Individu ou souche apparenté contenant des formes stables différentes d'un même gène, qui se distingue de la séquence présentée à cet emplacement (et éventuellement à d'autres emplacements)
attenuator 1) région d'ADN où se produit une régulation de la terminaison de la transcription qui contrôle l'expression de certains opérons bactériens;
2) segment de séquence situé entre le promoteur et le premier gène de structure, qui provoque une terminaison partielle de la transcription
C_region Région constante de la chaîne lourde et de la chaîne légère de l'immunoglobuline et des chaînes alpha, bêta et gamma du récepteur d'un lymphocyte T;  comprend un ou plusieurs exons, selon la chaîne
CAAT_signal Séquence CAAT;  partie d'une séquence conservée située environ 75 paires de bases en amont du site d'initiation des unités de transcription eucaryotes, qui peut jouer un rôle dans la fixation de l'ARN polymérase;  consensus=GG (C ou T) CAATCT
CDS Séquence codante ("coding sequence");  séquence de nucléotides correspondant à celle des acides aminés dans une protéine (l'emplacement comprend le codon d'arrêt);  contient la traduction conceptuelle des acides aminés
conflict les déterminations indépendantes de la "même" séquence diffèrent sur ce site ou dans cette région
D-loop Boucle de déplacement ("displacement loop");  région au sein de l'ADN mitochondrial où une petite partie d'ARN est appariée à un brin d'ADN, entraînant le déplacement du brin original d'ADN dans cette région;  désigne aussi le déplacement d'une région d'ADN double brin sous l'effet d'un envahisseur simple brin dans la réaction catalysée par la protéine RecA
D-segment Segment de diversité ("diversity segment") de la chaîne lourde de l'immunoglobuline et de la chaîne bêta du récepteur d'un lymphocyte T
enhancer Séquence en cis entraînant l'utilisation accrue de (certains) promoteurs eucaryotes et dont l'action s'exerce quelle que soit l'orientation et l'emplacement (en amont ou en aval) par rapport au promoteur
exon Région du génome codant une partie de l'ARN messager épissé;  peut contenir la région 5'UTR, tous les CDS et la région 3'UTR
GC_signal Séquence GC;  région conservée riche en GC, située en amont du site d'initiation des unités de transcription eucaryotes, qui peut prendre la forme de copies multiples et se produire dans les deux sens;  consensus=GGGCGG
gene Région présentant un intérêt biologique, identifiée comme étant un gène et à laquelle un nom a été attribué
iDNA AND intercalaire;  ADN éliminé par l'un des types de recombinaison.
intron Segment d'ADN qui est transcrit, puis éliminé par aboutement des séquences (exons) situées de part et d'autre
J_segment Segment de jonction ("joining segment") de la chaîne légère et de la chaîne lourde de l'immunoglobuline, ainsi que des chaînes alpha, bêta et gamma du récepteur d'un lymphocyte T
LTR Répétition terminale longue ("long terminal repeat");  séquence directement répétée aux deux extrémités d'une séquence définie, du type de celle que l'on trouve dans les rétrovirus
mat_peptide Séquence codante d'un peptide mature ou d'une protéine mature;  séquence codante du peptide ou de la protéine à l'état mature ou final, qui suit la modification post-traductionnelle;  l'emplacement ne comprend pas le codon d'arrêt (contrairement au CDS correspondant)
misc_binding site d'un acide nucléique fixant, par covalence ou non, un autre fragment de molécule, qui ne peut être décrit par aucune autre clé de fixation (primer_bind ou protein_bind)
misc_difference séquence de caractérisation différente de celle qui est présentée dans l'entrée et ne pouvant pas être décrite par une autre clé de différence (conflict, unsure, old_sequence, mutation, variation, allele ou modified_base)
misc_feature région présentant un intérêt biologique, qui ne peut pas être décrite par une autre clé de caractérisation;  nouvelle caractéristique ou caractéristique rare
misc_recomb site de toute recombinaison généralisée, spécifique d'un site ou réplicative, où se produit la cassure et la réunion de l'ADN double brin et qui ne peut pas être décrite par une autre clé de recombinaison (iDNA ou virion) ou par un autre qualificateur de clé source (/insertion_seq, /transposon, /proviral)
misc_RNA tout transcrit ou produit de l'ARN qui ne peut pas être défini par une autre clé de l'ARN (prim_transcript, precursor_RNA, mRNA, 5'clip, 3'clip, 5'UTR, 3'UTR, exon, CDS, sig_peptide, transit_peptide, mat_peptide, intron, polyA_site, rRNA, tRNA, scRNA ou snRNA)
misc_signal toute région contenant un signal qui commande ou modifie une fonction ou l'expression d'un gène, qui ne peut pas être décrite par une autre clé de signal (promoter, CAAT_signal, TATA_signal, -35_signal, -10_signal, GC_signal, RBS, polyA_signal, enhancer, attenuator, terminator ou rep_origin)
misc_structure toute structure ou conformation secondaire ou tertiaire qui ne peut pas être décrite par une autre clé de structure (stem_loop ou D-loop)
modified_base le nucléotide indiqué est un nucléotide modifié, qui doit être remplacé par la molécule indiquée (donnée dans la valeur qualificative mod_base)
mRNA ARN messager;  comprend la région non traduite en 5' (5'UTR), les séquences codantes (CDS, exon) et la région non traduite en 3' (3'UTR)
mutation la souche apparentée présente un changement brusque et transmissible dans la séquence, à cet emplacement
N_region des nucléotides supplémentaires sont insérés entre des segments d'immunoglobuline réarrangés
old_sequence la séquence présentée est la version modifiée d'une ancienne séquence à cet emplacement
polyA_signal site de reconnaissance indispensable à la coupure d'un transcrit par endonucléase, suivie d'une polyadénylation; consensus=AATAAA
polyA_site site d'un transcrit auquel sont ajoutés des résidus d'adénine par polyadénylation post-transcriptionnelle
precursor_RNA ARN précurseur, c'est-à-dire tout type d'ARN qui n'est pas encore mature;  peut comprendre la région coupée en 5' (5'clip), la région non traduite en 5' (5'UTR), les séquences codantes (CDS, exon), les séquences intercalaires (intron), la région non traduite en 3' (3'UTR) et la région coupée en 3' (3'clip)
prim_transcript transcrit primaire (initial, non remanié);  comprend la région coupée en 5' (5'clip), la région non traduite en 5' (5'UTR), les séquences codantes (CDS, exon), les séquences intercalaires (intron), la région non traduite en 3' (3'UTR) et la région coupée en 3' (3'clip)
primer_bind site de fixation non covalent pour amorces dans l'initiation de la réplication, de la transcription ou de la transcription inverse; comprend les sites pour les éléments de synthèse, par exemple les amorces de l'amplification en chaîne par polymérase (PCR)
promoter région d'une molécule d'ADN jouant un rôle dans la fixation de l'ARN polymérase en vue de l'initiation de la transcription
protein_bind site de fixation non covalent des protéines sur un acide nucléique
RBS site de fixation du ribosome ("ribosome binding site")
repeat_region région du génome contenant des unités de répétition
repeat_unit unité d'un élément de répétition
rep_origin origine de la réplication;  site de départ pour la duplication d'un acide nucléique en vue de l'obtention de deux copies identiques
rRNA ARN ribosomique mature;  molécule d'ARN de la particule ribonucléoprotéique (ribosome) qui assemble les acides aminés en protéines
S_region région de commutation ("switch region") des chaînes lourdes de l'immunoglobuline;  joue un rôle dans le réarrangement de la chaîne lourde de l'ADN, qui conduit à l'expression d'une classe d'immunoglobuline différente à partir du même lymphocyte B
satellite nombreuses séquences répétées en tandem (identiques ou apparentées) d'une courte unité de répétition de base;  nombre d'entre elles ont une composition de base ou une propriété différente de la moyenne du génome, qui leur permet d'être séparées du reste de l'ADN génomique (bande principale)
scRNA petit ARN cytoplasmique ("small cytoplasmic RNA");  l'une des nombreuses petites molécules d'ARN cytoplasmique présentes dans le cytoplasme et (parfois) dans le noyau d'un eucaryote
sig_peptide séquence codante d'un peptide-signal;  séquence codante d'un N-terminal de protéine sécrétée;  ce domaine joue un rôle dans l'intégration du polypeptide naissant dans la membrane; séquence leader
snRNA petit ARN nucléaire ("small nuclear RNA");   l'une des nombreuses petites espèces d'ARN confinées au noyau;  plusieurs snRNA jouent un rôle dans l'excision-épissage ou dans d'autres réactions de maturation moléculaire de l'ARN
source permet d'identifier la source biologique de l'intervalle de séquence indiqué;  cette clé est obligatoire;  chaque entrée doit comporter, au minimum, une clé source unique couvrant la séquence tout entière;  il est possible d'utiliser plus d'une clé source par séquence
stem_loop épingle à cheveux;  région d'une double hélice formée par l'appariement de bases entre des séquences contiguës (inversées) complémentaires appartenant à un même brin d'ARN ou d'ADN
STS site de séquence étiqueté;  séquence d'ADN courte et unique caractérisant un point de repère de la cartographie du génome et qui peut être détectée moyennant une amplification en chaîne par polymérase (PCR);  la carte d'une région du génome peut être dressée par détermination de l'ordre d'une série de STS
TATA_signal séquence TATA;  séquence de Goldberg-Hogness;  heptamère conservé, riche en A et T, situé environ 25 paires de bases en amont du site d'initiation de chaque unité transcrite par l'ARN polymérase II des eucaryotes, qui peut jouer un rôle dans le positionnement de l'enzyme aux fins d'une initiation correcte; consensus=TATA(A ou T)A(A ou T)
terminator séquence d'ADN située soit à l'extrémité du transcrit, soit à côté d'un promoteur qui conduit l'ARN polymérase à terminer la transcription;  peut aussi être le site de fixation d'un répresseur
transit_peptide séquence codante d'un peptide-transit;  séquence codante d'un N-terminal de protéine d'un organite codée par le noyau;  ce domaine joue un rôle dans l'importation post-traductionnelle de la protéine dans l'organite
tRNA ARN de transfert mature;  courte molécule d'ARN (75-85 bases) qui permet la traduction d'une séquence d'acides nucléiques en une séquence d'acides aminés
unsure l'auteur n'est pas certain de l'exactitude de la séquence dans cette région
V_region région variable de la chaîne légère et de la chaîne lourde de l'immunoglobuline et des chaînes alpha, bêta et gamma du récepteur d'un lymphocyte T;  codes applicables à la portion variable du terminal amino;  peut être composée des segments suivants : V_segments, D_segments, N_régions et J_segments
V_segment segment variable de la chaîne légère et de la chaîne lourde de l'immunoglobuline et des chaînes alpha, bêta et gamma du récepteur d'un lymphocyte T;  codes applicables à la plus grande partie de la région variable (V_région) et aux quelques acides aminés du peptide leader qui subsistent
variation souche apparentée contenant des mutations stables du même gène (par exemple : RFLP, polymorphismes, etc.) qui diffèrent de la séquence présentée à cet emplacement (et éventuellement à d'autres emplacements)
3'clip région d'un transcrit précurseur située en position 3', qui est coupée durant la maturation moléculaire
3'UTR région en position 3' à l'extrémité d'un transcrit mature (qui suit le codon de terminaison) qui n'est pas traduite en protéine
5'clip région en position 5' d'un transcrit précurseur qui est coupée durant la maturation moléculaire
5'UTR région en position 5' située à l'extrémité d'un transcrit mature (avant le codon d'initiation) qui n'est pas traduite en protéine
-10_signal séquence de pribnow;  région conservée située à environ 10 paires de bases en amont du site d'initiation des unités de transcription bactériennes, qui peut jouer un rôle dans la fixation de l'ARN polymérase;  consensus=TAtAaT
-35_signal hexamère conservé situé à environ 35 paires de bases en amont du site d'initiation des unités de transcription bactériennes;  consensus=TTGACa [  ] ou TGTTGACA [  ]

Explorez l'OMPI