Informations

Différencier des molécules basées sur la séquence peptidique ? Comment annoter ?


Je souhaite différencier les molécules du CMH de classe I classique et non classique dans un organisme modèle en utilisant des caractéristiques structurelles bien conservées au sein des molécules du CMH I classiques (par exemple, des ponts disulfure intradomaine dans le domaine de classe I a1). Pour ce faire, je dois aligner les séquences peptidiques des transcrits de cet organisme modèle avec les transcrits des gènes humains classiques du CMH I et voir quels gènes de ces transcrits ont ces caractéristiques structurelles. Je recherche donc un outil pour aligner et annoter ces caractéristiques structurelles de manière reproductible

De plus, si vous avez d'autres idées bioinformatiques/analyses informatiques sur la façon de trouver des molécules classiques du CMH de classe I sur un organisme mal annoté, ce serait très apprécié !


Différencier des molécules basées sur la séquence peptidique ? Comment annoter ? - La biologie

Les myoblastes C2C12 dérivés de souris servent de système modèle expérimentalement traitable pour étudier la base moléculaire de la spécification et du développement des cellules musculaires squelettiques. Pour examiner de manière exhaustive les adaptations biochimiques associées à la formation de myocytes, nous avons utilisé la spectrométrie de masse en tandem sans gel à grande échelle pour surveiller les altérations globales du protéome tout au long d'une analyse temporelle du programme de différenciation C2C12 myogénique. L'abondance relative d'environ 1 800 protéines à haut niveau de confiance a été suivie sur plusieurs points dans le temps à l'aide d'une chromatographie liquide multidimensionnelle à l'échelle capillaire couplée à un séquençage au fusil de chasse à haut débit. Le regroupement hiérarchique des profils résultants a révélé des ondes différentielles d'expression de protéines liées à la signalisation intracellulaire, à la transcription, à la cytoarchitecture, à l'adhésion, au métabolisme et à la contraction musculaire aux stades précoce, intermédiaire et tardif de la différenciation. Plusieurs centaines de protéines auparavant non caractérisées ont également été détectées de manière spécifique au stade, suggérant de nouveaux rôles dans la myogenèse et/ou la fonction musculaire. Ces données protéomiques sont complémentaires aux récentes études basées sur des puces à ADN des modèles d'expression génique dans les myotubes en développement et fournissent un cadre holistique pour comprendre comment divers processus biochimiques sont coordonnés au niveau cellulaire pendant le développement des muscles squelettiques.

Publié, MCP Papers in Press, 11 avril 2005, DOI 10.1074/mcp.M400182-MCP200

Ces auteurs ont participé à ce travail à part égale.

Chercheur postdoctoral de la Fondation des maladies du cœur du Canada.

Chercheur postdoctoral de la Fondation des maladies du cœur de l'Ontario. Adresse actuelle : Protana Inc., 251 Attwell Dr., Toronto, Ontario M9W TH4, Canada.

Adresse actuelle : Dept. of Biochemistry and Molecular Biology, University of Calgary, 3330 Hospital Dr., Calgary, Alberta T2N 4N1, Canada

Ce travail a été financé en partie par la subvention MOP 49493 des Instituts de recherche en santé du Canada, le Partenariat pour la recherche neuromusculaire, et une subvention de la Muscular Dystrophy Association (États-Unis) (au DHM) par une subvention de développement de la Muscular Dystrophy Association (États-Unis) ( à AOG) et par des subventions du Conseil de recherches en sciences naturelles et en génie du Canada, du Centre d'excellence du réseau d'ingénierie des protéines (PENCE) et des fonds de l'Ontario Genome Institute et de Génome Canada (à AE)


Termes d'annotation du génome, ontologies, nomenclature et classification

Un outil pour trouver des combinaisons significatives d'annotations multisources pour les listes de gènes.

Effectuez une annotation automatisée basée sur les termes GO pour les séquences d'ADNc ou de protéines anonymes.

Trouvez des informations sur la terminologie des tissus.

Trouvez des informations sur les ontologies biomédicales pour piloter l'intégration de données, la récupération d'informations, l'annotation de données, le traitement du langage naturel et l'aide à la décision.

Exécutez l'exploration et la visualisation de données basées sur l'ontologie génétique (GO) sur des données de séquence pour lesquelles aucune annotation GO n'est encore disponible.

Menez une annotation génétique complète, une analyse des données d'expression, une cartographie des voies biologiques et d'autres tâches de génomique fonctionnelle.

Une base de données centrée sur les gènes intégrant des ressources d'annotation de gènes hétérogènes pour faciliter l'analyse fonctionnelle des gènes à haut débit.

Recherchez des informations annotées sur la structure, la fonction et l'expression des gènes et les événements d'épissage alternatif.

Un modèle à variables cachées pour l'intégration des preuves génétiques pour la prédiction des gènes eucaryotes.

Base de données qui fournit plusieurs mesures de similarité sémantique différentes pour les termes GO.

Recherchez l'alignement de séquences annotées à partir de bases de données relationnelles interconnectées pour cinq espèces de vertébrés, l'homme, le chimpanzé, la souris, le rat et le poulet.

Le premier système accessible au public rapporté pour gérer la normalisation des mentions génétiques inter-espèces.

Recherchez des vocabulaires structurés et contrôlés à utiliser par la communauté pour annoter des gènes, des produits de gènes et des séquences.

Recherchez des informations sur les gènes annotées sur la base des vocabulaires standardisés de Gene Ontology.

Une boîte à outils logicielle basée sur le Web pour l'analyse d'enrichissement de l'ontologie génétique.

Superposer les informations d'annotation sur les structures d'ontologie des gènes.

Annotez les données de séquences anonymes avec les termes Gene Ontology (GO).

Trouvez des informations sur les maladies, les gènes et les médicaments liés au vocabulaire MeSH.

Recherchez des caractéristiques biologiques (annotations) qui coexistent fréquemment dans un ensemble de gènes et classez-les par signification statistique.

Un outil logiciel pour soutenir la classification hiérarchique des gènes.

Recherchez des symboles approuvés pour les gènes humains.

Recherchez des symboles approuvés pour les gènes humains.

Trouvez des informations sur les lignées cellulaires humaines courantes.

Recherche de nomenclature d'enzymes, de transporteurs membranaires, de protéines de transport d'électrons et d'autres protéines

Recherche de Nomenclature des composés biochimiques et organiques approuvée par la Commission mixte IUBMB-IUPAC.

Recherchez les recommandations de l'Union internationale de pharmacologie sur la nomenclature des récepteurs et la classification des médicaments.

Un éditeur d'ontologies open source et indépendant de la plate-forme.

Localisez les informations sur les molécules d'adhésion cellulaire (CAM).

Un outil pour l'analyse statistique et la visualisation de données biologiques à grande échelle à l'aide de Gene Ontology.

Recherchez des alignements de séquences multiples et des arbres phylogénétiques couvrant de nombreux domaines protéiques communs.

Parcourez et recherchez des protéines en fonction de leurs fonctions biologiques.

Trouvez des informations sur Arabidopsis thaliana.

Filtrez la littérature courante, les termes biologiques et les informations sur les voies.

Un outil Web pour profiler la fonctionnalité complexe des groupes de gènes identifiés à partir de données à haut débit.

Positionnez automatiquement les contigs d'un génome procaryote inachevé sur (des parties de) un génome modèle d'une souche ou d'une espèce étroitement apparentée afin de combler un nombre important de lacunes restantes dans les dernières étapes d'un projet de séquençage du génome.

Fournit aux chercheurs des outils d'alignement et d'analyse d'ARNr de petites sous-unités bactériennes et archéennes de qualité contrôlée.

Différencier les micro-organismes médicaux en fonction de la séquence partielle de l'ADN ribosomique de la petite sous-unité (ADNr 16S).

Trouvez des groupes de gènes en utilisant Gene Ontology.

Comparez les capacités de différents programmes.

Serveur Web qui identifie les gènes de signature dans un ensemble de séquences de requête, et ainsi le caractérise phylogénétiquement.

À utiliser pour trouver des informations sur les relations entre les objets biologiques.

Classification des médicaments et prédiction des cibles.

Recherchez des informations complètes sur la taxonomie de tous les organismes représentés dans GenBank.

Fournit des interfaces interactives et programmatiques pour interroger, parcourir et naviguer dans un nombre toujours croissant d'ontologies biomédicales et de vocabulaires contrôlés.

Recherchez des informations complètes sur la phylogénie et la biodiversité.

Recherchez des vocabulaires biomédicaux standardisés, des concepts et leurs relations.

Tracez les annotations de l'ontologie des gènes sur un histogramme.

Effectuer l'analyse de l'ontologie génétique des espèces agricoles.

Le système de bibliothèque des sciences de la santé soutient les sciences de la santé de l'Université de Pittsburgh.

© 1996 - 2014 Health Sciences Library System, Université de Pittsburgh. Tous les droits sont réservés.
Contactez le Webmestre


Questions d'examen sur la biologie moléculaire | La biologie

Réponse : Cette hypothèse explique le modèle observé de dégénérescence dans la troisième base d'un codon. Selon cette hypothèse la troisième base peut subir avec la première base correspondante dans l'anticodon. L'importance de l'oscillation et de la dégénérescence du code génétique est que la cellule n'a pas à synthétiser un ARNt différent pour chacun des 61 codons sens. Un exemple simple est que seuls deux anticodons d'ARNt différents sont nécessaires pour reconnaître quatre codons de glycine différents.

Q.2. Qu'est-ce que la séquence Shine-Dalgarno ? Dans quels groupes de micro-organismes se trouve-t-il ?

Réponse : La séquence Shine-Dalgarno est située avant la séquence de départ de l'ARNm. Cette séquence nucléotidique permet à l'ARNm de s'aligner avec la sous-unité ribosomique 30S de la cellule bactérienne. C'est environ 7 bases en amont plus tôt) vers l'extrémité 5 ‘-P du codon de départ AUG sur l'ARNm et est une séquence consensus polypurine AGGAGG et est appelée séquence Shine-Dalgarno (Fig. 33.7). On le trouve dans les cellules bactériennes et archéennes.

Q.3. Que signifient les codons UGA, UAA et UAG en traduction normale ?

Réponse : En traduction normale, ils signifient pour les codons “Stop”.

Q.4. Pourquoi le code génétique est-il dégénéré ?

Réponse : C'est parce que plus d'un codon peut coder pour le même acide aminé.

Q.5. Combien y a-t-il de codons de terminaison ou de codons non-sens ?

Réponse : Il n'y a également que trois codons de terminaison, appelés "codons non-sens" car ils ne codent pour aucun acide aminé.

Q.6. Le codon AGG code normalement pour l'argine, mais en traduction modifiée, il code pour l'arrêt. Où cela se produit-il ?

Réponse : Il se produit dans les mitochondries humaines.

Q.7. Qu'y a-t-il d'étrange dans les études faites sur l'ADN mitochondrial (génome à ADN circulaire double brin) lorsqu'on procède des eucaryotes inférieurs aux eucaryotes supérieurs ?

Réponse : Alors que l'on passe des eucaryotes inférieurs aux eucaryotes supérieurs, la chose étrange dans le génome mitochondrial est qu'il devient plus petit, par exemple, l'ADN mitochondrial de la levure est cinq fois plus grand que celui des mitochondries humaines.

Q.8. Qu'est-ce qui a permis à un ARNt donné de reconnaître parfois spécifiquement plusieurs codons ?

Réponse : L'oscillation de la paire de bases à l'extrémité 5 & 8242 de l'anticodon permet à l'ARNt donné de reconnaître plusieurs codons.

Q.9. Toutes les protéines bactériennes nouvellement synthétisées commencent (initient) avec la formylméthionine (peut être abrégé en fmet). Comment le groupe formyle est-il éliminé du polypeptide fmet chez les bactéries?

Réponse : Le groupe formyle est souvent éliminé de la formyl-méthionine par l'enzyme déformylase, laissant la méthionine comme premier acide aminé dans la chaîne polypeptidique.

Q.10. Que sont les gènes ? Définir.

Réponse : Un gène peut être défini comme une séquence de nucléotides qui spécifie une chaîne polypeptidique ou une séquence d'ARN particulière ou qui régule l'expression d'autres gènes. Les gènes qui codent pour les protéines sont appelés gènes de structure ou cistrons, tandis que les autres gènes porteurs d'une fonction régulatrice sont appelés gènes régulateurs. Les gènes régulateurs agissent pour contrôler l'expression des gènes de structure. Les gènes de structure et de régulation constituent collectivement le génotype qui détermine le phénotype, c'est-à-dire les caractéristiques structurelles et fonctionnelles observables.

Réponse : Séquence d'ADN qui code pour un ou plusieurs gènes de structure (polypeptides) de fonction apparentée et la séquence d'ADN qui régule l'expression.

Q.12. Qu'est-ce qui contrôle l'induction et le refoulement ?

Réponse : Les gènes régulateurs qui produisent une protéine régulatrice contrôlent l'induction (c'est-à-dire l'augmentation du taux de synthèse d'une enzyme) et la répression (c'est-à-dire le blocage de l'expression génique).

Q.13. Qu'est-ce que l'opéron lac ?

Réponse : L'opéron lac signifie l'opéron lactose, un opéron qui contient des gènes spécifiant les protéines impliquées dans l'utilisation des (3 -galactosides tels que le lactose. L'opéron lac se produit chez Escherichia coli à environ (= environ) 8 minutes sur la carte chromosomique. Il a la structure : promoteur-opérateur lac Zr-lac Y-lac A. Le gène lac Z code pour la P-galactosidase, lac Y code la (3-galactoside perméase et lac A code la thiogalactoside transacétylase (Fig. 33.8).

Q.14. Qu'est-ce que la répression catabolique ?

Réponse : La répression catabolique est la répression de la transcription de gènes codant pour certains systèmes enzymatiques inductibles par le glucose ou d'autres sources de carbone facilement utilisables.

Q.15. Que sont les régulateurs positifs (activateurs) et les régulateurs négatifs (répresseurs) ? Décris.

Réponse : Les bactéries possèdent de nombreuses enzymes dont la vitesse de synthèse dépend de la disponibilité de molécules alimentaires externes. Ces molécules externes appelées inducteurs et co-répresseurs déterminent généralement la vitesse de synthèse des enzymes en contrôlant la synthèse de leurs matrices d'ARNm. Les inducteurs et co-répresseurs agissent en se liant à des protéines régulatrices appelées activateurs et répresseurs.

Les activateurs sont des régulateurs positifs car leur présence est nécessaire à la fabrication de l'enzyme régulée, tandis que les répresseurs agissent comme des régulateurs négatifs car leur activité régulatrice est d'empêcher la synthèse de protéines. Ainsi, lorsque le lactose est absent, le répresseur de l'opéron lac (opéron lactose) empêche la synthèse des enzymes qui métabolisent le lactose. Cependant, en se liant à un inducteur (une molécule apparentée au lactose), le répresseur perd cette capacité et permet la production d'enzymes. La protéine arabinose opéron C qui est un activateur provoque la fabrication d'enzymes arabinose lors de la liaison à l'inducteur arabinose.

Q.16. Qu'est-ce que la séquence palindromique de l'ADN?

Réponse : Littéralement parlant, le palindrome est un mot qui se lit de la même manière en avant et en arrière. La séquence palindromique est une région d'un acide nucléique qui contient une paire de séquences répétées inversées. Dans une molécule d'ADN double brin, une telle région présente une symétrie de rotation (dyade) double ou une symétrie de dyade hypemée si les deux séquences IR sont séparées par une autre séquence. Une séquence palindromique double brin peut adopter l'une des deux formations possibles :

1. Une structure linéaire avec une liaison hydrogène interbrin, par exemple,

2. Une structure cruciforme dans laquelle deux brins forment chacun des épingles à cheveux par liaison hydrogène intra-brin.

Q.17. Qui a découvert que les rayons X induisaient des mutations ?

Réponse : Hermann Muller et L.J. Stadler ont découvert indépendamment en 1927 que les rayons X induisent des mutations.

Réponse : Un cistron est un gène tel que défini en termes de CIS-TRANS TEST, c'est-à-dire dans une cellule diploïde ou un mérozygote l'une ou l'autre de deux séquences homologues dans un acide nucléique génétique dans lequel deux mutations en trans ne parviennent pas à présenter une complémentation complète. Un cistron peut également être défini comme l'unité fonctionnelle du patrimoine génétique, un segment d'acide nucléique génétique qui code pour une chaîne polypeptidique spécifique. Le terme cistron a également été utilisé comme synonyme de gène.

Réponse : Le terme recon a été inventé par S. Benzer. Selon lui, c'est une unité de subdivision génétique au-delà de laquelle la recombinaison ne se produit pas.

Q.20. Définir un mutateur ou un gène mutateur.

Réponse : Un gène mutateur ou mutateur est désigné comme un moût au sein duquel certaines mutations provoquent une augmentation du taux de mutation spontanée dans d'autres gènes, par exemple, des mutations d'Escherichia coli dans le gène codant pour la sous-unité e de l'ADN polymérase III (allèles ADN Q et mut D) peuvent entraînent des taux extrêmement élevés de mutations spontanées. Les allèles mutants peuvent différer du type sauvage, par exemple, par seulement un ou deux changements d'acides aminés dans la sous-unité . La mutation peut conduire à une précision réduite de l'activité de polymérisation (sélection des nucléotides) ou de l'activité de relecture de l'enzyme. Certains autres gènes mutants dans E.Coli sont inclus dans le système de réparation des mésappariements.

Q.21. Que sont les gènes divisés ? Décris.

Réponse : Les gènes scindés peuvent être définis comme les gènes qui sont codés par des segments non contigus de l'ADN de sorte que l'ARNm et l'ADN du produit protéique de ce gène ne sont pas colinéaires. Ce sont les gènes avec des séquences nucléotidiques intermédiaires non impliquées dans le codage du produit génique.

Les gènes divisés ont également été considérés comme des gènes interrompus. Un gène de structure codant pour une protéine, un ARNr ou un ARNt qui contient un trop grand nombre de séquences intermédiaires (introns) qui, bien que représentées dans le transcrit d'ARN primaire du gène, sont absentes de la molécule d'ARN mature (ARNm, ARNt), par conséquent, ne contribuent pas à la structure du produit du gène.

Ainsi, la mutation du transcrit d'ARN d'un gène scindé doit impliquer un processus d'épissage pour supprimer l'intron et réunir les séquences restantes appelées exons. Dans le cas de l'ARNm, la séquence d'exons comprend la séquence codante du gène ainsi que les séquences de tête et/ou de queue non codantes. Les introns eux-mêmes sont généralement non codants. La plupart des gènes de structure nucléaire chez les eucaryotes supérieurs sont des gènes divisés.

Q.22. Quels sont les gènes qui se chevauchent?

Réponse : Les gènes qui se chevauchent sont deux gènes ou plus dans lesquels une partie ou un gène complet est coextensif avec une partie d'un autre. Les gènes peuvent être traduits dans différents cadres de lecture ou dans le même cadre de lecture avec différents points de départ et/ou d'arrêt ou différents schémas d'épissage. Le phénomène de chevauchement des gènes maximise la capacité de codage d'un génome et peut également fournir un moyen pour la régulation de l'expression des gènes.

Q.23. L'histoire du monde de l'ADN est écrite dans les séquences de gènes. Justifiez cette affirmation.

Réponse : L'évolution des organismes à partir d'un ancêtre commun est représentée par une voie ramifiée connue sous le nom d'arbre géologique (également connu sous le nom d'arbre phylogénétique ou évolutif). Le schéma de ramification de l'arbre est calculé en utilisant le principe de parcimonie (basé sur l'économie) pour déterminer le nombre minimum de changements génétiques requis pour dériver la séquence du gène dans chaque organisme à partir d'un ancêtre commun. Il est parfois raisonnable de supposer que des protéines hautement conservées comme la globine et le cytochorme c peuvent être utilisées comme horloge moléculaire pour mesurer depuis combien de temps les espèces ont divergé les unes des autres.


Logiciel gratuit de biologie moléculaire pour Windows

Genamics SoftwareSeek est un bon point de départ. Les sites suivants sont classés dans l'ordre dans lequel je les ai découverts. À un moment donné, ils seront regroupés par poréférence :

Analyses ADN, ARN et génomique :

Gegenees est un projet logiciel pour l'analyse comparative des données de séquence du génome entier et d'autres données de séquence de nouvelle génération (NGS). Le logiciel peut par ex. comparer un grand nombre de génomes microbiens, donner des aperçus phylogénomiques et définir des signatures génomiques uniques pour des groupes cibles spécifiés. J'utilise ce logiciel qui permet des comparaisons BLASTN et TBLASTX sur des séquences de phages afin de définir des relations (Référence : Agren J et al. 2012. PLoS One. 7:e39107)

MyRAST - Il est désormais possible d'obtenir une annotation assez précise d'un génome procaryote en une journée environ à l'aide de ce progiciel.La dernière version Windows ou Mac du logiciel peut être téléchargée ici. Vous devriez consulter la page d'aide - Annoter un génome à l'aide de myRAST et Distribution des packages du serveur SEED

Tablet - Next Generation Sequence Assembly Visualization - est une visionneuse graphique légère et hautes performances pour les assemblages et alignements de séquences de nouvelle génération. Prise en charge des formats de fichiers pour ACE, AFG, MAQ, SOAP2, SAM et BAM. Importez des fonctionnalités GFF3 et recherchez/mettez en surbrillance/affichez-les rapidement. Recherchez et localisez les lectures par nom dans des ensembles de données entiers. Vues d'ensemble du contig, montrant la disposition des données ou les informations de couverture.

BlastStation-Free prend en charge les recherches mégablast, blastn, blastp et blastx, ce qui permet de créer facilement une base de données à partir de votre fichier FASTA ou FASTQ, qui peut être compressé au format .gz, .Z ou .zip. Un affichage graphique des résultats de la recherche et un affichage sous forme de tableau récapitulatif des résultats de la recherche. Ces derniers peuvent être exportés au format CSV, tandis que les séquences de hits peuvent être exportées au format FASTA. Également disponible en téléchargement au format Mac ou PC.

Gene Designer - un outil logiciel brillant qui permet de combiner des éléments constitutifs tels que des éléments d'ADN régulateurs (promoteurs, sites de liaison au ribosome) avec des séquences d'acides aminés, des balises d'affinité et de clivage de protéase et des fonctionnalités de clonage et des codons optimisés pour tout hôte d'expression.

CLC Free Workbench - permet une analyse de séquence de base telle que la détermination du cadre de lecture ouvert, l'analyse des sites de restriction, la traduction de l'ADN/ARN en protéines, les alignements et la reconstruction d'arbres dans un format de fenêtre unique.

GAUFRER (Eeuropéen Moléculaire Biologie Ostylo Source Slogiciel Suite) peut être téléchargé à partir d'ici.

PHIRE - ce programme Visual Basic effectue une recherche algorithmique basée sur des chaînes sur les séquences du génome des bactériophages, découvrant et extrayant des blocs présentant une similarité de séquence, correspondant aux éléments régulateurs conservés contenus dans ces génomes de manière systématique, sans aucune connaissance expérimentale ou prédictive préalable. ( Référence : Lavigne, R. et al. 2004. PHIRE, une approche déterministe pour révéler des éléments régulateurs dans les génomes des bactériophages. Bioinformatique 20: 629-635).

Analyse ADN MB (Oleg Simakov) - MB est un programme gratuit d'analyse ADN/protéines multifonctionnel. Son principal avantage est qu'il combine toutes les fonctionnalités les plus largement utilisées nécessaires à une analyse moléculaire avancée des données génomiques/protéomiques. Les caractéristiques de MB incluent un algorithme d'analyse de restriction rapide (inclus plasmide / dessin d'ADN linéaire), l'analyse des promoteurs, le calcul des poids moléculaires et des propriétés chimiques des protéines, la prédiction des structures protéiques secondaires (d'après Chou-Fasman). L'analyse des protéines comprend également la traduction des séquences et le calcul du tableau d'utilisation des codons. Autres fonctionnalités : outil d'alignement de séquences multiples hiérarchique (avec une fonctionnalité pour comparer la structure secondaire des protéines), construction d'arbres phylogénétiques, dot plot, estimation du point isoélectrique pour les protéines, conception d'amorces. Un outil pour l'analyse structurelle des hélices alpha est également inclus dans le package principal.
GenePalette permet la visualisation et la navigation des séquences du génome. Les utilisateurs peuvent télécharger à partir de la base de données NCBI GenBank de grands ou petits segments de séquences génomiques provenant d'une variété d'organismes en préservant l'annotation génétique associée à cette séquence. Les éléments de séquence d'intérêt (sites de liaison des facteurs de transcription, etc. peuvent être recherchés et identifiés dans la séquence chargée, puis clairement visualisés dans une représentation graphique colorée de l'organisation des gènes.

UGene (UniPro Bioinformatics Group, Russia) - sans aucun doute l'un des meilleurs progiciels pour l'annotation du génome ( Référence : Okonechnikov K et al. 2012. Bioinformatics 28: 1166-1167).

Artemis : un visualiseur et un outil d'annotation de séquences d'ADN (Centre Sanger)

SEQtools est un progiciel pour la manipulation et l'analyse de routine des séquences d'ADN et de protéines. Le package comprend des fonctionnalités générales pour l'édition de séquences et de contigs, la cartographie des enzymes de restriction, la traduction et l'identification des répétitions. Gratuit pour les étudiants

DNA Club - Logiciel d'analyse d'ADN, les fonctionnalités incluent la suppression de la séquence vectorielle, la recherche, la recherche de l'ORF, l'édition de séquences, la traduction en séquence protéique, l'édition de séquences protéiques, la carte RE, la carte RE avec traduction, la sélection d'amorces PCR, l'évaluation d'amorces ou de sondes, etc.

DNA for Windows est un programme d'analyse d'ADN compact et facile à utiliser, idéal pour les projets de séquençage à petite échelle.

RNAdraw - est un programme intégré pour le calcul et l'analyse de la structure secondaire de l'ARN par Ole Matzura & Anders Wennborg (1996) Computer Applications in the Biosciences (CABIOS) 12: 247-249

RNAstructure - Prédiction et analyse de la structure secondaire de l'ARN pour Microsoft Windows. Ce programme comprend un algorithme de prédiction de structure secondaire, un éditeur de séquences, un outil de dessin intégré, le programme OligoWalk, OligoScreen, Dynalign et un calculateur de fonction de partition. ( Référence: 21: 2246 - 2253.)

Chromas affichera et imprimera les fichiers de chromatogrammes des séquenceurs d'ADN automatisés ABI et les fichiers Staden SCF que les programmes d'analyse pour les séquenceurs ALF, Li-Cor et Visible Genetics OpenGene peuvent créer. N.B. seules les anciennes versions du logiciel sont gratuites.

FinchTV - Un autre outil utile pour visualiser et éditer des électrophérogrammes.

L'environnement d'analyse du génome en langage G fournit une plus grande variété d'outils d'analyse du génome utiles par rapport à la plupart des progiciels d'analyse existants, et est également facilement enfichable. Tous ses outils sont accessibles sous forme de modules Perl. Pour commencer, téléchargez les fichiers génomiques de GenBank au format *.gbk (format de fichier plat GenBank).


DNA Master - est "peut-être le meilleur éditeur de séquences au monde" et un package d'analyse. Recherchez sous "ordinateur."

GeSTer (V. Nagaraja, Institut indien des sciences, Bangalore. Inde) - est extrêmement utile pour localiser les structures tige-boucle, y compris les terminateurs rho-indépendants dans les génomes annotés. Comme il ne fonctionne pas facilement sous Windows XP, voyez comment vous pouvez modifier le fichier *.gbk pour qu'il fonctionne.

Package Staden - se compose d'une série d'outils pour la préparation de séquences d'ADN (pregap4), l'assemblage (gap4), l'édition (gap4) et l'analyse de séquences d'ADN/protéines (spin). Le progiciel a été développé à l'origine au MRC-LMB à Cambridge. Il est désormais open source (licence BSD) et hébergé sur sourceforge.net.

Seqool - logiciel d'analyse de séquences conçu principalement pour rechercher des signaux biologiques dans des séquences d'acides nucléiques. Le progiciel d'analyse de séquence fournit plusieurs modèles de reconnaissance de formes, mais il inclut également les statistiques d'analyse de séquence les plus courantes, telles que le contenu GC, l'utilisation des codons, etc.

GENtle - progiciel pour l'édition d'ADN et d'acides aminés, la gestion de bases de données, les cartes de plasmides, la restriction et la ligature, les alignements, l'importation de données de séquenceur, les calculatrices, l'affichage d'images de gel, la PCR et bien plus encore.

RepeatAround - est conçu pour trouver les &ldquorépétitions directes&rdquo, &ldquoinverted repeats&rdquo, &ldquomirror repeats&rdquo et &ldquorépétitions complémentaires&rdquo, de 3 pb à 64 pb de longueur, dans des génomes circulaires. Il traite les fichiers d'entrée directement extraits de la base de données GenBank ou de simple séquence. Les sorties peuvent être obtenues dans une feuille de calcul contenant des informations sur le nombre et l'emplacement des répétitions. (Référence : Goios A et al. 2006. Mitochondrie 6: 218-224) .

ACUA (UNEautomatisé Codon Usauge UNEanalyse Bioinsilico Technologies ) - est une interface basée sur Visual Basic pour l'analyse des codons Insilico. Cet outil fournit diverses fonctionnalités uniques telles que l'analyse des nucléotides, l'analyse statistique des codons. L'outil effectue une analyse nucléotidique pour la ou les séquences de requêtes et présente les résultats dans des feuilles de calcul, qui peuvent être utilisées ultérieurement pour une analyse statistique. Cet outil s'avérera très utile pour les scientifiques qui souhaitent effectuer une analyse de codons pour plusieurs séquences simultanément.

SnapGene Viewer - inclut les mêmes capacités de visualisation, d'annotation et de partage riches que le logiciel SnapGene entièrement activé. Je suis très impressionné par ce freeware qui m'a permis de produire cette carte à partir du fichier gbk.

pLOT (Jean-Marc DeKeyser, Vanderbilt University, U.S.A.)

ApE Plasmid Editor (M. Wayne Davis, Univ. Utah, États-Unis) met en évidence et dessine des cartes graphiques en utilisant des annotations de caractéristiques des fichiers GenBank et EMBL crée des cartes de restriction graphique - linéaires ou circulaires avec des caractéristiques indiquées et permet des analyses BLAST ainsi qu'un certain nombre d'autres caractéristiques.

Logiciel d'analyse d'ADN pDRAW32 par le logiciel AcaClone (Kjeld Olesen). pDRAW vous permet d'entrer un nom d'ADN et des coordonnées pour les éléments génétiques, tels que les gènes, à tracer sur vos parcelles d'ADN.

Plasmide BVTech - avec ce programme, vous pouvez dessiner une carte plasmidique circulaire ou linéaire à double brin ou à simple brin. Vous pouvez étiqueter le plasmide avec des gènes et des sites de restriction de différentes couleurs, textes et styles.

Programme de dessin de plasmide : Plasmidomique 0.2 (Robert Winkler, Cinvestav Unidad Irapuato, Mexique)

Picky est un programme de conception de puces à ADN oligo qui identifie des sondes très uniques et spécifiques aux séquences d'entrée. Ces calculs sont basés sur des paramètres entrés par l'utilisateur, notamment la longueur optimale de la sonde, le pourcentage idéal de teneur en guanine et en cytosine, la température de fusion cible, la concentration en sel et la longueur maximale à laquelle une séquence cible correspond à toute séquence non cible. ( Référence : H.-H. Chou et al. (2004) Bioinformatique 20: 2893-2902). Téléchargez les fichiers génome *.ffn de GenBank pour une utilisation avec ce programme. N.B. Malheureusement, ces fichiers n'incluent pas les noms des gènes uniquement leurs coordonnées.

AiO (All in One) est un programme pour Windows, qui combine des fonctionnalités typiques d'ADN/protéines telles que le dessin de carte plasmidique, la recherche d'ORF, la traduction, la rétrotraduction, la conception d'amorces et le clonage virtuel. AiO utilise des bases de données qui permettent la gestion des oligonucléotides, des fabricants d'oligonucléotides, des enzymes de restriction, de l'ADN structurel et des utilisateurs de programmes dans un environnement multi-utilisateurs/multi-groupes. (Référence : Karreman C. (2002) Bioinformatique. 18:884-885).

- Oligo Analyzer est un outil simple pour déterminer les propriétés des amorces telles que Tm, GC%, boucles d'amorces, dimères d'amorces et compatibilité amorce-amorce. Tout ce que vous avez à faire est de coller ou de taper la séquence d'amorces et de laisser Oligo Analyzer calculer toutes les propriétés d'amorces importantes mentionnées ci-dessus. Lisez-moi

- Oligo Explorer est un outil de recherche d'amorces et de paires d'amorces. Le programme analyse toutes les propriétés d'amorces importantes telles que Tm, GC%, boucles d'amorces, dimères d'amorces, etc. Lisez-moi

AnnHyb Les fonctionnalités de ce programme incluent l'édition de séquences avec relecture, la conversion de format, la traduction, les statistiques de séquence, la conception de sondes et l'analyse.

- MeltCalc est le tableur de modélisation thermodynamique ultime pour Excel&trade qui vous permet d'analyser des sondes. Voir : Logiciel de feuille de calcul pour la prédiction du point de fusion thermodynamique de l'hybridation d'oligonucléotides avec et sans mésappariements (Référence : Schüumltz, E., von Ahsen, N. (1999) BioTechniques 27:1218-1224).

ANTHEPROT (ANAlyse THE PROTeins) est le résultat d'une activité de bioinformatique à l'Institut de Biologie et de Chimie des Protéines (Lyon, France)

STORM - ce programme extrait les séquences de protéines après prédiction ORF et effectue ensuite une analyse automatique pour chacune des protéines. Cette analyse consiste en des recherches de similarité basées sur le Web (BLASTp et FASTA) ainsi que des prédictions Pfam et des calculs Protparam des propriétés physico-chimiques des protéines. La sortie brute de ces analyses est ensuite analysée et résumée. (Référence : Lavigne, R. et al. (2003). Applied Bioinformatics 2: 177-179).

VESPA (Vhabituel Eévaluation et Sdes statistiques à Ps'éloigner UNEnnotation) visant à l'intégration de données protéomiques centrées sur les peptides avec d'autres formes de données qualitatives et quantitatives à haut débit, telles que les données des analyses Ref-SEQ. À la base, VESPA intègre des données protéomiques ascendantes avec des informations au niveau du génome, c'est-à-dire la cartographie des peptides à leurs emplacements génomiques respectifs. Cette capacité est une nécessité en protéogénomique où les scientifiques corrigent les erreurs d'annotation ou identifient de nouveaux gènes. La visualisation permet à l'utilisateur d'observer l'emplacement et la séquence des peptides qui ne correspondent pas aux annotations actuelles, ainsi que d'offrir des critères de filtrage précieux tels que l'élimination des peptides ambigus.

Yasara (Gregor Högenauer, Günther Koraimann, & Andreas Kungl [Univ. Graz, Autriche] & Gert Vriend [Univ. Nijmegen, Pays-Bas]) est un programme génial pour visualiser des structures 3-D d'étiquetage. Pour visualiser votre propre structure pdb, faites un clic droit et choisissez ouvrir avec (Yasara). Ce programme gratuit fait partie d'un package de modélisation moléculaire plus complet.

RasMol est un logiciel pour étudier les structures moléculaires. C'est très rapide : la rotation d'une protéine ou d'une molécule d'ADN montre sa structure 3D.

Deep View (Swiss-PdbViewer) est une application qui fournit une interface conviviale permettant d'analyser plusieurs protéines en même temps. Les protéines peuvent être superposées afin de déduire des alignements structuraux et comparer leurs sites actifs ou toutes autres parties pertinentes. Les mutations d'acides aminés, les liaisons H, les angles et les distances entre les atomes sont faciles à obtenir grâce à l'interface graphique et de menu intuitive

- Biodesigner est un programme de modélisation et de visualisation moléculaire pour ordinateurs personnels capable de créer des modèles homologues de protéines, d'évaluer et d'affiner les modèles.

RasTop - RasTop est un logiciel de visualisation moléculaire adapté du programme RasMol en enveloppant une interface graphique conviviale autour du "moteur moléculaire RasMol". Le logiciel permet d'ouvrir plusieurs molécules dans la même fenêtre et plusieurs fenêtres d'être ouvertes en même temps. Grâce à un menu étendu et à un panneau de commandes, les utilisateurs peuvent manipuler rapidement de nombreuses molécules et en prendre connaissance. Les sessions de travail sont enregistrées au format script et sont entièrement régénérées d'un simple clic de souris.

ClustalX est une interface Windows pour le programme d'alignement de séquences multiples ClustalW. Il fournit un environnement intégré pour effectuer plusieurs alignements de séquences et de profils et analyser les résultats. (Référence : J.D. Thompson et al. (1997). Nucleic Acids Research 24: 4876-4882).

VennPlex - un programme qui illustre les interactions numériques souvent diverses entre plusieurs ensembles de données très complexes, en utilisant jusqu'à quatre ensembles de données. VennPlex comprend des fonctionnalités de sortie polyvalentes, où les points de données groupés dans des régions spécifiques peuvent être facilement exportés dans une feuille de calcul. Ce programme est capable de faciliter l'analyse de deux à quatre ensembles de gènes et de leurs valeurs d'expression correspondantes d'une manière conviviale. (Référence : Cai H et al. (2013) PLoS One 8(1): e53388).

BioEdit est un éditeur d'alignement de séquences et un programme d'analyse de séquences facile à utiliser et piloté par la souris, conçu et écrit par Tom Hall (North Carolina State University). Il fournit également la capacité BLAST sur les bases de données locales.

CHROMA prend vos données de séquences multiples alignées, annote les résidus selon un consensus et affiche l'alignement en utilisant différents formats de police (couleurs de texte et d'arrière-plan, gras et italique). L'annotation formatée peut être envoyée directement dans Microsoft Word ou enregistrée dans un fichier ou dans le presse-papiers Windows aux formats HTML et "Rich Text". (Référence : L. Goodstadt & C.P. Ponting. (2001) Bioinformatique 17: 845-846).

SeaView est un éditeur graphique d'alignement de séquences multiples développé par Manolo Gouy. SeaView est capable de lire différents formats d'alignement (MSF, CLUSTAL, FASTA, PHYLIP, MASE). Il permet de modifier manuellement l'alignement, et également d'exécuter des programmes DOT-PLOT ou CLUSTAL pour améliorer localement l'alignement.

L'outil de démarcation de séquence (SDTv1.2) est un programme gratuit et facile à utiliser qui permet la classification des séquences virales en fonction de l'identité par paire de séquences. Il prend en entrée un fichier FASTA de séquences d'ADN ou de protéines alignées ou non alignées et aligne chaque paire unique de séquences, calcule les scores de similarité par paire et affiche une matrice codée par couleur de ces scores. Il produit également à la fois un tracé de ces scores d'identité par paire et des fichiers texte contenant les résultats de l'analyse. Les scores d'identité sont calculés sous la forme 1-(M/N) où M est le nombre de nucléotides mésappariés et N le nombre total de positions le long de l'alignement auxquelles aucune des séquences n'a de caractère de brèche. (Référence : Muhire BM et al. (2014) PLoS ONE 9(9): e108277).

HyPhy - destiné à effectuer des analyses de probabilité maximale de données de séquence génétique et équipé d'outils pour tester diverses hypothèses statistiques. HYPHY a été conçu avec une flexibilité maximale à l'esprit et à cette fin, il intègre un langage de programmation simple de haut niveau qui permet à l'utilisateur d'adapter précisément les analyses à ses besoins. Ceux-ci incluent des tests de taux et de rapport relatifs, plusieurs méthodes de reconstruction de la phylogénie basée sur ML, l'amorçage, la sélection de modèles, la sélection positive, les tests d'horloge moléculaire et bien d'autres (Référence : S.L. Kosakovsky et al. (2005) Bioinformatics 21:676-679).

ChromaClade - est un outil pratique avec une interface utilisateur graphique qui fonctionne de concert avec les visionneuses d'arbres populaires pour produire des phylogénies annotées en couleur mettant en évidence les résidus trouvés dans chaque taxon et sur chaque site dans un alignement de séquence. La coloration des branches en fonction des résidus trouvés aux extrémités des descendants identifie également rapidement les résidus spécifiques à la lignée et les branches internes où des substitutions clés se sont produites. (Référence : Monit C et al. (2019) BMC Evol Biol 19: 186).

TREECON - est un progiciel développé principalement pour la construction et le dessin d'arbres phylogénétiques sur la base de distances évolutives déduites de séquences nucléiques et d'acides aminés. Il offre une opportunité considérable de changer l'apparence de l'arbre. (Référence : Van de Peer, Y. & De Wachter, Y. (1994) Comput. Applic. Biosci. 10, 569-570).

Treefinder (Gangolf Jobb, Statistical Genetics and Bioinformatics, Université de Munich) calcule des arbres phylogénétiques à partir de séquences nucléotidiques. En utilisant la méthode du maximum de vraisemblance largement acceptée, il offre une variété de modèles évolutifs jusqu'au modèle réversible dans le temps général avec une hétérogénéité du taux de position gamma et des codons entre les sites. La confiance des relations inférées peut être évaluée par une analyse bootstrap ou, alternativement, par une méthode de sites appariés de réarrangement local (LRP). Versions Linus et Mac également disponibles.

MEGA - un programme d'analyse phylogénétique incroyable. (Référence : S. Kumar et al. (2001) Bioinformatique 17: 1244-1245)..

Tree-Puzzle (H.A. Schmidt, K. Strimmer, M. Vingron, & A. von Haeseler, Allemagne) construit des arbres phylogénétiques à partir de données de séquence moléculaire par maximum de vraisemblance. Il implémente un algorithme de recherche arborescente rapide, quatuor déroutant, qui permet l'analyse de grands ensembles de données et attribue automatiquement des estimations de support à chaque branche interne. TREE-PUZZLE calcule également les distances de vraisemblance maximales par paires ainsi que les longueurs de branches pour les arbres spécifiés par l'utilisateur. Les longueurs de branches peuvent être calculées sous l'hypothèse d'horloge. De plus, TREE-PUZZLE propose une nouvelle méthode, la cartographie de vraisemblance, pour étudier le support d'une branche interne hypothétique sans calculer un arbre global et pour visualiser le contenu phylogénétique d'un alignement de séquences.

PHYLIP (le PHYLogeny Inference Package) est un ensemble de programmes permettant d'inférer des phylogénies. PHYLIP est le package de phylogénie le plus largement distribué et est en concurrence avec PAUP pour être le responsable du plus grand nombre d'arbres publiés (Joe Felsenstein, University of Washington, U.S.A.).

MrBayes est un programme d'inférence bayésienne de phylogénie utilisant les méthodes de Markov Chain Monte Carlo. MrBayes a une interface de console et utilise un format NEXUS modifié pour les données et les fichiers batch. Il gère un large éventail de modèles probabilistes pour l'évolution des séquences de nucléotides et d'acides aminés, des sites de restriction et des données binaires standard. L'utilisateur peut définir les priors utilisés pour les paramètres et rechercher des arbres sous contraintes topologiques.

PAML est un progiciel pour les analyses phylogénétiques de séquences d'ADN ou de protéines utilisant le maximum de vraisemblance. Il est maintenu et distribué gratuitement pour un usage académique par Ziheng Yang.

NJplot est un programme de dessin d'arbre capable de dessiner n'importe quel arbre binaire exprimé dans le format d'arbre phylogénétique standard (par exemple, le format utilisé par le package PHYLIP). NJplot est particulièrement pratique pour enraciner les arbres non racinés obtenus à partir de méthodes de construction d'arbres par parcimonie, distance ou maximum de vraisemblance. Écrit par Manolo Gouy.

Outil d'identification des nucléotides moyens orthologues (OAT) - L'OAT utilise OrthoANI pour mesurer la similitude globale entre deux séquences génomiques. ANI et OrthoANI sont des algorithmes comparables : ils partagent le même seuil de démarcation des espèces à 95

96% et de grandes études comparatives ont démontré que les deux algorithmes produisent des similitudes réciproques presque identiques. Les détails de l'algorithme OrthoANI sont donnés dans (Lee et al. 2015). OAT utilise une interface utilisateur graphique facile à suivre qui permet aux chercheurs de calculer les valeurs OrthoANI entre les génomes d'intérêt sans environnements de ligne de commande inconnus. (Référence : Lee, I. et al. (2015). Int J Syst Evol Microbiol. 66: 1100-1103).

SeqVerter est un utilitaire de conversion de format de fichier de séquence de GeneStudio, Inc.

DynaFit - Effectuez une régression des moindres carrés non linéaire sur des données cinétiques chimiques ou enzymatiques.

PrestoPlot - Outil de traçage 2D

Xenu's Link Sleuth (TM) est un logiciel de spidering qui vérifie les sites Web à la recherche de liens rompus. La vérification des liens est effectuée sur les liens "normaux", les images, les cadres, les plug-ins, les arrière-plans, les images cliquables locales, les feuilles de style, les scripts et les applets Java. Il affiche une liste d'URL continuellement mise à jour que vous pouvez trier selon différents critères. J'utilise ce programme pour vérifier si les liens sur les outils d'analyse en ligne fonctionnent.

Paint.NET est un outil d'édition de photos et d'images conçu pour les ordinateurs exécutant Microsoft Windows XP ou Windows 2000. Il sert la communauté de l'imagerie numérique en tant qu'alternative gratuite à l'application de peinture standard incluse avec Windows. Il apporte des fonctionnalités puissantes au bureau, une myriade d'effets spéciaux, l'extensibilité des plug-ins et la manipulation des calques. Il améliore l'expérience d'édition d'images pour les propriétaires de tablettes avec la prise en charge de Windows XP Tablet Ink. Les photographes et artistes numériques peuvent améliorer leurs images avec des fonctionnalités et des effets tels que le réglage des niveaux, le clonage intercalaire, les outils anticrénelés, le flou de mouvement et la suppression des yeux rouges.

TinyQuant est un programme d'affichage graphique conçu pour l'analyse et la manipulation limitée d'images obtenues par balayage de gels ou d'autoradiographies. Utile pour intégrer des densités de bandes de gel dans des images en niveaux de gris 16 bits (format PC ou Mac ".gel" ou TIFF) ou des images RVB TIFF 24 bits, et pour les convertir en TIFF 8 bits en niveaux de gris.

Un GIF plus petit - Pedagoguery Software Inc. fournit une variété de progiciels gratuits pour les ordinateurs Macintosh et Windows. Ce programme réduit la taille des GIF animés sans affecter leur apparence de quelque façon que ce soit.

UTHSCSA ImageTool (Dental Diagnostic Science, University of Texas Health Science Center, San Antonio, États-Unis) - peut acquérir, afficher, éditer, analyser, traiter, compresser, enregistrer et imprimer des images en niveaux de gris et en couleur. Le service informatique peut lire et écrire plus de 22 formats de fichiers courants, notamment BMP, PCX, TIF, GIF et JPEG. Les fonctions d'analyse d'image incluent des mesures dimensionnelles (distance, angle, périmètre, surface) et en niveaux de gris (histogramme de points, de lignes et de surfaces avec statistiques). ImageTool prend en charge les fonctions de traitement d'image standard telles que la manipulation du contraste, la netteté, le lissage, la détection des contours, le filtrage médian et les convolutions spatiales avec des masques de convolution définis par l'utilisateur.

GIMP est le programme de manipulation d'images GNU. Il s'agit d'un logiciel distribué gratuitement pour des tâches telles que la retouche photo, la composition d'images et la création d'images. Il fonctionne sur de nombreux systèmes d'exploitation, dans de nombreuses langues. Le pack d'animation GIMP, est également maintenant disponible

ACD/ChemSketch (Advanced Chemistry Development, Inc) - pour dessiner des structures chimiques et des images graphiques.


Qualité de séquence d'ADN - Phred - fournit l'appel de base, l'affichage du chromatogramme et l'évaluation et la présentation de la région de séquence de haute qualité pour jusqu'à cinq séquences simultanément.

Assemblage de séquences - vous n'avez pas besoin de votre propre programme d'assemblage contig lorsque vous pouvez utiliser :

EGassember - aligne et fusionne des fragments de séquence résultant d'un séquençage shotgun ou de fragments de transcrits géniques (EST) afin de reconstruire le segment ou le gène d'origine (Référence : A. Masoudi-Nejad et al. 2006. Nucl. Acids Res. 34: W459-462).

CGE Assembler 1.2 - assemble les données Illumina, 454, SOLid et Ion Torrent (Référence : Larsen MV, et al. J. Clin. Micobiol. 2012. 50(4): 1355-1361).
CGE SPAdes 3.9 - assemble les données Illumina et Ion Torrent (Référence : S. Nurk et al. Research in Computational Molecular Biology : pp 158-170).

CAP3 (PBIL, La France ), (Référence : Huang, X. & amp Madan A. 1999. Genome Res. 9: 868-877), et ici.
Assembleur CAP EST (Istituto FIRC di Oncologia Molecolare, Italie) - La longueur maximale des séquences pour chaque séquence est de 30 ko - Le nombre maximal de séquences est de 10 ko

Le site Web MicroScope (hébergé au Genoscope) fournit un environnement pour l'annotation d'experts et la génomique comparative. Projet Génome : Annotation et analyses comparatives de séquences génomiques terminées ou en projet. Pour les séquences pré-annotées, elles intègrent uniquement les annotations de la section complète du génome NCBI RefSeq. Projet métagénome : Annotation et analyses comparatives de séquences métagénomiques assemblées. Actuellement, ils sont capables d'intégrer des ensembles de données inférieurs à 20 Mb de contigs par bac.

NanoPipe - a été développé en tenant compte des spécificités des technologies de séquençage MinION, fournissant des paramètres d'alignement ajustés en conséquence. La gamme des espèces/séquences cibles pour l'alignement n'est pas limitée, et la page d'utilisation descriptive de NanoPipe aide un utilisateur à réussir l'analyse de NanoPipe. Les résultats contiennent des statistiques d'alignement, une séquence consensus, des données de polymorphismes et une visualisation de l'alignement. (Référence : Shabardina V et al. (2019) Gigascience 8(2). pii : giy169).


COV2HTML : un outil de visualisation et d'analyse des données de séquençage bactérien de nouvelle génération (NGS) pour les scientifiques de la vie postgénomique - permet d'effectuer à la fois la visualisation de la couverture et l'analyse des alignements NGS effectués sur des organismes procaryotes (bactéries et phages). Il combine deux processus : un outil qui convertit les énormes fichiers de cartographie ou de couverture NGS en fichiers de couverture spécifiques légers contenant des informations sur les éléments génétiques et une interface de visualisation permettant une analyse en temps réel des données avec intégration optionnelle des résultats statistiques. (Référence : Monot M. et al. 2014. OMICS 18(3): 184-95).

Alignement de séquences multiples DCA Diviser pour régner ( Universitat Bielefeld, Allemagne) - est un programme permettant de produire des alignements simultanés de séquences multiples rapides et de haute qualité de séquences d'acides aminés, d'ARN ou d'ADN. ( Référence : Brinkmann, G. et al. Programmation mathématique 79: 71-97, 1997).

PhageTerm - est un progiciel rapide et convivial qui peut être utilisé pour déterminer les terminaisons et le mode d'emballage des bactériophages à partir de données NGS fragmentées de manière aléatoire. Il fait partie du package Galaxy et se trouve dans le répertoire "NGS: Mapping". L'idéal est que vous vouliez une réponse automatisée. (Référence : Garneau JR, et al. 2017. Sci Rep. 7(1):8292).

QUAST - un outil d'évaluation de la qualité pour évaluer et comparer les assemblages de génomes. Cet outil améliore les principaux logiciels de comparaison d'assemblage avec de nouvelles idées et des mesures de qualité. QUAST peut évaluer des assemblages aussi bien avec un génome de référence que sans référence. QUAST produit de nombreux rapports, tableaux de synthèse et graphiques pour aider les scientifiques dans leurs recherches et dans leurs publications. (Référence : A. Gurevich et al. 2013. Bioinformatique, 29(8): 1072&ndash1075). N.B. Ce serveur est en date d'avril 2020, mais on espère qu'il sera de nouveau en ligne (voir ici pour les téléchargements de logiciels).

Erreurs de séquençage : - si votre séquence d'ADN ne correspond pas à la séquence de protéines attendue, vous pouvez vérifier les erreurs chez GeneWise (EMBL-EBI) qui compare une séquence de protéines à une séquence d'ADN génomique, en tenant compte des introns et des erreurs de décalage de cadre. Les autres programmes incluent :

FrameD (Référence : T. Schliex et al. 2003. Nucl. Acids Res. 31: 3738-3741)
AMIGene - annotation de gènes microbiens ( Référence : Bocs S et al. (2003) Acides nucléiques Res. 13(31): 3723-3726).
path :: protein back-traduction and alignement - aborde le problème de trouver des homologies de protéines distantes où la divergence est le résultat de mutations et de substitutions de décalage du cadre de lecture. Étant donné deux séquences de protéines d'entrée, la méthode aligne implicitement toutes les paires possibles de séquences d'ADN qui les codent, en manipulant des représentations graphiques efficaces en mémoire de l'ensemble complet de séquences d'ADN putatives pour chaque protéine. (Référence : G&icirdea M et al. 2010. Algorithms for Molecular Biology 5:)

In-silico.com (Dr Joseba Bikandi & collaborateurs, Faculté de Pharmacie, Université du Pays Basque) - permet in silico des expériences comprenant l'amplification PCR théorique, l'AFLP-PCR, l'analyse de restriction et l'électrophorèse sur gel en champ pulsé [PFGE] avec des génomes bactériens et archaïques trouvés dans la base de données publique.

Pipeline d'annotation automatique des génomes procaryotes NCBI. Cela annotera complètement votre génome bactérien et vous fournira un fichier de soumission Sequin. N.B. un pipeline d'annotation automatique NCBI Phage est en cours de développement.

RAST (Rapid Annotation using Subsystem Technology) est un service entièrement automatisé d'annotation des génomes bactériens et archéens. Il fournit des annotations génomiques de haute qualité pour ces génomes dans l'ensemble de l'arbre phylogénétique. Nécessite une inscription. (Référence : Aziz, RK et al. 2008. BMC Genomics 9:75.).

Outil d'annotation bactérienne BASys - cet outil incroyable prend en charge l'annotation automatisée et approfondie des séquences génomiques bactériennes. Il accepte les données de séquences d'ADN brutes et une liste facultative d'informations d'identification des gènes (Glimmer) et fournit des annotations textuelles complètes et une sortie d'images avec liens hypertexte. BASys utilise des programmes >30 pour déterminer 60 sous-champs d'annotation pour chaque gène, y compris le nom du gène/protéine, la fonction GO, la fonction COG, les paralogues et orthologues possibles, le poids moléculaire, le point isoélectrique, la structure de l'opéron, la localisation subcellulaire, les peptides signal, les régions transmembranaires, la structure secondaire , structure 3D, réactions et voies. (Référence : G.H. Van Domselaar et al. 2005. Nucl. Acids Res. 33(problème de serveur Web): W455-W459).

MicroScope - (CEA, Institut de Génomique - Genoscope, France) est une plateforme d'annotation et d'analyse du génome microbien qui donne accès à un large éventail d'outils, notamment l'analyse COG, la génomique comparative. (Référence : Vallenet D et al. (2017) Nucleic Acids Res. 45(D1) : D517-D528). Nécessite une inscription.

MAKER Web Annotation Service (MWAS) est un pipeline d'annotation du génome facilement configurable et accessible sur le Web. Son objectif est de permettre aux groupes de recherche avec des quantités petites à intermédiaires de séquences de génomes eucaryotes et procaryotes (c'est-à-dire des clones BAC, de petits génomes entiers, des données de séquençage préliminaires, etc.) dans une base de données du génome. (Référence : Holt, C. & Yandell, M. 2011. BMC Bioinformatics 12:491).

MITOS - un pipeline est conçu pour fournir une annotation de novo cohérente et de haute qualité des séquences du génome mitochondrial des métazoaires. Nous montrons que les résultats de MITOS correspondent à RefSeq et MitoZoa en termes de couverture et de qualité des annotations. Dans le même temps, nous évitons les biais, les incohérences de nomenclature et les fautes de frappe provenant des stratégies de curation manuelle. (Référence : M. Bernt et al. 2013. Phylogénétique moléculaire & amp Evolution 69:313-319).

GenSAS - Générationome Sséquence UNEnotation Server - fournit un site Web unique avec une interface graphique unique pour exécuter plusieurs outils d'annotation structurelles et fonctionnelles, permettant la visualisation et la conservation manuelle des séquences du génome. Les utilisateurs peuvent télécharger des séquences sur leur compte et exécuter des programmes de prédiction de gènes, des recherches d'homologie de protéines, cartographier les EST, identifier les répétitions, les ORF et les SSR avec des paramètres personnalisés. Chaque analyse est affichée sur des pistes distinctes de l'interface graphique avec des pistes modifiables personnalisées pour sélectionner l'annotation finale des caractéristiques et créer des fichiers gff3 à télécharger sur des navigateurs génomiques tels que GBrowse. Des programmes supplémentaires peuvent être facilement ajoutés à l'aide de ce logiciel basé sur Drupal.

Viral genome ORF Reader (VIGOR) - prend en charge la prédiction et l'annotation d'entités à haut débit. VIGOR utilise une stratégie extrinsèque et affiche une sensibilité et une spécificité supérieures à 98% pour les génomes viraux à ARN que nous avons testés. Les caractéristiques spécifiques du génome identifiées par VIGOR incluent les décalages de trame, le glissement ribosomique, l'édition d'ARN, la lecture des codons d'arrêt, les gènes qui se chevauchent, les gènes intégrés et les sites de clivage de peptides matures. La capacité de génotypage de la grippe et du rotavirus est intégrée au programme.
(Référence : S. Wang et al. 2011. BMC Bioinformatics 2010, 11:451)

FLAN (Floridevous UNnotation) est un serveur Web NCBI pour l'annotation du génome du virus de la grippe est un outil pour les séquences du virus de la grippe A ou du virus de la grippe B fournies par l'utilisateur. Il peut valider et prédire des séquences protéiques codées par une séquence grippale d'entrée. (Référence : Y. Bao et al. 2007. Nucleic Acids Res. Web Server issue) 35: W280-W284.)

CpGAVAS ( Csalutpdernier genome UNEnotation, Vactualisation, UNEAnalyse et GenBank Submission Tool) - permet une annotation précise du génome chloroplastique, la génération de cartes circulaires, la fourniture de résultats d'analyse utiles du génome annoté, la création de fichiers pouvant être soumis directement à GenBank. (Référence : C. Liu et al. 2012. BMC Genomics 13: 715)

genome UNEnotation Ttransférer Utility (GATU) annote un génome basé sur un génome de référence très proche. Les protéines/peptides matures du génome de référence sont BLASTés contre le génome à annoter afin de trouver les gènes/peptides matures dans le génome à annoter (Référence : T. Tcherepano v et al. 2006. BMC Genomics 7:150.)

BioGPS (The Scripps Research Institute, États-Unis) - est un portail d'annotation de gènes à guichet unique qui met l'accent sur la personnalisation par l'utilisateur et l'extensibilité communautaire. Il s'agit d'un portail d'annotation de gènes personnalisable et d'une ressource complète pour en savoir plus sur la fonction des gènes et des protéines.

BEIGNET (Institut des sciences biomoléculaires et de la biotechnologie de Groningen, Haren, Pays-Bas) - déterminera à partir d'un fichier GenBank existant ou non soumis la présence de bactériocines sur la base d'une base de données contenant des informations sur les bactériocines connues et les gènes adjacents impliqués dans l'activité des bactériocines. Un site alternatif pour les bactériocines est BACTIBASE qui est un référentiel de données de peptides antimicrobiens naturels de bactériocines. Voir . LABioicin si vous êtes intéressé par le thème des bactéries lactiques (LAB) et ses bactériocines.

MICheck (MIgénome crobie Vérifiereuh) - permet une vérification rapide des ensembles de gènes annotés et des décalages de cadre dans des génomes bactériens précédemment publiés, ou des génomes pour lesquels l'utilisateur dispose d'un fichier *.gbk. Cet outil peut être vu comme une étape préliminaire avant l'étape de ré-annotation fonctionnelle pour vérifier rapidement les gènes manquants ou mal annotés. Cela a bien fonctionné avec les génomes de phages de 43 à 135 Ko. (Référence : S. Cruveiller et al. 2005. Nucl. Acids Res. 33: W471-W479).

WebGeSTer - nome Sconserveur pour Terminators - mon programme de recherche de terminateur préféré est enfin activé sur le Web. Veuillez noter que si vous souhaitez analyser les données d'un fichier *.gbk, vous devez d'abord utiliser leur programme de conversion "GenBank2GeSTer". Une description complète de chaque terminateur, y compris un schéma, est produite par ce programme. Ce site est lié à une vaste base de données de terminateurs transcriptionnels dans le génome bactérien (WebGeSTer DB) (Référence : Mitra A. et al. 2011. Nucl. Acids Res. 39 (Database issue):D129-35).

RibEx : Nervureinterrupteur Explorer - scanne <40kb l'ADN pour les gènes potentiels (qui sont liés à BLASTP) et plusieurs centaines d'éléments régulateurs, y compris les riboswitches. Si vous cliquez sur le "chercher des atténuateurs", il trouve les terminateurs et les antiterminators. Il présente les gènes encapsulés et l'analyse BLAST au NCBI (Référence : C. Abreu-Goodger & E. Merino. 2005. Nucl. Acids Res. 33: W690-W692).

ARNt : tRNAscan-SE - est incroyablement sensible et fournit également des diagrammes de structure secondaire des molécules d'ARNt (Référence : Schattner, P. et al. 2005. Nucleic Acids Res. 33: W686-689). Vous pouvez également utiliser ARAGORN (Référence : Laslett, D. & Canback. 2004. Nucleic Acids Research 32:11-16).
Séquences de tests.

LTR_Finder - est un programme efficace pour trouver des rétrotranspsons LTR de pleine longueur dans les séquences du génome. La taille du fichier d'entrée est désormais limitée à 50 Mo (Référence : Z. Xu & H. Wang. 2007. Nucl. Acids Res.35(Problème de serveur Web) : W265-W268).
RTAnalyzer - trouve les rétrotransposons et détecte les signatures de rétrotransposition L1 (Référence : J-F. Lucier et al. 2007. Nucl. Acids Res. 35(Problème de serveur Web) : W269-W274

MG-RAST (Métagénome Rapide UNEnnotation à l'aide Ssous-système Technology) est un service entièrement automatisé d'annotation d'échantillons de métagénome. Il fournit une annotation des fragments de séquences, leur classification phylogénétique et une première reconstruction métabolique. Le service fournit également des moyens de comparer les classifications phylogénétiques et les reconstructions métaboliques des métagénomes ( Référence : F. Meyer et al. 2008. BMC Bioinformatics 9: 386).

Les quatre programmes suivants peuvent être utilisés pour prédire les protéines phagiques :

PVPred (Référence : Ding H et al (2014) Mol Biosyst 10(8): 2229-2235).
PHPred ( Référence : Ding H (2016) Ordinateurs Biol Med 71: 156&ndash161).
PVP-SVM ( Référence : Manavalan B et al. (2018) Front Microbiol 9: 476).
PVPred-SCM ( Référence : Charoenkwan P et al. (2020) Cellules 9(2) pii : E353.

Origine de réplication chromosomique :

Ori-Finder et Ori-Finder 2 - sont des plates-formes utiles pour l'identification et l'analyse des origines de réplication (oriCs) dans les génomes bactériens et archéens, respectivement. (Référence : Luo H et al. (2019) Brief Bioinform 20(4): 1114-1124). Veuillez noter que ces outils ont été utilisés pour créer DoriC - une base de données des origines de réplication dans les génomes procaryotes, y compris les chromosomes et les plasmides. (Référence : Luo H & Gao F (2019) Nucleic Acids Res. 47(D1) : D74-D77).

L'un des problèmes avec GenBank est que les scientifiques ne mettent pas à jour leurs données de soumission ni ne corrigent les erreurs. Cela est dû en partie à la paresse, mais aussi au fait que GenBank, dans la plupart des cas, refuse d'accepter une nouvelle version du fichier Sequin. Tbl2asn est un programme en ligne de commande qui automatise la création d'enregistrements de séquences à soumettre à GenBank mais, de mon point de vue, il n'est pas facile à utiliser. Le seul programme en ligne est GenBank 2 Sequin qui génère non seulement un fichier Sequin (*.sqn), mais aussi un "Table d'annotation" (*.tbl) à cinq colonnes. Ceci ainsi que la séquence d'ADN au format fasta peuvent être soumis à GenBank par courrier électronique ( [email protected] ). En son absence je recommande le script perl gbf2tbl.pl disponible en téléchargement ici.


PlasmidFinder 1.3 - identifie les plasmides dans des isolats séquencés totaux ou partiels de bactéries. La méthode utilise BLAST pour l'identification de réplicons de plasmides appartenant aux groupes d'incompatibilité majeure (Inc) de Entérobactéries. En entrée, la méthode peut utiliser à la fois des génomes pré-assemblés, complets ou partiels, et des lectures de séquences courtes à partir de quatre plates-formes de séquençage différentes. Voir également pMLST (Référence : Carattoli A et al. 2014. Antimicrob. Agents Chemother. 58: 3895-903)

PHACTS permet de classer rapidement le mode de vie d'un phage (tempéré ou lytique). Tout ce qui est nécessaire est le protéome du phage à classer et PHACTS prédira le mode de vie de ce phage et renverra une valeur de confiance pour cette prédiction. (Référence : K. McNair et al. 2012. Bioinformatique 28: 614-618).

Recherche d'espèces 1.0 (Université technique danoise) - prédit les espèces de bactéries à partir de génomes pré-assemblés, complets ou partiels, et lectures de séquences courtes. La prédiction est basée sur le gène de l'ARNr 16S.

CSI Phylogeny 1.1 (Call SNPs & Infer Phylogeny) - appelle les SNP, filtre les SNP, effectue la validation du site et déduit une phylogénie basée sur l'alignement concaténé des SNP de haute qualité*. (Référence : Kaas, R.S. et al. PLoS ONE 2014 9: e104984.)

KmerFinder 2.0 &ndash prédit les espèces de bactéries à partir de génomes pré-assemblés, complets ou partiels, et de courtes lectures de séquences. La prédiction est basée sur le nombre de k-mers co-occurrents (sous-chaînes de k nucléotides dans les données de séquence d'ADN, dans ce cas 16-mers) entre les génomes de bactéries de référence dans une base de données et le génome fourni par l'utilisateur. (Référence : Hasman H et al. 2013. J Clin Microbiol. 52:139-146)

VIOLIN : Vaccine Investigation and Online Information Network - permet une curation, une comparaison et une analyse faciles des données de recherche liées aux vaccins sur divers agents pathogènes humains VIOLIN devrait devenir une source centralisée d'informations sur les vaccins et fournir aux chercheurs en sciences fondamentales et cliniques des données et des outils bioinformatiques pour la recherche et le développement de vaccins. VBLAST : la recherche BLAST personnalisée pour la recherche sur les vaccins permet diverses stratégies de recherche contre 77 génomes de 34 agents pathogènes. (Référence : He, Y. et al. 2014. Nucleic Acids Res. 42 (Problème de la base de données) : D1124-32).

MLST 1.8 (MultiLocus Sequence Typing) - ne fonctionne actuellement qu'avec des génomes et des contigs assemblés (Référence : Larsen MV et al. 2012. J. Clin. Micobiol. 50: 1355-1361).

ECFfinder - les facteurs sigma de la fonction extracytoplasmique (ECF) - le plus grand groupe de facteurs sigma alternatifs - représentent le troisième mécanisme fondamental de la transduction du signal bactérien, avec environ six régulateurs de ce type en moyenne par génome bactérien. Avec leurs facteurs anti-sigma apparentés, ils représentent une conception hautement modulaire qui facilite principalement la transduction du signal transmembranaire. ( Référence : Staron A et al. (2009) Mol Microbiol 74(3): 557-581).

BacWGSTdb - est conçu pour surveiller l'émergence et l'apparition d'agents pathogènes bactériens importants. En détail, il sert à deux fins particulières : la saisie et le suivi. Le premier fait référence à un génotypage intégré à la fois au niveau traditionnel du typage de séquences multi-locus (MLST) et du typage du séquençage du génome entier (WGST). Ce dernier fait référence au suivi de la source (c'est-à-dire à la recherche d'isolats très similaires) en fonction du résultat du typage et isole les informations stockées dans BacWGSTdb. (Référence : Z. Ruan 7 Y. Feng, Nucleic Acids Research. 2016 44(D1) : D682-D687).

SISTR : Salmonelle jem Silico Typing Rressource - (Agence de la santé publique du Canada, Laboratoire des zoonoses d'origine alimentaire) est une ressource bioinformatique permettant d'interpréter rapidement les données in silico pour plusieurs méthodes de sous-typage de Salmonella à partir d'assemblages de génomes bactériens provisoires. En plus d'effectuer la prédiction des sérotypes par génosérotypage, cette ressource intègre des analyses de typage basées sur les séquences pour : le typage de séquences multi-locus (MLST), le MLST ribosomique (rMLST) et le génome central MLST (cgMLST). Google Chrome est recommandé Firefox est également pris en charge, mais les visualisations SVG dans cette application peuvent ne pas être aussi réactives. Internet Explorer n'est pas pris en charge.

FSFinder2 (Fchangement de vitesse Sallumer Finder) - Le déphasage ribosomique programmé est impliqué dans l'expression de certains gènes d'un large éventail d'organismes tels que les virus, les bactéries et les eucaryotes, y compris l'homme. Dans le décalage de cadre programmé, le ribosome passe à un cadre alternatif à un site spécifique en réponse à un signal spécial dans un ARN messager. Le décalage de cadre programmé joue un rôle dans la morphogenèse des particules virales, le contrôle autogène et les activités enzymatiques alternatives. Le décalage de trame commun est un décalage de trame de -1, dans lequel le ribosome décale un seul nucléotide dans la direction amont. Les principaux éléments du décalage du cadre de lecture -1 consistent en un site glissant, où le ribosome modifie les cadres de lecture, et une structure d'ARN stimulatrice telle qu'un pseudo-nœud ou une tige-boucle située quelques nucléotides en aval. Les décalages de trame +1 sont beaucoup moins fréquents que les décalages de trame -1 mais sont observés dans divers organismes.

InBase, The Intein Database and Registry - L'épissage des protéines est défini comme l'excision d'une séquence protéique intermédiaire (l'INTEIN) à partir d'un précurseur protéique et la ligature concomitante des fragments de protéines flanquantes (les EXTEINS) pour former une protéine hôte d'exteine ​​mature et la intéine libre (Perler 1994). L'épissage des protéines entraîne une liaison peptidique native entre les extéines ligaturées. Il s'agit d'un site de base de données qui permet l'analyse BLAST. (Référence : Perler, F.B. 2002. Nucleic Acids Res. 30: 383-384).

P2RP (protéines régulatrices procaryotes prédites) - les utilisateurs peuvent saisir des séquences d'acides aminés ou d'ADN génomique, et les protéines prédites sont analysées pour la possession de domaines de liaison à l'ADN et/ou de domaines de système à deux composants. Les PR identifiés de cette manière sont classés en familles, annotés sans ambiguïté. (Référence : Barakat M, et al. 2013. BMC Genomics 14:269).

P2CS (Prokaryotic 2-Component Systems) est une ressource complète pour l'analyse des systèmes procaryotes à deux composants (TCS). Les TCS sont composés d'un récepteur histidine kinase (HK) et d'un régulateur de réponse du partenaire (RR) et contrôlent d'importants comportements procaryotes. Il peut être recherché en utilisant BLASTP. (Référence : P. Ortet et al. 2015. Nucl. Acids Res. 43 (D1) : D536-D541).

Analyse COG - Clustres de Orthologue groups - La base de données des protéines COG a été générée en comparant les protéines prédites et connues dans tous les génomes microbiens complètement séquencés pour déduire des ensembles d'orthologues. Chaque COG se compose d'un groupe de protéines qui s'avèrent orthologues dans au moins trois lignées et correspond probablement à un ancien domaine conservé (CloVR) . Les sites qui proposent cette analyse incluent :

WebMGA (Référence : S. Wu et al. 2011. BMC Genomics 12:444), RAST (Référence : Aziz RK et al. 2008. BMC Genomics 9:75) et BASys (Bacteur UNEnotation Ssystème Référence : Van Domselaar GH et al. 2005. Nucleic Acids Res. 33(problème de serveur Web) : W455-459.) et JGI IMG (jeintégré Microbienne genomes Référence : Markowitz VM et al. 2014. Nucl. Acides Rés. 42: D560-D567. )

Autres sites :

EggNOG - Une base de données de groupes orthologues et d'annotations fonctionnelles qui en dérivent Nsous surveillance Orthologue g(NOG) à partir de génomes complets, puis applique un pipeline complet de caractérisation et d'analyse aux familles de gènes résultantes. (Référence : Powell S et al. 2014. Nucleic Acids Res. 42 (D1) : D231-D239

OrthoMCL - est un autre algorithme pour regrouper les protéines en groupes orthologues en fonction de leur similarité de séquence. Le processus prend généralement entre 6 et 72 heures. (Référence : Fischer S et al. 2011. Curr Protoc Bioinformatics Chapter 6:Unit 6.12.1-19).

KAAS (KOEUF UNEautomatique UNEnotation Server) fournit une annotation fonctionnelle des gènes par des comparaisons BLAST ou GHOST par rapport à la base de données KEGG GENES gérée manuellement. Le résultat contient des affectations KO (KEGG Orthology) et des chemins KEGG générés automatiquement. (Référence : Moriya Y et al. 2007. Nucleic Acids Res. 35(Problème de serveur Web) : W182-185).

ResFinder (Détecteur de gènes de résistance aux antimicrobiens acquis) - utilise BLAST pour l'identification des gènes de résistance aux antimicrobiens acquis dans les données du génome entier. En entrée, la méthode peut utiliser à la fois des génomes pré-assemblés, complets ou partiels, et des lectures de séquences courtes à partir de quatre plates-formes de séquençage différentes. Testé avec 1411 gènes de résistance différents avec 100 % d'identité. (Référence : Zankari E et al. 2012. J Antimicrob Chemother. 67:2640-2644)

ARG-ANNOT (UNEantibiotique Rrésistance gene-ANNOTation) est un nouvel outil qui a été créé pour détecter les nouveaux gènes de résistance aux antibiotiques (AR) existants et putatifs dans les génomes bactériens. ARG-ANNOT utilise un programme d'explosion local dans le logiciel Bio-Edit qui permet à l'utilisateur d'analyser des séquences sans interface Web (Référence : Gupta, S.K. et al. 2014. Antimicrob Agents Chemother. 58: 212&ndash220).

CARTE (La Comniprésent UNEantibiotique Rrésistance atabase) - une collection rigoureusement organisée de déterminants de résistance connus et d'antibiotiques associés, organisée par les modèles de détection des gènes de l'ontologie de la résistance aux antibiotiques (ARO) et de l'AMR (Référence : Jia, B. et al. 2017. Nucleic Acids Research, 45: D566-573).

MEGARes - est une base de données sur la résistance aux antimicrobiens organisée à la main et une structure d'annotation qui fournit une base pour le développement de classificateurs acycliques à haut débit et une analyse statistique hiérarchique des mégadonnées (Référence : Lakin, S.N.. et al. 2017. Nucleic Acids Research, 45: D574-D580).

BacMet (Antibacbiocide & Rencontréal Resistance Genes Database) - une base de données de gènes de résistance aux biocides et aux métaux avec un contenu très fiable. Dans BacMet version 1.1, la base de données confirmée expérimentalement contient 704 gènes de résistance, tandis que la base de données prédite contient 40 556 gènes de résistance (Référence : Pal, C. et al. 2014. Nucleic Acids Research, 42: D737-743).

Annotation spécialisée - CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) :

CRISPRfinder - permet la détection facile des CRISPR dans les données produites localement et la consultation des CRISPR présents dans la base de données. Il renseigne également sur la présence de gènes associés à CRISPR (cas) lorsqu'ils ont été annotés comme tels. . (Référence : I. Grissa et al. 2007. Nucl. Acids Res. 35 (Problème de serveur Web) : W52-W57).

CRISPRmap - fournit un aperçu rapide et détaillé de la conservation répétée et de la diversité des systèmes bactériens et archéens. Il comprend le plus grand ensemble de données de CRISPR à ce jour et permet des analyses de clustering indépendantes complètes pour déterminer les familles de séquences conservées, les motifs de structure potentiels pour les endoribonucléases et les relations évolutives. (Référence : S.J. Lange et al. 2013. Nucleic Acids Research, 41: 8034-8044).

CRISPI : une base de données interactive CRISPR - comprend un répertoire complet des gènes associés à CRISPR (CAS). Une interface Web conviviale avec de nombreux outils et fonctions graphiques permet aux utilisateurs d'extraire des résultats, de trouver CRISPR dans des séquences personnelles ou de calculer une similarité de séquence avec des espaceurs. (Référence : Rousseau C et al. 2009. Bioinformatique. 25: 3317&ndash3318).

CRISPRtarget - qui prédit les cibles les plus probables des ARN CRISPR. Cela peut être utilisé pour découvrir des cibles dans des données génomiques ou métagénomiques nouvellement séquencées. (Référence : Biswas A et al. 2013. RNA Biol. 10:817-827).

CRISPy-web - est un outil Web facile à utiliser basé sur CRISPy pour concevoir des sgRNA pour tout génome microbien fourni par l'utilisateur. CRISPy-web permet aux chercheurs de sélectionner de manière interactive une région de leur génome d'intérêt pour rechercher d'éventuels sgRNA. Après avoir vérifié les correspondances potentielles hors cible, les séquences sgRNA résultantes sont affichées graphiquement et peuvent être exportées vers des fichiers texte. (Référence : K. Blin et al. 2016. Synthetic and Systems Biotechnology 1(2) : 118-121).

Annotation spécialisée - déterminants de virulence : Ceci est particulièrement intéressant pour ceux qui travaillent sur les bactériophages pour la thérapie

Recherche de virulence (Université technique danoise) &ndash identification des gènes de virulence. La méthode utilise BLAST pour l'identification de gènes de virulence connus dans Escherichia coli. La méthode est étendue pour inclure également des gènes de virulence pour Entérocoque et Staphylococcus aureus. En entrée, la méthode peut utiliser à la fois des génomes pré-assemblés, complets ou partiels, et des lectures de séquences courtes à partir de quatre plates-formes de séquençage différentes.

ClanTox : un classificateur de toxines animales courtes - prédit si chaque séquence ressemble à une toxine et fournit une liste classée de candidats prédits positivement en fonction de la confiance statistique. Pour chaque protéine, des informations supplémentaires sont présentées, notamment la présence d'un peptide signal, le nombre de résidus cystéine et les annotations fonctionnelles associées. (Référence : G. Naamati et al. 2009. Nucleic Acids Res. 37 (problème de serveur Web) : W363&ndashW368).

t3db the Toxin and Toxin Target Database - combine des données détaillées sur les toxines avec des informations complètes sur les cibles de toxines. La base de données contient actuellement 3 053 toxines qui sont liées à 1 670 enregistrements de cibles de toxines correspondantes. Chaque enregistrement de toxine (ToxCard) contient plus de 50 champs de données et contient des informations telles que les propriétés chimiques et les descripteurs, les valeurs de toxicité, les interactions moléculaires et cellulaires et les informations médicales. (Référence : Lim E et al. 2010. Nucleic Acids Res. 38 (problème de base de données) : D781-786).

TAfinder 2.0 - est un outil Web permettant d'identifier les loci de toxine-antitoxine de type II dans le génome bactérien (Référence : Xie Y et al. (2018) Nucleic Acids Res. 46(D1) : D749-D753 ).

La base de données DBETH des exotoxines bactériennes pour l'homme est une base de données de séquences, de structures, de réseaux d'interaction et de résultats analytiques pour 229 exotoxines, provenant de 26 genres bactériens pathogènes humains différents. Toutes les toxines sont classées en 24 classes de toxines différentes. L'objectif de DBETH est de fournir une base de données complète pour les exotoxines bactériennes pathogènes humaines. (Référence : Chakraborty A et al. 2012. Nucleic Acids Res. 40 (problème de base de données) : D615-620).

VFDB - est une base de données intégrée et complète de facteurs de virulence pour les agents pathogènes bactériens (incluant également Chlamydia et Mycoplasma). (Référence : L.H. Chen et al. 2012. Nucleic Acids Res. 40 (problème de base de données) : D641-D645).

PAIDB (Pennsylvaniethogénicité jeîle àbase) - Les îlots de pathogénicité (IPA) et les îlots de résistance (REI) sont essentiels à l'évolution des agents pathogènes et semblent jouer des rôles complémentaires dans le processus d'infection bactérienne. Alors que les PAI favorisent le développement de la maladie, les REI donnent un avantage de fitness à l'hôte contre plusieurs agents antimicrobiens. Un programme auxiliaire, PAI Finder, identifie les régions de type PAI ou les régions de type REI dans une requête multi-séquence. ( Référence : S.H Yoon et al. 2015. Nucl. Acids Res. 43 (D1) : D624-D630).

IslandViewer - comprend un nouvel outil interactif de visualisation du génome, IslandPlot, et un facteur de virulence étendu, un gène de résistance aux antimicrobiens et des annotations de gènes associés aux agents pathogènes, ainsi que des homologues de ces gènes dans des génomes étroitement liés. Notamment, les génomes incomplets sont acceptés comme entrée dans IslandViewer 3, bien qu'ils exhortent fortement les utilisateurs à utiliser des génomes complets dans la mesure du possible. ( Référence : B.K. Dhillon et al. 2015. Nucl. Acids Res. 43 (W1) : W104-W108).

Gypsy Database - une base de données modifiable ouverte sur la relation évolutive des virus, des éléments génétiques mobiles (les rétroéléments MGE Ty3/Gypsy, Retroviridae, Ty1/Copia et Bel/Pao LTR et le Caulimoviridés pararétrovirus de plantes) et d'autres répétitions génomiques. Équipé pour les recherches BLAST et HMM. ( Référence : Llorens, C et al. 2011. Nucl. Acids Res. 39(suppl 1) : D70-D74).

PanDaTox (La poêle Génomique Database pour les éléments génomiques Toxic to Bacteria) - est une base de données de gènes et de régions intergéniques non clonables dans E. coli, pour aider à la découverte de nouveaux antibiotiques et de gènes fonctionnels biotechnologiquement bénéfiques. Il est également conçu pour améliorer l'efficacité de l'ingénierie métabolique. Fonction de recherche BLAST incluse. ( Référence : Mitai G & Sorek R. 2012. Bio-ingénierie, 3: 218-221.)

PathogenFinder (prédit le potentiel pathogène) &ndash Sur la base des génomes complets de 513 bactéries annotées comme non-pathogènes humains et de 372 bactéries annotées comme pathogènes humains, une base de données de familles de protéines, qui sont soit principalement associées à des non-pathogènes, soit à des pathogènes a été créée. Cette base de données est ensuite utilisée pour prédire le potentiel pathogène des bactéries. En entrée, la méthode peut utiliser à la fois des génomes pré-assemblés, complets ou partiels, et des lectures de séquences courtes à partir de quatre plates-formes de séquençage différentes. (Référence : Cosentino S et al. 2013. PLoS ONE 8: e77302)

VirulentPred - est une méthode basée sur SVM pour prédire les séquences de protéines virulentes bactériennes, qui peuvent être utilisées pour cribler les protéines virulentes dans les protéomes. Avec des protéines virulentes vérifiées expérimentalement, plusieurs séquences protéiques putatives, non annotées et hypothétiques ont été prédites comme étant des protéines virulentes à score élevé par la méthode de prédiction. (Référence : Garg A & Gupta G. 2008. BMC Bioinformatics 9: 62).

Le système de sécrétion de type III (T3SS) est un mécanisme essentiel pour l'interaction hôte-pathogène dans le processus d'infection. Les protéines sécrétées par la machinerie T3SS de nombreuses bactéries Gram-négatives sont appelées effecteurs T3SS (T3SE). Ceux-ci peuvent être localisés de manière subcellulaire dans l'hôte ou faire partie de la pointe de l'aiguille du T3SS qui interagit directement avec la membrane de l'hôte pour amener d'autres effecteurs dans la cellule cible. T3SEdb représente un tel effort pour assembler une base de données complète de tous les T3SE déterminés expérimentalement et putatifs dans un site accessible sur le Web. La recherche BLAST est disponible. (Référence : Tay DM et al. 2010. BMC Bioinformatics. 11 Suppl 7:S4).

Efficace (Université de Vienne, Autriche et Université technique de Munich, Allemagne) - La sécrétion de protéines bactériennes est le mécanisme de virulence clé des bactéries symbiotiques et pathogènes. Ainsi, les protéines effectrices sont transportées du cytosol bactérien dans le milieu extracellulaire ou directement dans la cellule hôte eucaryote. Le portail Effective fournit des prédictions précalculées sur les effecteurs bactériens dans tous les génomes pathogènes et symbiotiques accessibles au public, ainsi que la possibilité pour l'utilisateur de prédire les effecteurs dans ses propres données de séquences protéiques.

SIEVE Server est un outil Web public pour la prédiction des effecteurs sécrétés de type III.Le serveur SIEVE évalue les effecteurs potentiels sécrétés à partir de génomes d'agents pathogènes bactériens avec des systèmes de sécrétion de type III en utilisant un modèle appris à partir de protéines sécrétées connues. Le serveur SIEVE ne nécessite que des séquences protéiques de protéines à cribler et renvoie une probabilité prudente que chaque protéine d'entrée soit un effecteur sécrété de type III. (Référence : McDermott JE et al. 2011. Infect Immun. 79:23-32).

T3SE - Prédiction d'effecteur du système de sécrétion de type III (Référence : Löwer M, & Schneider G. 2009. PLoS One. 4:e5917. Erratum dans : PLoS One. 20094(7).

Phage_Finder - a été créé pour identifier les régions de prophage dans les génomes bactériens terminés. À l'aide d'un ensemble de données de test de 42 génomes bactériens dont les prophages ont été identifiés manuellement, Recherche_Phage trouvé 91% des régions, résultant en 7% de faux positifs et 9% de faux négatifs. Une recherche de 302 génomes bactériens complets a prédit 403 régions prophages putatives, représentant 2,7% de l'ADN bactérien total. L'analyse des 285 sites d'attachement putatifs a révélé que les ARNt sont des cibles d'intégration légèrement plus fréquentes (33 %) que les régions intergéniques (31 %) ou intragéniques (28 %), tandis que les ARNt ont été ciblés dans 8 % des régions. (Référence : D.E. Fouts. 2006. Nucleic Acids Res. 34 : 5839&ndash5851).

Prophinder - est l'outil utilisé pour détecter les prophages dans les génomes bactériens. Sélectionnez un fichier au format GenBank.

PHAST (PVVIHge Schercher Tool) - est conçu pour identifier rapidement et avec précision, annoter et afficher graphiquement les séquences de prophages dans les génomes bactériens ou les plasmides. Il accepte soit des données de séquences d'ADN brutes, soit des données au format GenBank partiellement annotées et effectue rapidement un certain nombre de comparaisons de bases de données ainsi que des étapes d'identification des caractéristiques des phages & ldquocornerstone & rdquo pour localiser, annoter et afficher les séquences et les caractéristiques des prophages. Par rapport à d'autres outils d'identification de prophages, PHAST est jusqu'à 40 fois plus rapide et jusqu'à 15 % plus sensible. Il est également capable de traiter et d'annoter à la fois les données de séquences d'ADN brutes et les fichiers Genbank, de fournir des tableaux richement annotés sur les caractéristiques du prophage et la &ldquoquality&rdquo et de faire la distinction entre le prophage intact et incomplet. PHAST génère également des graphiques interactifs téléchargeables de haute qualité qui affichent tous les composants de prophage identifiés dans des vues génomiques circulaires et linéaires. De plus, les tests indiquent que PHAST est aussi précis ou légèrement plus précis que tous les outils de recherche de phages disponibles, avec une sensibilité de 85,4 % et valeur prédictive positive de 94,2 %. (Référence : Zhou, Y. et al. 2011. Nucl. Acids Res. 39(suppl 2) : W347-W352).

PHASTÈRE PVVIHge Schercher Tool Eamélioré Release - est une mise à niveau significative de PHAST pour l'identification et l'annotation rapides des séquences de prophage dans les génomes bactériens et les plasmides. De nombreuses améliorations logicielles et des améliorations matérielles significatives ont maintenant rendu PHASTER plus rapide, plus efficace, plus attrayant visuellement et beaucoup plus convivial. En particulier, PHASTER est désormais 4,3 fois plus rapide que PHAST. (Référence : D. Arndt et al. Nucleic Acids Res. 2016 44(W1) :W16-21).

Prophage Hunter - fournit un service Web à guichet unique pour extraire les génomes des prophages des génomes bactériens, évaluer l'activité des prophages, identifier les phages liés phylogénétiquement et annoter la fonction des protéines des phages. (Référence : Song W et al. (2019) Nucleic Acids Res 47(W1) : W74&ndashW80).

IslandViewer - intègre deux méthodes de prédiction GI de composition de séquence SIGI-HMM et IslandPath-DIMOB, et une seule méthode de prédiction GI comparative IslandPick ( Référence : Langille et al. 2008. BMC Bioinformatics 9: 329).

PAIDB (Pennsylvaniethogénicité jeîle àBase) s'est efforcé de collecter les PAI connus et de détecter les régions potentielles de PAI dans les génomes complets procaryotes. Les îlots de pathogénicité (IPA) sont des éléments génétiques distincts d'agents pathogènes codant pour divers facteurs de virulence. (Référence : Yoon SH et al. 2007. Nucleic Acids Res. 35 (Problème de base de données) : D395-D400).

MTGIpick peut identifier des îlots génomiques à partir d'un seul génome, sans informations annotées sur les génomes ni connaissances préalables provenant d'autres ensembles de données. Dans des simulations avec des fragments extraterrestres de génomes artificiels et réels, MTGIpick a rapporté des résultats robustes dans différentes expériences (Référence : Dai Q et al. (2018) Brief Bioinform 19(3): 361-373).


SyntTax - est un serveur Web reliant la synténie à la taxonomie procaryote. SyntTax intègre un arbre taxonomique hiérarchique complet permettant un accès intuitif à tous les procaryotes complètement séquencés (archées et bactéries). Des organismes uniques ou multiples peuvent être choisis sur la base de leur lignée en sélectionnant les nœuds de rang correspondants dans l'arbre. C'est mon préféré parmi les programmes synteny (Référence : Oberto J. 2013. BMC Bioinformatics. 14:4). Les résultats ci-dessous ont été générés en utilisant le facteur sigma de choc thermique (RpoH) de Salmonelle Typhimurium contre la Pseudomonadales.

Serveur Citeny pour l'identification et l'analyse de Synteny du réarrangement du génome (A. U. Sinha & J. Meller, Université de Cincinnati, États-Unis) - ce serveur peut être utilisé pour trouver des régions synténiques sur plusieurs génomes et mesurer l'étendue du réarrangement du génome en utilisant la distance d'inversion comme mesure. Vous pouvez créer un projet et télécharger vos propres données ou travailler avec des données procaryotes ou eucaryotes préchargées.

SimpleSynteny - fournit un pipeline pour évaluer la synténie d'un ensemble présélectionné de cibles génétiques sur plusieurs génomes d'organismes. L'accent a été mis sur la facilité d'utilisation, et les utilisateurs ne sont tenus de soumettre des fichiers FASTA que pour leurs génomes et gènes d'intérêt. SimpleSynteny guide ensuite l'utilisateur à travers un processus itératif d'exploration et de personnalisation des génomes individuellement avant de les combiner en une figure finale haute résolution. (Référence : Veltri D et al. 2016. Nucleic Acids Res. 44 (problème de serveur Web) : W41&ndashW45).

Portail Synteny - les utilisateurs du génome eucaryote peuvent facilement (i) construire des blocs de synténie parmi plusieurs espèces en utilisant des alignements prédéfinis dans la base de données du navigateur génomique de l'UCSC, (ii) visualiser et télécharger les relations synténiques sous forme d'images de haute qualité, (iii) parcourir les blocs de synténie avec des données génétiques. informations et (iv) télécharger les détails des blocs de synténie à utiliser comme entrée pour les analyses basées sur la synténie en aval, le tout dans une interface Web intuitive et facile à utiliser. (Référence : Lee J et al. 2016. Nucleic Acids Res 44(W1) : W35&ndashW40).

AutoGRAPH est un serveur Web intégré pour l'analyse génomique comparative multi-espèces. Il est conçu pour construire et visualiser des cartes de synténie entre deux ou trois espèces, déterminer et afficher les relations de macrosynténie et de microsynténie entre les espèces et pour mettre en évidence les points de rupture évolutifs.
Le serveur Web construit des cartes de synténie par comparaison par paires d'ordres marqueur/ancre entre un chromosome de référence et un ou deux génomes testés. Il permet aux utilisateurs de visualiser et de caractériser plusieurs caractéristiques : les segments conservés (CS), les segments conservés ordonnés (CSO) et les points d'arrêt. ( Référence : Derrien T et al. 2007. Bioinformatique 23:498-499).

Sibélie (Université de Californie à San Diego, États-Unis) - est un outil pour trouver des blocs de synténie dans plusieurs génomes microbiens étroitement liés à l'aide de graphes itératifs de Bruijn. Contrairement à la plupart des autres outils, Sibelia peut trouver des blocs de synténie qui sont répétés dans les génomes ainsi que des blocs partagés par plusieurs génomes. Il représente des blocs de synténie dans une structure hiérarchique à plusieurs couches, chacune représentant un niveau de granularité différent.

Kablammo vous aide à créer des visualisations interactives des résultats BLAST à partir de votre navigateur Web. Trouvez vos alignements les plus intéressants, répertoriez les paramètres détaillés pour chacun et exportez une image vectorielle prête pour la publication. Incroyablement facile à utiliser - voici les résultats d'une comparaison BLASTN avec Escherichia phages T1 (requête) et ADB-2. ( Référence : Wintersinger JA et al. Bioinformatique 31:1305-1306).


M1CR0B1AL1Z3R - est un « guichet unique » pour effectuer des analyses de données de génomique microbienne via une interface utilisateur graphique simple. Certaines des fonctionnalités mises en œuvre dans M1CR0B1AL1Z3R sont : (i) l'extraction de cadres de lecture ouverts putatifs et l'analyse génomique comparative du contenu génétique (ii) l'extraction d'ensembles orthologues et l'analyse de leur distribution de taille (iii) l'analyse des modèles de présence-absence de gènes (iv) la reconstruction d'un arbre basé sur l'ensemble orthologue extrait (v) inférant la variation du contenu en GC entre les lignées. M1CR0B1AL1Z3R facilite l'extraction et l'analyse de dizaines de génomes bactériens à l'aide de techniques avancées. (Référence : Avram O et al. (2019) Nucleic Acids Res. 47(W1) : W88-W92).

GeneOrder 4.0 (D. Seto, Bioinformatique et biologie computationnelle, George Mason Univ., États-Unis) est conçu pour pouvoir être utilisé pour comparer l'ordre des gènes entre deux génomes bactériens (Référence : Mahadevan P. & Seto D. 2010. Notes de recherche BMC 3:41).
CoreGenes (D. Seto et P. Mahadevan, Bioinformatique et biologie computationnelle, George Mason Univ., États-Unis) - totalise le nombre total de gènes en commun entre les deux génomes comparés affiche la valeur en pourcentage des gènes en commun avec un génome spécifique détermine les gènes uniques contenus dans une paire de protéomes. CoreGenes 3.5 est le serveur par lots CoreGenes. J'ai largement utilisé cet ensemble de ressources dans la classification des virus bactériens.

Si vous avez un fichier gbk pour un phage qui n'a pas encore été déposé dans GenBank, vous pouvez utiliser ces instructions pour convertir vos données au format CoreGenes à utiliser ici.

WebACT - il s'agit de la version Web d'ACT (Artemis Comparison Tool), une visionneuse de comparaison de séquences d'ADN basée sur Artemis (Référence : 21: 3422 - 3423 Visitez la page de la base de données EMBL-EBI et sélectionnez EMBL et "Standard Query Form" pour déterminer le numéro d'accession EMBL pour la séquence qui vous intéresse.

Panseq (Chad Laing, Agence de la santé publique du Canada) - un ensemble d'outils pour l'analyse du 'pan génome' d'un groupe de séquences génomiques. Le pan-génome d'une espèce bactérienne se compose d'un génome central et d'un pool génétique accessoire, ce dernier permettant aux sous-populations de l'organisme de s'adapter à des environnements spécifiques. Ceux-ci incluent Novel Region Finder, qui trouvera des séquences uniques à une souche ou à un groupe de souches par rapport à une autre souche ou à un autre groupe de souches. L'analyse pan-génomique identifie le pan-génome parmi vos séquences et trouve les SNP dans le génome central et détermine la distribution des régions génomiques accessoires. Le sélecteur de loci identifie les loci qui offrent la meilleure discrimination parmi votre ensemble de données. (Référence : Laing, C. et al. 2010. BMC Bioinformatics. 11: 461).

PARIGA - permet aux utilisateurs d'effectuer des recherches BLAST tous contre tous sur deux ensembles de séquences sélectionnées par l'utilisateur. De plus, comme il stocke les deux sorties BLAST dans une base de données d'objets sérialisés en python, les résultats peuvent être filtrés selon plusieurs paramètres en temps réel, sans réexécuter le processus et éviter des efforts de programmation supplémentaires. (Référence : Orsini M. et al. 2013. PLoS One 8(5):e62224).

EDGAR (Eefficace cadre de base de données pour comparaison genome UNEanalyse à l'aide du score BLAST Ratios) - EDGAR est conçu pour effectuer automatiquement des comparaisons de génomes dans une approche à haut débit et peut être utilisé pour l'analyse du génome central, pangénomique et singleton, et la construction du diagramme de Venn. (Référence : Blom J. et al. 2009. BMC Bioinformatics 10: 154).

OrthoVenn - est un serveur Web pour la comparaison à l'échelle du génome et l'annotation de grappes orthologues à travers plusieurs espèces. Il fournit une couverture des vertébrés, des métazoaires, des protistes, des champignons, des plantes et des bactéries pour la comparaison des grappes orthologues et prend également en charge le téléchargement de séquences de protéines personnalisées à partir d'espèces définies par l'utilisateur. Un diagramme de Venn interactif, des comptes récapitulatifs et des résumés fonctionnels de la disjonction et de l'intersection des groupes partagés entre les espèces sont affichés dans le cadre du résultat OrthoVenn. OrthoVenn inclut également des vues approfondies des clusters à l'aide de divers outils d'analyse de séquence. De plus, il identifie des grappes orthologues de gènes à copie unique et permet une recherche personnalisée de grappes de gènes spécifiques à l'aide de mots clés ou BLAST. (Référence : Y. Yang et al. 2015. Nucl. Acids Res. 43 (W1) : W78-W84). Trouvé aussi ici.

BEACON est un outil logiciel qui compare les annotations d'un génome particulier à partir de différentes méthodes d'annotation (MA). Il utilise le format GenBank comme entrée et dérive une annotation étendue (EA) à côté de la liste des annotations originales des AM individuels. (Référence : Kalkatawi M, BMC Genomics. 201516(1): 1-8).

ANI (UNEmoyenne Nnucléotide jedentity) - estime l'identité moyenne des nucléotides en utilisant à la fois les meilleurs résultats (ANI unidirectionnel) et les meilleurs résultats réciproques (ANI bidirectionnel) entre deux ensembles de données génomiques. Typiquement, les valeurs ANI entre les génomes de la même espèce sont supérieures à 95 % (par exemple, Escherichia coli). Les valeurs inférieures à 75 % ne sont pas fiables et l'AAI doit être utilisé à la place. Cet outil prend en charge les génomes complets et provisoires (multi-fasta). (Référence : Goris J et al. 2007. Int J Syst Evol Microbiol. 57 (partie 1) : 81-91).

Calculatrice d'identité nucléotidique moyenne (ANI) - leur calculatrice ANI utilise l'algorithme OrthoANIu, une itération améliorée de l'algorithme OrthoANI original, qui utilise USEARCH au lieu de BLAST (Référence : Yoon, S. H. et al. (2017). Antonie van Leeuwenhoek. 110:1281&ndash1286).

VIRIDIQUE (Virnous jeintergénomique Diposition Ccalculateur C. Moraru, Institut de chimie et de biologie de l'environnement marin, Allemagne) - le premier niveau de classification des bactériophages par ICTV consiste à calculer l'identité globale des séquences d'ADN entre deux virus. Ce nouvel outil calcule par paires les distances/similitudes intergénomiques entre les génomes des phages. Pour l'exécuter, téléchargez un seul fichier fasta avec tous les génomes de phage d'intérêt, créez un projet et appuyez sur Exécuter. Enregistrez l'ID du projet qui sera affiché lors de la création du projet. Vous en aurez besoin pour accéder aux données si les calculs prennent du temps.

GGDC (genome-À-genome distance Calculator) - fournit des méthodes pour déduire les distances du génome entier qui sont bien capables d'imiter l'hybridation ADN-ADN (DDH). Les valeurs calculées avec GGDC donnent une corrélation un peu meilleure avec les valeurs DDH en laboratoire humide que des approches alternatives telles que "ANI". Ces fonctions de distance peuvent également faire face à des génomes fortement réduits et à des régions de séquences répétitives. Certains d'entre eux sont également très robustes contre les fractions manquantes d'informations génomiques (en raison d'un séquençage incomplet du génome). Ainsi, ce service Web peut être utilisé pour la délimitation d'espèces basée sur le génome. (Référence : Meier-Kolthoff JP et al. 2013. BMC Bioinformatics 14: 60).

POGO-DB - Basé sur des BLASTs du génome entier à calcul intensif, POGO-DB fournit plusieurs métriques sur le génome par paires : (a) Identité moyenne des acides aminés de tous les meilleurs coups de souffle bidirectionnels qui couvraient au moins 70 % d'identité de séquence (b) Fluidité génomique qui estime la similarité du contenu génétique entre deux génomes (c) Nombre d'orthologues partagés entre deux génomes (tel que défini par deux critères) (d) Identité par paire des gènes d'ARNr 16S les plus similaires (e) Identité par paire de 73 gènes marqueurs supplémentaires conservés dans le monde (dont nous avons déterminé qu'ils existaient dans au moins 90 % de tous les génomes). (Référence : Lan Y et al. 2014. Nucl. Acids Res. 42 (D1) : D625-D632).

VICTOR (Virus Clasification et TBâtiment de ree Onligne Rressource Leibniz-Institut DSMZ-Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH). Ce service Web compare les virus bactériens et archéens (« "phages") à l'aide de leurs séquences génomiques ou protéomiques. Les résultats incluent des arbres phylogénomiques inférés à l'aide de la méthode Genome-BLAST Distance Phyogeny (GBDP), avec support de branche, ainsi que des suggestions pour la classification au niveau de l'espèce, du genre et de la famille. (Le service peut également être appliqué à d'autres types de virus, mais n'a pas encore été testé à cet égard.) Téléchargez vos fichiers FASTA, fichiers GenBank et/ou ID d'adhésion GenBank. (Référence : JP Meier-Kolthoff & M Göker. 2017. Bioinformatique 33(21): 3396&ndash3404).

VIRFAM est dédié à la reconnaissance des modules tête-cou-queue et des gènes de recombinase dans les génomes des phages. Vous pouvez utiliser ce serveur pour rechercher des homologues distants de familles de protéines spécifiques dans des séquences de protéines de bactériophages. Entrée : les séquences protéiques que vous avez produites par vos phages incluent un arbre phylogénétique avec le placement de votre virus. (Référence : Lopes A et al. Nucleic Acids Res. (2010) 38(12): 3952-62).

Seeker - est un outil d'apprentissage en profondeur pour l'identification sans référence de séquences de phages. Seeker permet une détection rapide des phages dans les ensembles de données de séquences et une différenciation nette des séquences de phages des séquences bactériennes, même pour les phages avec peu de similarité de séquence avec les familles de phages établies. Nous validons de manière exhaustive la capacité de Seeker à identifier des phages inconnus et employons Seeker pour détecter des phages inconnus, dont certains sont très différents des familles de phages connues. (Référence : Auslander N et al. (2020) doi.org/10.1101/2020.04.04.025783)

VipTree - génère un "arbre protéomique" des séquences du génome viral basé sur les similitudes de séquences à l'échelle du génome calculées par tBLASTx. Le concept original d'arbre protéomique (c'est-à-dire « l'arbre protéomique des phages ») a été développé par Rohwer et Edwards, 2002. Un arbre protéomique est un dendrogramme qui révèle les relations de similarité génomique globale entre des dizaines, des centaines et des milliers de virus. Il a été montré que les groupes viraux identifiés dans un arbre protéomique correspondent bien aux taxonomies virales établies. ( Référence : Nishimura Y et al. (2017) Bioinformatique 33: 2379&ndash2380).

MiGA (Microbie genomes UNEtlas) - un serveur Web qui permet la classification d'une séquence génomique de requête inconnue, complète ou partielle, par rapport à tous les taxons classés taxonomiquement avec des séquences génomiques disponibles, ainsi que des comparaisons avec d'autres génomes apparentés, y compris ceux non cultivés, sur la base de l'agrégat génomique de nucléotide moyen et les concepts d'identité des acides aminés (ANI/AAI). (Référence : Rodriguez-R et al (2018) Nucleic Acids Research 46(W1) : W282-W288).

CGView Server - est un outil de génomique comparatif pour les génomes circulaires qui permet de visualiser les informations sur les caractéristiques des séquences dans le contexte des résultats de l'analyse des séquences. Une séquence du génome est fournie au programme au format FASTA, GenBank, EMBL ou brut. Jusqu'à trois séquences de comparaison (ou ensembles de séquences) au format FASTA peuvent également être soumises. Le serveur CGView utilise BLAST pour comparer la séquence du génome aux séquences de comparaison, puis convertit les résultats et toutes les informations disponibles sur les fonctionnalités (à partir du fichier GenBank, EMBL ou GFF en option) ou les informations d'analyse (à partir d'un fichier GFF en option) en un carte graphique de qualité montrant la séquence entière du génome, ou une vue agrandie d'une région d'intérêt. Plusieurs options sont disponibles pour spécifier la manière dont les comparaisons BLAST sont effectuées et pour contrôler la manière dont les résultats sont affichés. (Référence : Grant JR & Stothard P. 2008. Nucleic Acids Res. 36 (problème de serveur Web) : W181-184)

Jéna Procaryote genome Viewer (JPGV) - à partir d'un fichier plat GenBank (*.gbk) génère des tracés linéaires ou circulaires, y compris si vous le souhaitez, le contenu GC, l'asymétrie GC, l'excès de purine et l'excès de céto peuvent être affichés. Permet également l'analyse BLAST contre les génomes apparentés. Nécessite une inscription gratuite.

GenomeVx - crée des cartes modifiables, de qualité publication, des génomes mitochondriaux et chloroplastiques et des grands plasmides. Ces cartes montrent l'emplacement des gènes et des caractéristiques chromosomiques ainsi qu'une échelle de position. Le programme prend en entrée soit des positions d'entités brutes, soit des enregistrements GenBank. Dans ce dernier cas, les caractéristiques sont automatiquement extraites et colorées, dont un exemple est donné. La sortie est au format Adobe Portable Document Format (PDF) et peut être modifiée par des programmes tels qu'Adobe Illustrator. (Référence : G. Conant & K. Woolfe. 2008. Bioinformatics 24:861-862).

myGenomeBrowser - est un environnement Web qui offre aux biologistes un moyen de créer, d'interroger et de partager leurs navigateurs génomiques. Cet outil, qui s'appuie sur JBrowse, est conçu pour donner plus d'autonomie aux utilisateurs tout en simplifiant et en minimisant l'intervention des administrateurs système. Ils ont étendu les fonctionnalités de base du navigateur génomique pour permettre aux utilisateurs d'interroger, d'analyser et de partager leurs données. ( Référence : S. Carrere & J. Gouzy. Bioinformatique (2017) 33 (8): 1255-1257).

DNAPlotter - est une application Java interactive pour générer des représentations circulaires et linéaires des génomes. Utilisant les bibliothèques Artemis pour fournir une méthode conviviale de chargement dans des fichiers de séquence (EMBL, GenBank, GFF) ainsi que des données de bases de données relationnelles, il filtre les caractéristiques d'intérêt à afficher sur des pistes distinctes définissables par l'utilisateur. Il peut être utilisé pour produire des images de qualité de publication pour des articles ou des pages Web. (Référence : Carver, T. et al. 2008. Bioinformatics 25:119-120)

GeneWiz (Centre d'analyse des séquences biologiques, Université technique danoise) produit des altases génomiques linéaires ou circulaires comme celle ci-dessous. Ils ont des noms prêts pour la plupart des bactéries, mais en téléchargeant des données personnalisées au format GenBank (.gbk), on peut créer son propre diagramme montrant les propriétés génétiques et physiques de votre génome.

OrganellarGenomeDRAW - est une suite d'outils logiciels qui permet aux utilisateurs de créer des représentations visuelles de haute qualité des séquences génomiques annotées circulaires et linéaires fournies sous forme de fichiers GenBank ou de numéros d'accession. Bien que tous les types de séquences d'ADN soient acceptés comme entrée, le logiciel a été spécifiquement optimisé pour représenter correctement les caractéristiques des génomes organellaires. Une extension récente facilite le tracé des données quantitatives d'expression génique, telles que les données de transcription ou d'abondance de protéines, directement sur la carte du génome (Référence : Lohse M, et al. 2013. Nucleic Acids Res. 41(Problème de serveur Web) : W575-81) .

PlasmaDNA - En commençant par une séquence d'ADN primaire, PlasmaDNA recherche des sites de restriction, des cadres de lecture ouverts, des séquences d'hybridation d'amorces et divers domaines communs. Les bases de données sont facilement extensibles par l'utilisateur pour répondre à ses besoins de clonage les plus courants. PlasmaDNA peut gérer et représenter graphiquement plusieurs séquences en même temps, et garde en mémoire les surplombs à la fin des séquences s'il y en a. Cela signifie qu'il est possible de digérer virtuellement des fragments, d'ajouter les produits de digestion au projet et de ligaturer des fragments avec des extrémités compatibles pour générer les nouvelles séquences. Excellent package pour les plasmides. (Référence : Angers-Loustau A et al. 2007. BMC Mol Biol. 2007 8:77).

GSDraw (Gene Structure Draw Server) est un serveur Web pour la famille de gènes permettant de dessiner des diagrammes schématiques de structure de gènes. Les utilisateurs peuvent soumettre des séquences génomiques, CDS et de transcription. GSDraw utilise ces informations pour obtenir la structure du gène, le motif protéique et l'arbre phylogénétique, puis dessine le diagramme correspondant. (Référence : Wang Y, et al. 2013. Nucleic Acids Res. 41 (issue de la base de données) : D1159-66).

GECA est un outil convivial permettant de représenter l'organisation des exons/introns des gènes et de mettre en évidence les changements dans la structure des gènes parmi les membres d'une famille de gènes. Il repose sur l'alignement des protéines, complété par l'identification d'introns communs dans les gènes correspondants à l'aide du CIWOG. GECA produit une représentation graphique principale montrant l'ensemble aligné résultant de structures de gènes, où les exons sont à l'échelle. La caractéristique importante et originale de GECA est qu'il combine ces structures de gènes avec un affichage symbolique mettant en évidence la similarité de séquence entre les gènes suivants. Il convient de noter que cette combinaison de la structure des gènes avec les indications de similitudes entre les gènes apparentés permet une identification rapide d'événements possibles de gain ou de perte d'introns, ou indique des annotations structurelles erronées. L'image de sortie est générée dans un format graphique réseau portable qui peut être utilisé pour des publications scientifiques. (Référence : Fawal N, et al. 2012. Bioinformatique 28:1398-9).

GeneDesign - est une excellente ressource pour la conception de gènes synthétiques. Il comprend des outils pour l'optimisation des codons et la suppression des sites de restriction (Référence : Richarson, S.M. et al. 2006. Genome Research 16:550-556)

Orphelia - Orphelia est un outil de recherche d'ORF métagénomique pour la prédiction de gènes codant des protéines dans de courtes séquences d'ADN environnementales d'origine phylogénétique inconnue. Orphelia est basé sur une approche d'apprentissage automatique en deux étapes qui a été récemment introduite par notre groupe. Après l'extraction initiale des ORF, des discriminants linéaires sont utilisés pour extraire les caractéristiques de ces ORF. Par la suite, un réseau de neurones artificiels combine les caractéristiques et calcule une probabilité de gène pour chaque ORF dans un fragment. Une stratégie gloutonne calcule une combinaison probable d'ORF à score élevé avec une contrainte de chevauchement. (Référence : K.J. Hoff et al. 2009. Nucl. Acids Res. 37(Problème de serveur Web : W101-W105).

WebMGA est un serveur Web personnalisable pour une analyse métagénomique rapide qui comprend plus de 20 outils couramment utilisés pour les analyses telles que l'appel ORF, le regroupement de séquences, le contrôle qualité des lectures brutes, la suppression des artefacts de séquençage et des contaminations, l'analyse taxonomique, l'annotation fonctionnelle, etc. Tous les outils derrière WebMGA ont été implémentés pour fonctionner en parallèle sur notre cluster d'ordinateurs local. (Référence : Wu S, et al. 2011. BMC Genomics. 12:444).

Le serveur MG-RAST (le Metagenomics RAST) est une plate-forme d'analyse automatisée pour les métagénomes fournissant des informations quantitatives sur les populations microbiennes basées sur des données de séquence. Le serveur fournit principalement le téléchargement, le contrôle de la qualité, l'annotation automatisée et l'analyse des échantillons de fusil de chasse métagénomique procaryote. (Référence : Wilke A, et al. 2016. Nucleic Acids Res. 44(D1) :D590-4).

Le serveur Web et le programme autonome d'attribution taxonomique complète de MetaBin de séquences métagénomiques (Laboratoire de bioinformatique intégrée, RIKEN, Japon) permettent une attribution taxonomique plus rapide et plus précise de lectures de séquences simples et appariées de longueurs variables (&ge45 pb) obtenues à la fois de Sanger et de next -les plateformes de séquençage de génération. A un tutoriel.

AmphoraNet - utilise 31 gènes marqueurs bactériens et 104 gènes marqueurs de protéines archéennes pour le phylotypage métagénomique et génomique. La plupart d'entre eux sont des gènes à copie unique, par conséquent AmphoraNet est adapté pour estimer la composition taxonomique des communautés bactériennes et archéennes à partir de données de séquençage métagénomiques. (Référence : Kerepesi C, et al. 2014. Gene. 533:538-40).

METAGENassist - permet aux utilisateurs de prendre des données de recensement bactérien à partir de différents sites environnementaux ou de différents hôtes biologiques, et d'effectuer des analyses statistiques multivariées complètes sur les données. Ces analyses multivariées peuvent être effectuées à l'aide d'étiquettes phénotypiques taxonomiques ou générées automatiquement et visualisées à l'aide d'une variété d'outils graphiques de haute qualité. Les données de recensement bactérien peuvent être dérivées de données d'ARNr 16S, de séquençage NextGen ou même de techniques de culture microbienne classiques. Comprend un tutoriel. (Référence : Arndt D, et al. 2012. Nucleic Acids Res. 40(Problème de serveur Web) : W88-95).

Métagénomique en temps réel (Dr Robert Edwards, Université d'État de San Diego, États-Unis) - est la prochaine révolution dans l'annotation du métagénome : le traitement et l'analyse des données en temps réel. Vous pouvez enfin annoter un métagénome en temps réel, sans attente. Vous pouvez télécharger vos propres données pour analyse. Ils acceptent les fichiers fasta ou fastq, et vous pouvez fournir des données compressées zip ou gzip.

Métagénomique EBI (EMBL-EBI) - est un pipeline automatisé pour l'analyse et l'archivage de données métagénomiques qui vise à fournir des informations sur la diversité phylogénétique ainsi que le potentiel fonctionnel et métabolique d'un échantillon. Vous pouvez parcourir librement toutes les données publiques du référentiel. Le service identifie les séquences d'ARNr à l'aide de rRNASelector et effectue une analyse taxonomique des ARNr 16S à l'aide de Qiime. Les lectures restantes sont soumises à une analyse fonctionnelle des séquences de codage de protéines prédites à l'aide de la ressource d'analyse de séquences InterPro. InterPro utilise des modèles de diagnostic pour classer les séquences en familles et pour prédire la présence de domaines et de sites fonctionnellement importants. En utilisant cette ressource, le service offre une alternative puissante et sophistiquée aux analyses métagénomiques fonctionnelles basées sur BLAST. Les données soumises au service EBI Metagenomics sont automatiquement archivées dans l'European Nucleotide Archive (ENA). Les numéros d'accès sont fournis pour les données de séquence.

Kaiju - est une classification taxonomique rapide et sensible pour la métagénomique qui prend des séquences de nucléotides au format compressé FASTA ou FASTQ. Les lectures sont directement attribuées aux taxons à l'aide de la taxonomie NCBI et d'une base de données de référence de séquences protéiques de génomes bactériens, archéens et viraux. Par défaut, Kaiju utilise soit les génomes complets disponibles de NCBI RefSeq, soit le sous-ensemble microbien de la base de données de protéines non redondante nr utilisée par NCBI BLAST. Kaiju traduit les lectures en séquences d'acides aminés, qui sont ensuite recherchées dans la base de données à l'aide d'une recherche en arrière modifiée sur une implémentation efficace en mémoire de la transformation de Burrows-Wheeler, qui trouve les correspondances exactes maximales (MEM), permettant éventuellement des discordances dans l'alignement des protéines. (Référence : Menzel P et al. 2016. (Nat. Commun. 7:11257)

PhyloPythiaS - est un classificateur basé sur la composition de séquences rapide et précis qui utilise les relations hiérarchiques entre les clades. Les affectations taxonomiques avec le serveur Web peuvent être effectuées avec un modèle générique ou avec des modèles spécifiques à des échantillons que les utilisateurs peuvent spécifier et créer. Plusieurs modes de visualisation interactifs et plusieurs formats de téléchargement permettent une analyse rapide et pratique et un traitement en aval des affectations taxonomiques. (Référence : Patil KR, et al. 2012. PLoS One. 7:e38581).

Métagénome virtuel - Un serveur Web pour reconstruire des métagénomes à partir de séquences d'ARNr 16S. une nouvelle méthode pour la reconstruction rapide et efficace d'un métagénome virtuel dans les communautés microbiennes environnementales sans utiliser le séquençage génomique à grande échelle. Nous démontrons cette approche en utilisant des séquences de gènes d'ARNr 16S obtenues à partir d'une analyse d'électrophorèse sur gel en gradient dénaturant, mappées sur des génomes entièrement séquencés, pour reconstruire des organisations virtuelles de type métagénome. (Référence : Okuda S, et al. 2012. Nat Commun. 3:1203.)

MetaPhlAn2 (version 2.0.0) - est un outil de calcul pour profiler la composition des communautés microbiennes (bactéries, archées, eucaryotes et virus) à partir de données de séquençage métagénomique avec une résolution au niveau de l'espèce. Il est également capable d'identifier des souches spécifiques et de suivre les souches à travers des échantillons pour toutes les espèces. Il permet des affectations taxonomiques sans ambiguïté, une estimation précise de l'abondance relative des organismes et une résolution au niveau des espèces pour les bactéries, les archées, les eucaryotes et les virus. (Référence : Segata N, et al. 2012. Nature Methods 8: 811&ndash814).

CoMet-Universe &mdash un serveur Web pour l'analyse comparative des métagénomes basée sur les signatures de domaines protéiques. En commençant par le téléchargement de vos séquences d'ADN, le pipeline CoMet effectue toutes les étapes nécessaires pour une analyse complète du métagénome, y compris la prédiction des gènes, la détection des domaines protéiques à l'aide de Pfam 27, le profilage métabolique basé sur les voies KEGG et l'estimation de l'abondance des taxons dans tous les domaines de la vie et des virus. (Référence : Aßhauer KP et al. Int J Mol Sci. 2014 15(7):12364-78).

16S Classifier - est un outil de classification taxonomique rapide et précise des régions hypervariables de l'ARNr 16S dans les ensembles de données métagénomiques. Sur de vrais ensembles de données métagénomiques, il a montré jusqu'à 99,7 % de précision au niveau du phylum et jusqu'à 99,0 % de précision au niveau du genre. (Référence : N. Chaudhary et al. 2015. PLoS One 10(2): e0116106). Il est également accessible ici

ADNATLAS (DNA2.0 Inc., États-Unis) - Une place pour toutes vos séquences. Importez facilement toutes vos constructions, y compris Genbank, Gene Designer, Excel, Word et presque tous les formats textuels. DNA Atlas analyse immédiatement vos fichiers de téléchargement et en déduit si chaque séquence est une caractéristique, une construction, une amorce, un ADN ou un acide aminé. Téléchargez des fonctionnalités et des amorces pour les voir annotées dans vos séquences. Affichez instantanément les constructions annotées avec notre liste organisée de plus de 1000 fonctionnalités, ou ajoutez les vôtres. Utilisez la recherche de séquences basée sur BLAST pour aligner et comparer rapidement vos séquences. Gardez une trace de vos séquences, caractéristiques et amorces. Catégorisez-les à l'aide d'étiquettes - des emplacements de congélation aux données de caractérisation. (nécessite une inscription).

SuperPhy (Chad Laing & Vic Gannon, Agence de la santé publique du Canada) est un outil en ligne pour la génomique prédictive des Escherichia coli. La plateforme intègre les outils d'analyses et les données de séquençage du génome pour tous accessibles au public E. coli génomes et facilite le téléchargement de nouvelles séquences génomiques des utilisateurs dans des paramètres publics ou privés. SuperPhy fournit des analyses en temps réel de milliers de séquences génomiques basées sur les métadonnées de la souche, y compris le contexte géospatial et phylogénétique.

Nommer votre bactériophage : Ceci est d'une importance primordiale pour les membres de la communauté des virus bactériens pour nommer de manière appropriée leurs phages nouvellement isolés. Un bon point de départ est « Comment nommer et classer votre phage : un guide informel. » ( Référence : Adriaenssens E & Brister JR. 2017. Virus. 9(4). pii: E70) auquel j'ajouterai les points suivants (a) veuillez vérifier que le nom que vous proposez n'a pas déjà été utilisé et, (b) ne nommez pas votre phage Enterobacter ia phage ø1234 ou Enterobacteria phage 2017/ABC_567 puisque ces noms sont incompatibles avec la création de nouveaux taxons d'espèces et de genres par le Comité international de taxonomie des virus (ICTV). Pour savoir si votre nom proposé est unique, consultez :

Vérification du nom du phage (Stephen T. Abedon, Ohio State University, États-Unis) - pour voir si 'votre' nom de phage se trouve actuellement sur Google Scholar, Google Books, PubMed, ou même Bacteriophage Names 2000.

Recherche de nom de phage CPT (Center for Phage Technology de l'Université Texas A&M)


Manuel de préparation des protéines

Découvrez comment dessaler, échanger des tampons, concentrer et/ou éliminer les contaminants des échantillons de protéines, l'immunoprécipitation et d'autres méthodes de purification et de nettoyage des protéines à l'aide de divers outils de biologie des protéines Thermo Scientific dans ce manuel de 32 pages.

  • Immunoprécipitation (IP), co-IP et chromatine-IP
  • Étiquettes de purification de protéines recombinantes
  • Dialyse des échantillons de protéines en toute sécurité à l'aide des cassettes et appareils de dialyse Slide-A-Lyzer
  • Dessaler rapidement des échantillons avec une récupération élevée des protéines à l'aide des colonnes et des plaques de dessalage par centrifugation Zeba
  • Extraire efficacement des contaminants spécifiques à l'aide de résines optimisées pour l'élimination des détergents ou des endotoxines
  • Concentrez rapidement des échantillons de protéines diluées à l'aide des concentrateurs de protéines Pierce

Apprendre encore plus

Sélectionnez des produits

Les interactions protéiques sont fondamentalement caractérisées comme stables ou transitoires, et les deux types d'interactions peuvent être fortes ou faibles. Les interactions stables sont celles associées aux protéines qui sont purifiées sous forme de complexes multi-sous-unités, et les sous-unités de ces complexes peuvent être identiques ou différentes. L'hémoglobine et l'ARN polymérase centrale sont des exemples d'interactions multi-sous-unités qui forment des complexes stables.

Les interactions transitoires devraient contrôler la majorité des processus cellulaires. Comme son nom l'indique, les interactions transitoires sont de nature temporaire et nécessitent généralement un ensemble de conditions qui favorisent l'interaction, telles que la phosphorylation, les changements de conformation ou la localisation dans des zones discrètes de la cellule. Les interactions transitoires peuvent être fortes ou faibles, rapides ou lentes. Lorsqu'elles sont en contact avec leurs partenaires de liaison, les protéines interagissant de manière transitoire sont impliquées dans un large éventail de processus cellulaires, notamment la modification, le transport, le repliement, la signalisation, l'apoptose et le cycle cellulaire des protéines. L'exemple suivant fournit une illustration des interactions protéiques qui régulent les processus apoptotiques et anti-apoptotiques.


Interaction protéine-protéine BAD lourde. Panneau A : gel SDS-PAGE coloré au Coomassie de BAD-GST-HA-6xHIS léger et lourd recombinant purifié à partir de lysats HeLa IVT (L), en utilisant une affinité en tandem de résine de glutathion (E1) et de résine de cobalt (E2). L'écoulement (FT) de chaque colonne est indiqué. Panneau B : Schéma de la phosphorylation de BAD et des interactions protéiques pendant la survie cellulaire et la mort cellulaire (c'est-à-dire l'apoptose). Panneau C : couverture de séquence de protéine BAD montrant les sites de phosphorylation consensus Akt identifiés (boîte rouge). Panel D : spectres MS du peptide BAD marqué par un isotope stable HSSYPAGTEDDEGmGEEPSPFr.

Les protéines se lient les unes aux autres par une combinaison de liaisons hydrophobes, de forces de van der Waals et de ponts salins au niveau de domaines de liaison spécifiques sur chaque protéine. Ces domaines peuvent être de petites fentes de liaison ou de grandes surfaces et peuvent être longs de quelques peptides ou couvrir des centaines d'acides aminés. La force de la liaison est influencée par la taille du domaine de liaison. Un exemple de domaine de surface commun qui facilite des interactions protéine-protéine stables est la fermeture éclair à leucine, qui consiste en des hélices sur chaque protéine qui se lient les unes aux autres de manière parallèle grâce à la liaison hydrophobe de résidus leucine régulièrement espacés sur chaque α. -hélice qui se projettent entre les chaînes peptidiques hélicoïdales adjacentes. En raison du compactage moléculaire serré, les fermetures à glissière à leucine assurent une liaison stable pour les complexes multiprotéiques, bien que toutes les fermetures à glissière à leucine ne se lient pas de la même manière en raison des acides aminés non leucine dans l'hélice qui peuvent réduire le tassement moléculaire et donc la force de la interaction.

Deux domaines d'homologie Src (SH), SH2 et SH3, sont des exemples de domaines de liaison transitoires communs qui se lient à de courtes séquences peptidiques et se trouvent couramment dans les protéines de signalisation. Le domaine SH2 reconnaît les séquences peptidiques avec des résidus tyrosine phosphorylés, qui indiquent souvent l'activation de la protéine. Les domaines SH2 jouent un rôle clé dans la signalisation des récepteurs du facteur de croissance, au cours de laquelle la phosphorylation des récepteurs médiée par un ligand au niveau des résidus tyrosine recrute des effecteurs en aval qui reconnaissent ces résidus via leurs domaines SH2. Le domaine SH3 reconnaît généralement les séquences peptidiques riches en proline et est couramment utilisé par les kinases, les phospholipases et les GTPases pour identifier les protéines cibles. Bien que les domaines SH2 et SH3 se lient généralement à ces motifs, la spécificité des interactions protéiques distinctes est dictée par les résidus d'acides aminés voisins dans le motif respectif.

Le résultat de deux ou plusieurs protéines qui interagissent avec un objectif fonctionnel spécifique peut être démontré de plusieurs manières différentes.Les effets mesurables des interactions protéiques ont été décrits comme suit :

  • Modifier les propriétés cinétiques des enzymes, qui peuvent être le résultat de changements subtils dans la liaison au substrat ou d'effets allostériques
  • Permettre la canalisation du substrat en déplaçant un substrat entre des domaines ou des sous-unités, résultant finalement en un produit final prévu
  • Créer un nouveau site de liaison, généralement pour les petites molécules effectrices
  • Inactiver ou détruire une protéine
  • Modifier la spécificité d'une protéine pour son substrat grâce à l'interaction avec différents partenaires de liaison, par exemple, démontrer une nouvelle fonction qu'aucune des protéines ne peut présenter seule
  • Rôle réglementaire dans un événement en amont ou en aval

Habituellement, une combinaison de techniques est nécessaire pour valider, caractériser et confirmer les interactions protéiques. Des protéines auparavant inconnues peuvent être découvertes par leur association avec une ou plusieurs protéines connues. L'analyse des interactions protéiques peut également révéler des rôles fonctionnels uniques et imprévus pour des protéines bien connues. La découverte ou la vérification d'une interaction est la première étape pour comprendre où, comment et dans quelles conditions ces protéines interagissent in vivo et les implications fonctionnelles de ces interactions.

Bien que les différentes méthodes et approches pour étudier les interactions protéine-protéine soient trop nombreuses pour être décrites ici, le tableau ci-dessous et le reste de cette section se concentre sur les méthodes courantes pour analyser les interactions protéine-protéine et les types d'interactions qui peuvent être étudiées à l'aide de chaque méthode. . En résumé, les interactions protéine-protéine stables sont plus faciles à isoler par des méthodes physiques telles que la co-immunoprécipitation et les tests pull-down, car le complexe protéique ne se désassemble pas avec le temps. Des interactions faibles ou transitoires peuvent être identifiées à l'aide de ces méthodes en réticulant d'abord de manière covalente les protéines pour geler l'interaction pendant la co-IP ou le pull-down. Alternativement, la réticulation, ainsi que le transfert d'étiquettes et l'analyse par transfert far-western, peuvent être effectués indépendamment d'autres méthodes pour identifier les interactions protéine-protéine.

Méthodes courantes pour analyser les différents types d'interactions protéiques

MéthodeInteractions protéine-protéine
Co-immunoprécipitation (co-IP)Stable ou fort
Dosage pull-downStable ou fort
Analyse d'interaction de protéines de réticulationTransitoire ou faible
Analyse d'interaction de protéines de transfert d'étiquettesTransitoire ou faible
Analyse de transfert de far-westernMoyennement stable

La co-immunoprécipitation (co-IP) est une technique populaire pour la découverte d'interactions protéiques. La co-IP est réalisée essentiellement de la même manière qu'une immunoprécipitation (IP) d'une seule protéine, sauf que la protéine cible précipitée par l'anticorps, également appelée « appât », est utilisée pour co-précipiter un complexe partenaire de liaison/protéine , ou "proie", à partir d'un lysat. Essentiellement, la protéine interagissante est liée à l'antigène cible, qui est lié par l'anticorps qui est immobilisé sur le support. Les protéines immunoprécipitées et leurs partenaires de liaison sont couramment détectés par électrophorèse sur gel de dodécylsulfate de sodium-polyacrylamide (SDS-PAGE) et analyse western blot. L'hypothèse qui est généralement faite lorsque des protéines associées sont co-précipitées est que ces protéines sont liées à la fonction de l'antigène cible au niveau cellulaire. Ceci n'est cependant qu'une hypothèse qui est sujette à une vérification plus approfondie.

Co-immunoprécipitation de la cycline B et Cdk1. Les billes magnétiques Thermo Scientific Pierce Protein A/G se lient à l'anticorps Cdk1 complexé avec Cdk1. La cycline B est liée au Cdk1 et est capturée avec son partenaire de liaison.


Remerciements

Nous tenons à remercier les membres de notre équipe Congying Chen et Liang Yi pour leur aide dans la collecte des circRNA traduits. Nous remercions également le soutien du Center for Precision Medicine de l'Université Sun Yat-sen.

Examiner l'historique

L'historique des révisions est disponible en tant que fichier supplémentaire 5.

Informations sur l'examen par les pairs

Anahita Bishop était la rédactrice principale de cet article et a géré son processus éditorial et son examen par les pairs en collaboration avec le reste de l'équipe éditoriale.


Introduction

Avec les avancées significatives des produits biologiques et biopharmaceutiques au fil des ans, les peptides et les protéines ont émergé avec une multitude de nouvelles applications dans le secteur diagnostique ainsi que thérapeutique [1, 2]. Selon les calculs actuels, le marché des médicaments à base de peptides et de protéines est estimé à environ 10 % de l'ensemble du marché pharmaceutique et représentera une proportion encore plus importante du marché à l'avenir [3, 4]. Depuis le début des années 1980, un total de 239 protéines et peptides thérapeutiques sont approuvés pour une utilisation clinique par l'US-FDA [5].

Depuis l'introduction de la première protéine thérapeutique recombinante, l'insuline humaine [6], les protéines sont devenues une nouvelle classe thérapeutique majeure avec près de 380 produits pharmaceutiques commercialisés. Les protéines en tant que thérapeutiques ont attiré beaucoup d'attention scientifique car elles font partie de nombreux récepteurs et canaux dans les membranes, qui facilitent le transport des molécules dans le corps [7]. Malgré leur implication dans diverses réactions biochimiques, les protéines suscitent également une spécificité élevée avec la cible moléculaire [7]. D'autre part, les peptides ont également été largement utilisés comme thérapeutiques dans le cancer, le diabète, les maladies infectieuses et de nombreux autres troubles qui ont longtemps été étudiés pour une solution [8, 9]. Un avantage des peptides par rapport aux autres médicaments est qu'ils sont très polyvalents, fournissant une grande variété de cibles pharmaceutiques, une spécificité élevée et présentent de faibles niveaux de toxicité [5, 9]. Au total, 60 médicaments à base de peptides sont déjà sur le marché et plusieurs autres peptides thérapeutiques sont actuellement en cours d'évaluation dans différentes phases d'essais cliniques [5].

Malgré les nombreux avantages, il existe quelques inconvénients associés à ces thérapies à base de protéines et de peptides. Des limitations telles qu'une faible solubilité, une dégradation protéolytique, une demi-vie circulante relativement courte, une instabilité physicochimique et une immunogénicité restreignent leur facilité d'administration et leur observance du côté de l'utilisateur [1, 4, 10]. Ils ont généralement des poids moléculaires élevés, une faible lipophilie et la présence de certains groupes fonctionnels chargés, qui ont tendance à entraver leur absorption à divers sites du tractus gastro-intestinal (GIT), entraînant leur faible biodisponibilité [4]. Plusieurs stratégies comme la glycosylation, la PEGylation, la manipulation de la séquence d'acides aminés, la conjugaison à l'albumine sérique ont émergé afin d'améliorer les propriétés pharmacocinétiques et pharmacodynamiques ainsi que de diminuer l'immunogénicité et le clivage protéolytique [1, 5]. Avec l'avènement des nouvelles technologies, l'incorporation d'acides aminés non naturels et de liaisons pseudo-peptidiques offre également une plus grande diversité chimique avec des potentiels diversifiés et la rend économiquement plus viable [4, 11].

Au cours de la dernière décennie, une pléthore de bases de données englobant des informations sur les protéines et les peptides avec différentes fonctionnalités thérapeutiques [12–19] ont été développées, reflétant l'intérêt accru pour les protéines et les peptides en tant que thérapeutiques au sein de la communauté scientifique. Un intérêt substantiel a également été montré pour les vaccins sous-unitaires à base de peptides et immunothérapeutiques [20]. Les informations sur les thérapies protéiques et peptidiques approuvées par l'US-FDA ainsi que leurs propriétés pharmacocinétiques / pharmacodynamiques, leurs avantages, leurs modifications chimiques et leurs limites sont très importantes. Cependant, cette information n'est pas facilement accessible et elle est dispersée dans la littérature. À la connaissance des auteurs, à ce jour, il n'existe pas de plate-forme unique librement disponible qui soit totalement dédiée aux protéines et peptides thérapeutiques approuvées par la FDA américaine. Par conséquent, en gardant à l'esprit les faits ci-dessus, nous avons développé THPdb, qui est une ressource complète de toutes les thérapies protéiques et peptidiques approuvées par la FDA américaine ainsi que leurs variantes médicamenteuses correspondantes disponibles sur le marché. Nous prévoyons que les informations disponibles dans le THPdb seront certainement très utiles aux chercheurs travaillant dans le domaine de la découverte de médicaments à base de peptides et de protéines.


Contributions d'auteur

RLC et SM-S ont conçu, supervisé, développé des méthodes expérimentales et analytiques, réalisé des expériences et obtenu des financements pour cette étude. RLC, JAS, MCR, JWS et ARO ont développé des logiciels et effectué des calculs. RLC, SM-S et RW ont effectué une analyse par spectrométrie de masse. RLC, MCR et SM-S ont effectué des analyses statistiques et des validations. ZL, YAC, RW, AG et SM-S ont fourni du matériel d'étude et des ressources informatiques. RLC, MCR, JWS, ZL, ARO et SM-S ont effectué la curation des données. RLC, JAS, MCR, JWS, ZL, YAC, ARO et SM-S ont écrit le manuscrit.


Voir la vidéo: La transcription partie 3: écrire la séquence dun gène à partir dune séquence dARNm (Janvier 2022).