Bourse d’études : Entièrement financé
Diplôme : Licence, Master
Nationalité : Étudiants internationaux
Localisation : Danemark
Dates limites d’inscription : Ouvert
Description de la bourse d’études :
Question scientifique . Les humains sont diploïdes, et il existe donc deux versions de chaque chromosome, l’une héritée de la mère et l’autre du père. La détermination des séquences d’ADN de ces deux copies chromosomiques, appelées haplotypes, est importante pour de nombreuses applications allant de l’histoire des populations aux questions cliniques. Les technologies de séquençage actuelles ne peuvent pas lire un chromosome de bout en bout, mais fournissent de petits morceaux de séquence (appelés “reads”). Comme dans un puzzle, les séquences génomiques sous-jacentes sont reconstruites à partir des lectures en trouvant les chevauchements entre les séquences. Nous développons des algorithmes pour résoudre l’assemblage du génome pour les diploïdes, c’est-à-dire pour “résoudre simultanément deux puzzles avec des images très similaires mais différentes”. Nous appliquerons cette méthode aux génomes du cancer qui présentent des réarrangements complexes.
Approche . En raison des erreurs de séquençage dans les lectures, des régions génomiques hétérozygotes et répétitives, le problème d’assemblage est difficile. Au cours des dernières décennies, les chercheurs l’ont résolu en le présentant comme un problème de graphe de chevauchement, où les nœuds sont les lectures et les bords représentent le chevauchement entre les lectures. Pour détecter les régions où les haplotypes diffèrent (appelées hétérozygotie), nous recherchons des structures locales simples appelées bulles. Une bulle est un type de sous-graphe acyclique dirigé avec une seule source distincte et des sommets de puits qui consiste en de multiples arêtes (avec la même direction) entre ces paires de sommets. Une fois que les bulles ont été identifiées, elles sont simplifiées en supprimant les structures les plus susceptibles de résulter d’erreurs de séquençage. Les bulles résultantes peuvent ensuite être utilisées pour résoudre le “problème de la mise en phase” : trouver des chemins d’haplotype basés sur le cadre du maximum de vraisemblance.
Sujets disponibles :
Bioinformatique
Critères d’éligibilité :
Exigences.
- Programmation : C++, python, shell scripting, algorithmes de graphes.
- Connaissance de base des outils bioinformatiques
- Enthousiasme à résoudre le problème
Possibilité de travailler à distance, avec des réunions régulières sur le campus.
Ce que vous obtiendrez :
- Un mentorat approfondi en matière de méthodes computationnelles
- Une connaissance de la façon dont, conceptuellement, nous pouvons résoudre des problèmes biologiques en utilisant des méthodes de calcul.
méthodes informatiques.
- L’opportunité de travailler dans un environnement diversifié qui comprend des personnes ayant des compétences très différentes,
mais complémentaires.
- La responsabilité et la satisfaction d’être propriétaire de son propre projet.
Les candidats seront convoqués pour une courte discussion (entretien) afin d’évaluer votre créativité,
de raisonnement et de résolution de problèmes.
Procédure de candidature
Pour de plus amples informations, veuillez contacter Mme Feng, Département de l’informatique, Université du Surrey. Veuillez contacter Shilpa Garg ( [email protected] , [email protected] ) et inclure votre CV si vous souhaitez inventer l’avenir de la biologie à l’aide de techniques informatiques.