Résumé La visualisation et la compréhension de la transmission des informations génétiques dans une population et entre les diérentes populations au cours des générations sont des buts assez très importantes

Résumé
La visualisation et la compréhension de la transmission des informations génétiques dans
une population et entre les diérentes populations au cours des générations sont des buts
assez très importantes. La réalisation de ces deux actions peuvent être eectuer par le
développement d’un jeu sérieux dans le domaines de la génétique. Ce jeu peut représenter
les mécanismes de la génétique et la dynamique des populations d’une manière plus simple
et ludique pour la diusion au public.
Ce travail vise à modéliser la génétique de la population et décrire les modications géné-
tiques chez les individus et leurs dynamiques au cours du temps à l’aide des processus
stochastiques, dans un but de réaliser un jeu sérieux qui permet de découvrir la génétique
d’une manière ludique et artistique.
Mots clés : Jeu, Génétique des populations, Dynamique des populations, Processus
stochastiques, Chaine de Markov, Approche bayésienne, MCMC.
i

Abstract
Viewing and comprehension of the transmission of genetic information in a population
and between dierent populations over generations are very important goals. The realiza-
tion of these two actions can be carried out by the development of a serious game in the
domain of genetics. This game can represent the mechanisms of genetics and dynamics
populations in a more simple and fun way for public diusion. This work aims to model
the genetics of the population and describe the genetic modications in individuals and
their dynamics over time using the stochastic process, in order to achieve a serious game
that allows to discover the genetics in a fun and artistic way.
Keywords : Game, Population genetics, Population dynamics, Stochastic process, Markov
chain, Bayesian approach, MCMC.
ii

Remerciements
Premièrement, je remercie DIEU la source de toute connaissance.
Au terme de ce travail, j’adresse mes remerciements le plus sincères à mes encadrants
Monsieur Nicolas SABY et Monsieur Abdelkader GOUAICH, Maitres de conférences à la
faculté de sciences à l’université de Montpellier, de m’avoir accueillie dans le laboratoire
IMAG, LIRMM et Labex Numev, et m’avoir permie de bénécier de leur grand savoir,
leurs compétences, leur modestie et leur aide précieuse tout au long de ce pro jet. Vrai-
ment merci pour cette qualité d’encadrement. . .
Un immense Merci à Dr. Zainab ASSAGHIR, la coordinatrice du master modélisation
mathématique et ses applications, à l’Université Libanaise-Faculté de sciences, qui mérite
tout le respect pour leur aide au bout de mes études en Masters.
Mes remerciements les plus cordiaux à mon encadrant à l’Université Libanaise, Monsieur
Abbas MOURAD, enseignant à la faculté de sciences, pour sa disponibilité, son aide même
pendant les moments les plus diciles, ses explications ainsi pour ses qualités humaines
que j’ai toujours appréciés..
A celui qui a toujours garni mes chemins avec force et lumière. . . mon très cher père
A la plus belle perle du monde. . . .ma tendre mère
A mes s÷urs, Katia et Hiba… mes dons du Dieu
A Jawad. . . je t’aime mon petit
A ma famille, A mes amis, A toute personne qui m’a aidée . . . A Montpellier. . . A la mer. . .
GRAND MERCI!
iii

Table des matières
Résumé i
Remerciements iii
Liste des gures vi
Liste des tableaux vii
1 Introduction 1
2 Matériels et méthodes 5 2.1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5
2.2 Matériels utilisés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6 2.2.1 Logiciels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6
2.2.2 Base des données . . . . . . . . . . . . . . . . . . . . . . . . . . . .7
2.3 Démarche de la modélisation . . . . . . . . . . . . . . . . . . . . . . . . . .8
3 Généralités sur la modélisation par des processus stochastiques 9 3.1 Modèle de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9 3.1.1 Concept de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9
3.1.2 Méthodes de Monte Carlo par chaîne de Markov . . . . . . . . . . .10
3.2 Marche aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .11 3.2.1 Marche aléatoire sur Zd
. . . . . . . . . . . . . . . . . . . . . . . .11
3.3 Modèles génétiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .13 3.3.1 Modèle de Hardy et Weinberg . . . . . . . . . . . . . . . . . . . . .13
3.3.2 Modèle de Wright-Ficher . . . . . . . . . . . . . . . . . . . . . . .13
3.4 Processus de croissance . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16 3.4.1 Processus de naissances et morts . . . . . . . . . . . . . . . . . . .16
3.5 modèles de migration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .18 3.5.1 Inférence bayésienne en génétique des populations . . . . . . . . .18
3.5.2 l’algorithme d’estimation . . . . . . . . . . . . . . . . . . . . . . . .19
iv

3.5.3 L’estimation des taux de migration par les méthodes
bayésiennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .21
3.6 Autre modèle d’estimation de taux de migration : Chaine de Markov Cachée : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .23
3.6.1 Les chaines de Markov cachées . . . . . . . . . . . . . . . . . . . . .23
3.6.2 L’algoritme de Baum-Welch . . . . . . . . . . . . . . . . . . . . . .24
4 Applications et Evaluation des modèles 26 4.1 Marche aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .26
4.2 Modèle de Wright-Ficher . . . . . . . . . . . . . . . . . . . . . . . . . . .27 4.2.1 hypothèses des modéles de Wright-Ficher . . . . . . . . . . . . . . .27
4.3 Simulation du processus de naissance pur: . . . . . . . . . . . . . . . . . .28
4.4 Méthodes bayésiennes pour l’estimation de taux de migration . . . . . . . .31
4.5 Estimation de taux de migration par le modèle de Markov caché . . . . .35
5 Conclusions et perspectives 37
Références 38
v

Liste des gures
1.1 Décomposition d’une paire de chromosomes . . . . . . . . . . . . . . . . .2
2.1 Base des données de l’approche bayésienne . . . . . . . . . . . . . . . . . .7
3.1 Agorithme de Métropolis-Hastings . . . . . . . . . . . . . . . . . . . . . . .21
3.2 Relations entre les états cachés et les états obsérvés du MMC . . . . . . . .24
4.1 marche aléatoire sur Z2
des visiteurs à la première itération . . . . . . . .27
4.2 La distribution du processus de naissance . . . . . . . . . . . . . . . . . . .29
4.3 Chaine de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30
4.4 Log-probabilité a postériori . . . . . . . . . . . . . . . . . . . . . . . . . .34
vi

Liste des tableaux
4.1 test de deviance pour diérents m . . . . . . . . . . . . . . . . . . . . . .33
4.2 déviance pour plusieurs MCMC . . . . . . . . . . . . . . . . . . . . . . . .34
vii

Chapitre 1
Introduction
La notion “jeu” désigne une compétition physique ou mental, sous des contraintes, dans
un but d’amusement, de gagner…Il se dière du jeu sérieu du fait que ce dernier est une
compétition mental utilisé pour des ob jectifs culturelles, éducatifs. Il s’applique dans
plusieurs domaines et disciplines, médicale, éducation. Alors l’ob jectif de ce type du jeu
est d’associer les aspects “sérieux” tels l’enseignement, l’apprentissage, la diusion scien-
tique avec les aspects ludiques et artistiques des jeux.
le professeur Michael Zyda,directeur au laboratoire USC GamePipe à Loa Angeles, donne
la dénition suivante aux jeux sérieux : ” un dé cérébral contre un ordinateur impliquant
le respect de régles spéciques, et qui s’appuie sur le devertissement pour atteindre des
objectis liés à la formation institutionnelle ou professionnel le, l’éducation, la santé, la
politique intérieure ou la communication” . Cette dénition nous impose explicitement les
diérents catégories d’utilisations des jeux sérieux. Ces catégories mettent en évidence les
diverses utilisations potentielles des jeux sérieux, qui permettent aux utilisateurs d’être
formés, réadaptés et éduqués.
Dans notre travail, nous voulons faire une application des jeux sérieux dans la domaine
biologique de la génétique des populations, nous voulons créer un jeu d’apprentissage,
qui explique la dynamique génétique des populations, en illustrant les diérentes varia-
tions qui se reproduissent génétiquement chez les individus. En eet, la génétique des
populations est une science fondamentale dans l’étude de l’évolution des populations, et
l’approche mathématiques la plus ancienne de la modélisation de cette évolution. Elle
permet d’étudier la décomposition génétique des individus de mêmes espèces au cours
du temps et à un espace bien déterminé. L’ob jectif est d’étudier la variabilité génétique,
appelé aussi diversité génétique, tout en mesurant cette dernière par la fréquence des
diérents allèles d’un même gène au cours des générations, et comprenant les causes et
les moyens de l’évolution de cette variabilité d’une génération à l’autre et la façon selon
laquelle elle sera transmise 13 et sous l’inuence des dérivées génétiques, mutations,
sélections, migrations et autres facteurs.5
1

En plus, nous avons travaillé sur la modélisation de l’écologie des populations, c.à.d la
dynamique ou la démographique des populations, tout en traitant leur dimension, leur
structure, leur évolution et leurs caractères généraux au cours du temps.
L’étude de la génétique des populations se reposent premièrement sur la compréhension
de quelque terme de base, il faut tout d’abord comprendre la structure génétique, et
la méthode de transformation des informations génétiques. Il faut comprendre la no-
tion du “gène”, la base de notre jeu, et qui nous caractérise l’information génétique de
chaque agent dans le jeu. La gure 1.1 explique la structure d’un chromosome et d’un
gène. Biologiquement, un gène est une proportion d’acide désoxyribonucléique (séquence
d’ADN), support de l`information génétique, positionné sur le même endroit d’un chro-
mosome, chaque gène détermine un caractère spécial d’un individu. Les gènes se trans-
mettent héréditairement, chacun est représenté par deux alléles l’un d’origine maternelle
et l’autre paternelle. Chaque gène peut avoir des modications dans les matérielles géné-
tiques,(ADN,ARN..), dans leurs nombres ou leur structures. Ces modications s’appele
“mutation”, qui est l’un des agents évolutifs le plus étudié dans la génétique des popula-
tions. Figure 1.1
Historiquement, la génétique des populations a été découverte par les biologistes Ficher,
Haldane et Wright entre 1920 et 1940, après la redécouverte de la loi de Mendel sur la
transmission héréditaire en 1900. Cette loi va retrouver de nouveau l’importance de la
notion “sélection naturelle” qui est inventé par la théorie darwinienne en 1882 3.
La modélisation de la génétique des populations commence implictement par Ronald 2

Ficher en 1922 6, puis avec Sewall Wright en 1931. En 1945, Wright développe le
processus de diusion, une approximation du processus discrêt qui est continue dans le
temps et l’espace. Puis entre 1955 et 1956, une solution exacte de la modéle de Wright-
Ficher a été trouvée par Motoo Kimura, qui nous donne aprés une solution approximative
du modéle en cas de deux alléles 8, avant de le généraliser au cas multi-alléliques 9.
Ainsi, la dynamique de migration entre les populations subdivisées etait décrite par
plusieurs modéles et plusieurs approches, an de voir l’évolution des fréquences alléliques
et les variations géniques. La modélisation commence avec Wright en 1931 par le modéles
en îles( Wright’s Island Model) 15 qui suppose que le taux de migration est constant
par génération et se concentre sur la fréquence allélique dans les sous-populations, le
modéles en treillis de Kimura (1953)(Stepping-stone models), et son extension le modéles
d’isolement par la distance qui lient la probabilité de migration á la distance entre les
sous-populations,encore le modéle continent-îles, inventé par Robert MacArthur et Ed-
ward Osborne Wilson en 19672, et le modéle matriciel qui sert à représenter les taux
de migrations par une matrice n’est pas nécessairement symétrique, contenant le taux de
migration d’une population i à une population j, et de trouver les fréquences alléliques à
partir de cette matrice.
L’estimation de ses taux de migration se fait par plusieurs approches, approche basée sur
la statistique F
st de Wright, autres basée sur la théorie de coalescent de Kigman ont été
développés (e.g. GENTREE, Bahlo and Griths 2000; MDIV, Nielsen and Wakeley 2001;
MIGRATE, Beerli and Felsenstein 2001), et des approches qui estime le taux de migration
à partir des variations génotypiques (e.g. Paetkau et al. 1995; IMMANC, Rannala and
Mountain 1997; STRUCTURE, Pritchard et al. 2000; BAPS, GENELAND, Guillot et
al. 2005; Corander and Marttinen 2006; TESS Franç ois et al. 2006).Wislon et Rannala
invente en 2003 une méthode d’estimation, aussi Faubet et Gaggiotti en 2008, ces deux
méthodes reposent sur des modéles bayésiens hiérarchiques et sur des simulations des
données génétiques des sous-populations suivants les techniques MCMC 4.
Ce rapport vise à proposer des modèles de dynamiques des populations, de décrire les
marches aléatoires des agents dans le jeu, de modéliser la généalogie, la naissance et les
migrations des populations entre eux.
les ob jectifs de ce stage seront alors :
1.Modéliser les variations génétiques des individus.
2.Modéliser la dynamiques des populations.
Au Chapitre 2, nous introduisons la dynamique du jeu, et les démarche de la modélisation
des données et des phénomènes, les logiciels utilisés et les matériels. Au Chapitre 3,
nous présentons les baes théoriques et des généralitées sur les processus et les propriétés
3

markoviens, et nous avons expliquer les diérents modèles utilisés pour décrire l’évolution
génétique des populations. Une application et évaluations des modèles sont proposés dans
le chapitre 4. Le cinqième chapitre présente les conclusions et perspectives à ce travail.
4

Chapitre 2
Matériels et méthodes
2.1 Contexte
Dans le cadre de cette étude, nous voulons réaliser un jeu sérieux dans un but de diusion
de la culture scientique, qui vise à présenter les concepts et mécanismes fondamentaux
de la génétique formelle, la génétique de l’évolution et la génétique des populations comme
une expérience ludique et artistique pour le grand public.
La réalisation de ce jeu est eectuée par modélisation de l’évolution génétiques des pop-
ulations, et leurs variations, an de comprendre leur comportement au cours du temps et
leur dynamique. L’espace du jeu est composé de M salons contenant des agents dont leurs informations
génétiques sont connues et représentées par des ob jets géométriques à 2 dimensions.
Le pro jet est basé sur la modélisation de la dynamique de certains agents qui portent des
informations génétiques exprimées par des formes géométriques bien déterminées. Ces
agents sont distribués dans les salons, chaque salon représente une sous-populations et
5

possède des informations génétiques propre à elle-même. Des autres agents s’appelent
des visiteurs se baladent toujours dans l’espace du jeu, et possèdent des probabilités non
nulles de visiter les salons, ces visiteurs aussi possèdent des informations génétiques, nous
supposons, à l’instant, que tous ces derniers possèdent les mêmes informations génétiques.
Dans les salons, les agents parents se reproduissent et donnent naissance à des descen-
dants, qui portent leurs informations génétiques suivant le processus de la transmission
hériditaire, et qui se redeviennent des parents à la deuxième génération. L’action de re-
production dérive des variations génétiques qui apparaissent sur les descendants. Une fois
les visiteurs entre dans un salon i, il se reproduit aussi. les agents ne sont pas xe dans
les salons, se sont des agents mobiles qui peuvent se déplacer aléatoirement dans le jeu,
ce qui résulte aussi une échange de matériels génétiques entre les individus (agents) issus
de diérentes populations(salons).
Ses diérentes actions des agents doivent être modéliser, par des modèles bien adaptés à
la génétique des populations, à la dynamique des populations et qui prennent en compte
les pressions évolutifs qui sont totalement stochastiques.
2.2 Matériels utilisés
2.2.1 Logiciels
Python
Un langage de programation multi paradigm et mutliplatformes, largement utilisé à nos
jours et il est parmis les 5 langage de programation les plus populaires dans le monde,
dévellopé par Guido van Rossum à la n des années 1980. Il est utilisé dans les domaines
de: développement Web, programmation numérique, développement de jeux, accès au
port série, etc. . . Ce langage est utilisé dans l’informatique scientique et mathé matique,
et mê me dans les pro jets d’IA. Il a é té intégré avec succès dans de nombreux logiciels,en
particuliers,les modé lisateurs 3D et les packages d’animation.
Logiciel R
C’est un logiciel de statistique qui nous permet de faire des analyses statistique qui sont
trouvées sous forme de texte dans le programme, et dessiner des graphiques, une fenêtre
spéciques pour les graphe est visualisée.
BayesAss
BayesAss est un programme disponible sur Windows et C++, sert à estimer le taux de
migration entre les sous-populations par les méthodes MCMC, les ancêtres immigrants
6

des individs, la génération des immigrant, les fréqunces alléliques, et le taux de consan-
guité. BayesAss utilise des données diploide, et des systèmes génotypiques comme SNPs,
allozymes, microsatellites.
2.2.2 Base des données
Pour débuter cette étude, nous nous sommes basés sur un espace de 7 sous-populations,
6 parmi eux ayant 10 individus(parents à t=0) qui représentent les agents de salons, nous
avons aussi dans l’espace du jeu 20 visiteurs qui se baladent tous le temps entre les salons,
tous les individus se situent à un seul locus et on a en total 14 allèles. Les résultats du
processus Markovien de marche aléatoire, du modèle de Wright cher et du processus de
naissance nous donne la base des données que l’on utilise dans l’approche bayésienne. Les
données sont représentées dans la forme suivant :
indivID popID locID allele1 allele2 Figure 2.1
La deuxième base de données utilisée est une simulation des traces des agents visiteurs,
1000 itérations de 20 visiteurs sont exécutées sur le programme python, chaque itération
exprime le lieu de chacun des visiteurs et son ID, le format des données est :
num étape; id visiteur; id place;id visiteur; id place;id visiteur; id place …
Représentation des formes alléliques
L’idée du jeu est de remplacer les êtres vivants par des ob jets géométriques 2D qu’il va
falloir encoder par des données (qui joueront le rôle des gènes). Chaque type d’allèle est
codé par un forme géométrique 2D. Pour illustrer la notion de dominance et récessif dans
7

le génotype des individus, nous pouvons faire la préférence entre les ob jets 2D, tout en
travaillant sur la convexité, en d’autre terme, un ob jet convexe domine ce qui est non
convexe.
2.3 Démarche de la modélisation
Ce rapport n’a pas pour but de prédire et de faire des tests statitiques pour des bases des
données, mais il vise à mettre en place des modèles mathématiques pour construire un
jeu génétique. La toute première étape est de développer les modèles à partir des données
simulées, et de construire la matrice de transition empirique des chaînes des markov, en
se basant sur l’hypothèse fondamentale que le comportement aléatoire des individus dans
le futur (inclus les gènes, les animaux, les insectes, pas plus les individus humaines..) ne
dépend que de l’état présent.
Dans le premier jeu de données, et pour décrire la marche aléatoire des agents visiteurs, et
la généalogie des populations, nous illustrons les chaine de Makov en temps discret par les
deux modèles, de marches aléatoires, et de Wright-cher. La croissance des populations
d’une génération à l’autre est décrite par le processus de naissance pure.
Après, pour modéliser la dynamique des migrations entre les salons, nous faisons appel
aux méthodes bayésiens et aux méthodes de MCMC. Pour ces modèles, les approches
bayésiens bayésiens hiérarchiques et l’algoritme de Métropolis-Hastings sont choisis pour
notre données. Et en n, pour le second jeu de données, les modèles de Markov ne sont
pas adaptés, nous avons recours alors aux modèles de markov cachés. Ces deux dernières
méthodes ont un but de trouver la matrice de transition emprique qui contient le taux de
migration des individus entre les salons.
8

Chapitre 3
Généralités sur la modélisation par des
processus stochastiques
Dans ce chapitre, nous présentons les diérents modèles et processus stochastiques utilisés
dans notre jeu.
3.1 Modèle de Markov
La compréhension de la biologie des populations; comme le comportement des individus
au cours du temps, la réplication d’ADN, les mutations, le déplacement diérent des in-
dividus, l’évolution des populations au cours du temps; nous montre l’importance des
modèles aléatoires, même s’il y a des caractéristiques déterministes pour la population.
Il est remarquable que le comportement aléatoire des individus dans le futur ne dépend
de son passé que par les informations de son état présent, cela nous montre le comporte-
ment markovienne de la population et qui consiste l’hypothèse fondamentale des modèles
aléatoires introduits, nous dénissons donc la notion du processus de Markov:
3.1.1 Concept de base
Dénitions et propriétés
Considérons (X
n)
n un processus stochastique en temps discret déni sur un espace de
probabilité (
;z ;P ), à valeurs dans un espace d’état ni E.
Dénition : Le processus stochastique (X
n)
n e est appelé chaîne de Markov si, pour tout
k 2 N, la loi conditionnelle de X
n+1 sachant
X
0; X
1; :::; X
kest égale à la loi conditionelle
sachant X
n, c.à.d, pour tout
x
0; x
1; : : : ; x
k2
E:
P (X
k=
x
k=X
k 1 =
x
k 1; X
k 2 =
x
k 2; : : : ; X
0=
x
0) =
P(X
k=
x
k=X
k 1 =
x
k 1)
(3.1)
9

Dénition
(Matrice de transition) : Etant donnée une chaine de Markov (X
n)
n 2 N à
valeurs dans E, La matrice Q= Q
ij dénie par
Q ij =
P(X
(n +1) =
j =X
n=
i)
est dite matrice de transition.
Une matrice de transition vérie Q
ij ;
0pour tout i, j et P
j2 E Q
ij = 1
pour tout i.
chaque ligne de cette matrice est donc une loi de probabilité sur l’espace d’état E. Il est
possible aussi qu’une matrice de transition contient des taux de transition entre les états.
Propriétés: On dit qu’un état j est accessible à partir de état j si et seulement si la probabilié de
transition de i au temps 0 à l’état j au temps n est strictement positive.
Si les deux états sont accessible entre eux, on dit que les états i et j se communiquent.
Dans un espace d’état ni, on dit qu’une chaîne de markov est dite irreductible si
tous les états communiquent.
Un état est dit récurrent si et seulement si la chaine revient P
i-presque sûrement à
l’état i en partant de lui même. Un état non récurrent est dit transient.
On dit qu’une chaine de Markov ou sa matrice est récurrent(respectivement tran-
siente) si tous les états sont récurrents(respectivement transients).
Soit (X
n)
n une chaine de Markov à valeurs dans
E. La période dún état i2 E est
léntier d(i) déni par :
d(i) = P GC D (n 1tel que Q
ii>
0)
Si d(i)=1, l’état i est dit apériodique.
Si une chaine de Markov irréductible et apériodique sur E, alors il posséde une
distribution stationnaire unique.
3.1.2 Méthodes de Monte Carlo par chaîne de Markov
Une chaine de Markov peut être utilisé comme outil d’approximation numérique et non pas
seulement un outil de modélisation et de prédiction. An de réaliser cette approximation,
les méthodes des MCMC sont développées, et diusées dans la domaine de la statistque
bayésienne, ce qui nous permettent d’échantillonner et de simuler une loi de probabilité
cible, à partir des données a priori et nous donne une chaine de Markov dont la convergence
est assurée. On pourra référer à 7 pour plus des détails.
10

3.2 Marche aléatoire
Une marche aléatoire est un processus stochastique qui sert à décrire un chemin crée
aléatoirement par un marcheur (particule,individu,..), elle décrit ses mouvements dans un
milieu donné : Z;Z 2
; Z 3
::: ,la choix du milieu dépend du probléme étudié: la dimension 1
( Z ) pour le mouvement des brins d’ADN, des déplacements sur un route, la dimension 2
( Z 2
) pour la dynamique des individus sur le sol, et la dimension 3 ( Z3
) pour un déplace-
ment spacial. Le temps est discêt.
Le modéle de la marche aléatoire est utilisé dans plusieurs domaines, il correspond au
mouvement brownien en physique, utilisé pour voir la dynamique des électrons par exem-
ples, l’adsorption d’une particule sur une surface …
Dans notre sujet, nous allons utiliser la marche aléatoire en 2-dimension(dans un plan)
pour décrire les chemins des ob jets géométriques initiales trouvés à l’extérieur des salons
à t=0, an de connaitre le salon visité par chaque ob jet.
3.2.1 Marche aléatoire sur Zd
Soit (
,F, P) un espace probabilisé. Une marche aléatoire symétrique sur Zd
, c.à.d la
particule peut déplacer une unité dans l’une de 2d directions possibles et il est également
susceptible de se déplacer dans une direction quelconque, est donnée par:
8
<
: S
0 =
a
S n =
a+ P
n
i =1 X
i (3.2)
avec (X
n)
est une suite des variables aléatoires indépendantes et identiquement distribuées
de même loi, à valeurs dans l'espace fe
1;
e
2; ::;
e
dg
tel que :
P fX
k=
e
ig
= PfX
k=
e
ig
= 1 2
d 8
k 2 f 1; :::; d g (3.3)
Pour d=2, la marche aléatoire seraà symétrique de 2 dimension, le caractère a 4 mouve-
ments équiprobables: en haut(monter), en bas(descendre) , à droite et à gauche avec des
probabilités éqales à 1 4
. En eet,l'ob jet,en 2 dimension et qui se trouve au point (a,b)
dans l'espace (Oxy) à l'instant N , peut se déplacer :
en haut , et devient(a,b+1)
en bas , donc il devient au point (a,b-1)
à droite,donc arriver au point (a+1,b)
à droite,donc arriver au point (a-1,b)
11

chaque déplacement se fait avec une probabilité
1 4
.
Dénition:
S n est une chaine de Markov en temps discret. cela signie que le passé d'une marche
aléatoire n'a aucune inuence sur leur futur.
Démonstation:
P (S
n =
j =S
n 1 =
i
n 1; ::::; S
0= 0)
= P(S
n
S
n 1 =
j (i 1)=S
n 1
S
n 2 = (
i 1) (i 2); :::; S
0= 0)
= P(X
n=
j (i 1)=X
(n 1) = (
i 1) (i 2); :::; X
0= 0))
= P
(X
n=
j (i 1); X
(n 1) = (
i 1) (i 2); :::; X
0= 0) P
(X
(n 1) = (
i 1) (i 2); :::; X
0= 0)
= P(X
n=
j (i 1))
= P(S
n =
j =S
(n 1) = (
i 1))
Algorithme de la marche aléatoire des ob jets dans le jeu
L'équation de la marche aléatoire est donc : 8
<
: S
0 =
a
S n =
a+ P
n
i =1 X
i (3.4)
On peut immaginer l'algorithme des marches des ob jets géométriques comme suit :
Préciser le nombre de visiteurs initiales à t=0.
Préciser les coordonnées initiales des visiteurs sur l'axe (Oxy).
Fixer les coordonnées de chaque salon sur l'axe (Oxy).
Les visiteurs marchent d'une façon successive.
Stocker la nouvelle position de visiteurs à chaque saut dans une liste
Soit d
j la distance euclidienne ente salon j et l'origine (0,0). Cette distance reste
xe au cours des marches des visiteurs,
et soit N
i,
i 6
= j, la distance de viteur i par rapport à l'origne (0,0):
N 2
i =
x2
i +
y2
i
Comparer chaque fois jd
j
N
ij
, pour chaque visiteur par rapport à chaque salon.
si min (jd
j
N
ij
) < ; le visiteur entre dans le salon j.
sinon le visiteur serait exclu du jeu .
12

Répéter la dernière démarche sur chaque visiteur.
3.3 Modèles génétiques
3.3.1 Modèle de Hardy et Weinberg
Hardy et Weinberg (1877-1947) a publié le premier modèle concernant la structure géno-
typique d'une population en 1908. Ce modèle permet de simplier les calculs mais n'avorte
pas les hypothéses Darwinien d'évolution et d'adaptation. Les hypothèses de modèle sont
les suivantes :
Hypothèse de panmixie : dont le principe de la reproduction est aléatoire des indi-
vidus, quelque soit le sexe de l'individu
Taille innie de la population
Fréquence xe des gènes d'une génération à l'autre, en absence de mutation, de
migration et de sélection.
A partir de ce modèle, les probabilités des diérents génotypes restent constantes au cours
du temps. Alors, un progrès dans la compréhension de la perpétuation de la diversité, qui
n'est pas permis par les modèles de Darwin et Galton, se traduit par le modèle de Hardy-
Weinberg. Mais ce modèle est adapté à une population idéale, qui ne représente pas des
variations aléatoires, et possède une fréquence allélique stable en absence de mutation, et
de sélection, et donc le problème de la sélection naturelle n'est pas intégrer!!
3.3.2 Modèle de Wright-Ficher
C'est l'un des premiers modèles utilisés dans l'étude de la génétique d'une population
diploïde de taille ni M, c.à.d. on a N=2M allèles, en absence de mutation et de sélection
neutre (sélection aléatoire de l'un de 2 types), il s'appelle modèle de "dérivé aléatoire",
dans laquelle la mécanisme de la reproduction est la source fondamentale du" hasard".
Cas de 2 allèles :
1 – Cas neutre:
Si on a deux types d'allèles A et a, le but du modèle de Wright-Ficher est de trouver la
fréquence des allèles de type A et B, à un locus donnée du gène. Avec une reproduction
aléatoire entre les individus avec un réservoir inni des gamètes (cellules sexuelles), Wright
13

et Ficher (Fisher (1922), Wright (1931) trouvent que la fréquence allélique a une distribu-
tion hypergéométrique qui converge avec les gamètes innis vers la distribution binomiale.
Soit XN
n =
nombre d' allèle de type A à la génération n, alors la matrice de transition qui
décrit le modèle est P= ( P
ij)
avec :
P ij =
P(X N
n +1 =
jjX N
n =
i) = Cj
N pj
i (1
p
i) N
j
(3.5)
avec p
i dénit comme étant la proportion d' alléles de type A á la génération t et qui vaut
i=N :
Par suite;P (X N
n +1 =
jjX N
n =
i) = Cj
N (
i=N )j
(1 i=N )N
j
(3.6)
2 – Avec mutation :
Considérons maintenant l'eet de la mutation sur l'évolution de la fréquence génétique
des alléles à un locus bien déterminé. Supposons que l'alléle de type A sera muté a un
alléle B avec une probabilité
1 , et

2 la probabilité que l'allèle B se transforme à un
allèle de type A par mutation.
BA
1
2 1-

1 1-

2 Alors la proportion de l'allèle A à la génération n+1 sera comme suit :
P(Avoir allèle A à n+1 ) =i
(1
1) + (
Ni)
2 N
(3.7)
3 – avec sélection :
C'est lorsque l'un de deux allèles possèdent une fertilité plus grande, c.à.d. avoir une
probabilitè d'existence plus grande. Soit s le paramètre de l'avantage sélectif de A :
P(Avoir allèle A à n+1 ) =i
+ si (1 +
s)i + N i=
P
i (3.8)
Si s