:: Enseignements :: Master :: M2 :: 2013-2014 :: Machine Virtuelle (et bazard autour ...) ::

Lab 2b - Stack interpreter avec des objets

Ce lab fait suite au lab2a et réutilise le code écrit lors du précédent lab, la façon de fonctionner de l'interpreteur reste donc identique, et le but de ce lab est d'implanter la creéation et gestion des objets.
Il est a noter que l'exercice 4 ne dépend que de ce qui a été fait lors des exercices 1 et 2.
La préparation du lab (votre travail personnel) est à uploader sur la plateforme de elearning: Lab 2b.

Exercice 1 - Avant propos (Préparation)

Ecrire le code permettant d'ajouter l'opération SWAP qui permute deux élements en sommet de pile, dans le Rewriter et dans le StackInterpreter.
Faire de même avec l'opération DUP_X1, qui duplique le sommet de pile et va l'insérer deux élements plus bas dans la pile.
Nous allons chercher à créer des objets, il nous faut pour cela un nouvel espace (le tas, ou heap en anglais) dans lequel il sera possible de stocker les objets les uns derrière les autres.
Le code de la méthode interpret du StackInterpreter sera donc la suivante:
```
          public Object interpret(final Function main) {
            ByteBuffer code = this.code;
            IntBuffer stack = this.stack;
            ByteBuffer heap = this.heap;
            ConstantDictionnary dictionnary = this.dictionnary;
          
```
Modifier votre main pour créer un tas de taille suffisant et modifier le code du StackInterpreter pour prendre en compte cette nouvelle zone de mémoire.
Comme on cré un nouveau type de valeur, il faut légèrement changer l'encodage de nos valeurs. En effet, il y a maintenant 3 types de valeurs. Les petits entiers, positif sur 31 bits, les index dans le constant dictionnary et les réferences vers des données dans le tas.
L'encodage suivant va être utilisé:
```
            // xxxxxxxx xxxxxxxx xxxxxxxx xxxxxxx1 -> a small integer (31 bits)
            // xxxxxxxx xxxxxxxx xxxxxxxx xxxxxx10 -> a constant index (30 bits)
            // xxxxxxxx xxxxxxxx xxxxxxxx xxxxxx00 -> reference in heap (32 bits aligned)
          
```
Il faut donc mettre à jour le fichier Values.java.
De plus, expliquer pourquoi à la question précédente, le heap est déclaré comme un ByteBuffer et pas comme un IntBuffer ?

Exercice 2 - Création d'objet, initialisation et accès aux champs

Le code Talk ci-dessous permet de créer une classe Point puis de créer une instance de celle-ci qui sera stockée dans p.

         Point = { x, y }
         p = Point(1, 2)
         p

On peut remarquer que la création d'une instance se fait en utilisant l'application de fonction (APPLY) de la même façon que lorsque l'on appel une fonction.
En effet, pour Talk, une classe est une sorte de fonction qui si on l'appel joue le rôle de constructeur et d'initialiseur de l'instance créer. De façon interne, on représentera donc une classe par une classe Klass qui hérite de Function.
Klass.java
La première ligne reviendra donc à créer dans le Rewriter un objet de la classe Klass et à utiliser LDC pour mettre la classe sur la pile.
Comme la classe est une fonction, celle-ci doit avoir un code associée qui permet de créer et d'initialiser une instance.
Par exemple, le code Talk suivant:

         Empty = {}
         Empty()

doit appeler une fonction qui crée une instance donc la classe est Empty.
Le code de cette fonction de construction sera:

         LDC $Empty$
         NEW_INSTANCE
         RET

Donc pour résumer, la syntaxe '{' et '}' permet de créer un objet de type Klass et de le mettre sur la pile. La classe Klass hérite de Function ce qui pemet d'effectuer un APPLY sur un objet de la classe Klass, le code de la fonction exécuter lors du APPLY est un code qui permet créer une instance de la classe (avec l'instruction NEW_INSTANCE).

Ecrire dans le StackInterpreter le code corrspondant à NEW_INSTANCE sachant que NEW_INSTANCE doit réserver sur le tas (heap), l'espace nécessaire pour pouvoir staocker la classe de l'instance ainsi que l'ensemble des champs de la classe.
Ecrire dans le Rewriter le code correspondant au noeud de l'AST Struct sachant que on va pour l'instant se limiter au cas où il n'existe pas de champs. Le code du constructeur est donc
```
           LDC $classe_courante$
           NEW_INSTANCE
           RET
         
```
Attention, le constructeur étant une fonction, son code doit être générer après le code du script courant (de la même façon que le code d'une lambda est générée après le code du script courant). Il vous faudra donc changer un peu la façon dont de Rewriter ré-écrit les fonctions dans le cas où la fonction est une classe.
On s'intéresse maintenant aux classes qui peuvent avoir des champs, dans ce cas, le constructeur va prendre en paramètre les valeurs des champs et il va falloir initialiser ceux-ci.
Pour initiliser un champs, on utilisera l'instruction FIELD_PUT qui pré-supposera que la pile contient une instance de la classe dont on veux changer la valeur du champ et une valeur et initialisera le champs (dont le nom est passé en argument de l'opcode FIELD_PUT dans le code).
Ecrire le code de l'instruction FIELD_PUT dans la classe StackInterpreter.
Modifier dans le Rewriter le code qui génére le constructeur d'une classe pour qu'il soit possible de créer des classes ayant des champs. Le constructeur devra être une fonction qui prend en paramètre autant de paramètres qu'il y a de champs et qui utilisera la valeur de chaque paramètre pour initilialiser chaque champs.
Par exemple, pour le code Talk suivant:
```
           Pixel = { color }
           pixel = Pixel(3)
         
```
Le code du constructeur devra être:
```
           LDC $classe_courante$
           NEW_INSTANCE
           DUP                // on charge l'instance courante
           VAR_LOAD 0         // on charge le premier paramètre
           FIELD_PUT color    // on modifie le champ color
           RET                // on renvoie l'instance
         
```
Ecrire dans le Rewriter le code correspondant au noeud de l'AST FieldAccess.
Ecrire dans l'interpreteur le code correspondant à l'instruction FIELD_GET.
Tester avec le code Talk ci dessous:
```
           v = { x }(3)
           fun = |self| [ @x ]
           fun(v)
         
```
Note: la syntax '@x' est hérité de Ruby et veut dire prendre la champ 'x' du premier paramètre de la fonction, c'est l'équivalent de self.x en Java.

Exercice 3 - Association de méthodes et appel de méthodes

Il est possible dans le langage Talk assigner une méthode à une classe en utilisant pour cela une fonction déjà existante, cette dernière devant obligatoirement avoir au moins 1 paramètre representant l'instance sur laquelle la méthode sera appelée.
Par exemple,

          Foo = { v }
          foo1 = Foo(3)
          fun = |this| [ @v ]
          foo1.bar = fun   // la function fun est lié à la classe Foo sous le nom bar
          foo1.bar()       // 3
          foo2 = Foo(4)
          foo2.bar()       // 4

Ecrire dans le Rewriter le code de l'assignation de méthode (MethodAssignment).
Ecrire dans l'interpreteur le code correspondant à l'instruction METHOD_PUT.
Comme pour un FIELD_STORE le résultat d'une foo.bar = baz doit être la valeur de baz.
Tester que le code suivant fonctionne:
```
            v = { x } (7)
            fun = |zorg| [ @x ]
            (v.zap = fun)(v)  // 7
          
```
On souhaite maintenant implanter l'appel de méthode
```
            v.zap()
          
```
En fait, celui-ci peut être décomposé en deux instructions, la première METHOD_GET consiste à récupérer la fonction dans la classe de l'instance en sommet de pile puis l'instruction APPLY qui va faire l'appel de la fonction classique.
Comme une méthode est une fonction dont le premier paramètre est l'instance sur laquelle on fait l'appel de fonction, il faut aussi dupliquer l'instance car celle-ci est utiliser et par METHOD_GET et par APPLY.
Le code d'appel de la méthode ci-dessus, doit donc être traduis par
```
            DUP               // on duplique l'instance sur la pile
            METHOD_GET zap    // on consomme une instance et on recoit une fonction
            SWAP              // on echange la fonction et l'instance sur la pile
            APPLY             // on appel la fonction avec l'instance en paramètre
          
```
Ecrire le code dans le Rewriter pour l'appel de méthode.
Attention aux arguments de l'appel de méthode !
Ecrire le code pour exécuter l'instruction METHOD_GET dans l'interpreteur.

Exercice 4 - Garbage Collection (Préparation)

On souhaite exécuter un algorithme de Mark and Compact sur le tas. Pour faire simple, algorithme se déclenchera lorsque lors d'un NEW_INSTANCE si le tas n'a pas assez de place pour stocker le nouvelle objet.
Comme l'algorithme va parcourir le tas et la pile deux fois, il est intéressant lors de l'écriture de votre programme de séparer les parcours de ce qui est fait pendant le parcours, pour ré-utiliser le code d'un parcours à plusieurs endroits.

Ecrire le test permettant de déclencher le garbage collector dans l'interpreteur en appelant une méthode doGC.
Dans le but de pouvoir marquer tous les objets vivants, ecrire dans doGC un code permettant de parcourir les valeurs sur la pile et de détecter celles qui sont des références vers le tas.
Comme on souhaite marquer tous les objets vivants, il faut réserver dans chaque objet une place, un emplacement supplémentaire, pour pouvoir marquer les objets. Comme on utilisera cette place lors de la suite de l'algorithme, on va réserver 32 bits et on marquera les objets avec la valeur -1.
Pour un accès facile, on mettra la marque à la place du premier champs de l'objet (celui à l'offset 0).
Modifier la classe Klass pour que la taille d'un objet prennent en compte cet emplacement supplémentaire.
Modifier le code pour marquer tous les objets vivants récursivement.
Attention aux cycles !
Ecrire un code de parcours du heap du bas vers le haut affichant si les objets sont mort ou vivants, c-a-d s'ils ont été marqué ou non.
Modifier le code du parcours du heap pour calculer l'adresse que devront avoir les objets (vivant) après compaction et stocker cette adresse dans l'emplacement supplémentaire.
On peut remarquer que Talk ne permet de créer que des objets non mutables, c-a-d des objets dont les champs ne changent jamais de valeur. Donc par construction, les références contenuent dans les champs pointent toujours vers des adresses plus bas dans le tas.
Il est donc possible de modifier le référence des champs d'un objet lors du parcours du tas car on connait déjà la nouvelle adresse.
Modifier le code de parcours du heap pour changer les valeurs des champs si ceux-ci sont une référence.
Une fois que chaque objet connait sa future adresse dans la tas, il est possible de ré-écrire les références sur la pile pour les faire pointer vers la nouvelle adresse.
Ajouter un code qui parcours la pile pour mettre à jour toutes les références.
Enfin, écrire le code qui parcours les objets du tas et qui bouge les objets vivants à leur nouvelle adresse.

Tester votre algo de GC :)
Vous pouvez utiliser pour cela le programme suivant:

           alloc = [ {a, b, c}(1, 2, 3) ]
           alloc()
           alloc()
           alloc()

Avec un tas de 20 octets.