From d9d3fa6cc6c342992f95b0ff3c965baf248edf66 Mon Sep 17 00:00:00 2001 From: LeilaRenard <70601248+LeilaRenard@users.noreply.github.com> Date: Tue, 9 Nov 2021 00:59:38 +0100 Subject: modifs partie bio intro (ligne 193 j'ai pas compris pourquoi A=C et non pas A=T) --- pdf/doc.tex | 22 ++++++++++++---------- 1 file changed, 12 insertions(+), 10 deletions(-) diff --git a/pdf/doc.tex b/pdf/doc.tex index 96d5690..2229d80 100644 --- a/pdf/doc.tex +++ b/pdf/doc.tex @@ -168,23 +168,25 @@ et d'autres systèmes de fichiers, comme \erofs, sont même entièrement basés \section{Stocker des données sur ADN} -L’\ac{adn} ou Acide DésoxyriboNucléique d’un organisme, constitue ce qu’on appelle le génome. -Le génome contient l’information génétique d’un organisme. L’\ac{adn} contient donc une information. -Cette information est codée sous la forme d’une suite de \emph{nucléotides}. -Un nucléotide est une molécule organique qui est l’élément de base de l’\ac{adn}. -Il existe quatre nucléotides différents qui sont représentés par quatre lettres : \textbf{A} pour Adénine, \textbf{C} pour Cytosine, \textbf{G} pour Guanine et \textbf{T} pour Thymine. -Nous pouvons voir directement le parallèle que nous pouvons faire entre l’\ac{adn} qui est une suite de nucléotides en base~4 et une donnée informatique qui est une suite de bits en base~2. +L'information génétique des organismes vivants a pour support l'\ac{adn} (Acide DésoxyriboNucléique), et l'ensemble du matériel génétique d'un organisme constitue son génome. +L'\ac{adn} est codé sous la forme d'une suite de molécules organiques que sont les \emph{nucléotides}. +Il existe quatre nucléotides différents, représentés par quatre lettres : \textbf{A} pour Adénine, \textbf{T} pour Thymine, \textbf{G} pour Guanine, et \textbf{C} pour Cytosine. +Les nucléotides s'associent deux à deux pour former un double brin d'\ac{adn}. +Ainsi, l'Adénine est appariée à la Thymine, et la Guanine à la Cytosine. +Chaque brin d'\ac{adn} est alors complémentaire de l'autre. -Il est donc naturel de penser à utiliser l’\ac{adn} pour stocker des données -et un certain nombre de démonstrations de faisabilité du stockage sur l’\ac{adn} ont été réalisées lors des dernières années. -Les travaux publiés pour l’instant se basent essentiellement sur l’utilisation d’\emph{oligonucléotides} qui sont des courts segments d’\ac{adn}. +Il est donc possible d'établir un parallèle entre l'information génétique, codée par les 4 nucléotides formant l'\ac{adn}, en base~4, et la donnée informatique, codée par une suite de bits en base~2. +Cette analogie permet d'envisager l'utilisation de l'\ac{adn} pour stocker des données. + +Plusieurs démonstrations de faisabilité du stockage sur l’\ac{adn} ont déjà été réalisées ces dernières années. +Les travaux publiés pour l’instant se basent essentiellement sur l’utilisation d’\emph{oligonucléotides}, qui sont des courts segments d’\ac{adn} contenant quelques dizaines de nucléotides. \subsection{Encodages} Les premières démonstrations significatives sur l’utilisation de ces oligonucléotides pour stocker des données remontent à seulement 2012 avec George Church~\cite{church2012next} qui réussit à stocker 658~ko sur \numprint{54898} oligonucléotides. Dans ses travaux, Church souhaite pouvoir contrôler le taux de GC et limiter les répétitions d’un même nucléotide. Le taux de GC est la proportion de nucléotides G et C dans une séquence donnée. -Les appariements GC ont trois liaisons hydrogène tandis que les appariements AT n'en ont que deux. +Les appariements GC sont formées par trois liaisons hydrogène tandis que les appariements AT n'en ont que deux, les rendant moins stables. Un taux de GC élevé assure ainsi une meilleure stabilité, mais un taux trop élevé peut provoquer une autolyse (autodestruction) plus facilement. Il est donc préférable d’avoir un taux de GC équilibré. En ce qui concerne les longues répétitions d’un même nucléotide, elles produisent des erreurs lors du séquençage. -- cgit v1.2.3 From 028d86d2252ef9f5837e20116ff79fc1f17e97c3 Mon Sep 17 00:00:00 2001 From: LeilaRenard <70601248+LeilaRenard@users.noreply.github.com> Date: Tue, 9 Nov 2021 12:56:51 +0100 Subject: annulation "envisager" retour phrase d'avant --- pdf/doc.tex | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/pdf/doc.tex b/pdf/doc.tex index 2229d80..b54b863 100644 --- a/pdf/doc.tex +++ b/pdf/doc.tex @@ -176,7 +176,7 @@ Ainsi, l'Adénine est appariée à la Thymine, et la Guanine à la Cytosine. Chaque brin d'\ac{adn} est alors complémentaire de l'autre. Il est donc possible d'établir un parallèle entre l'information génétique, codée par les 4 nucléotides formant l'\ac{adn}, en base~4, et la donnée informatique, codée par une suite de bits en base~2. -Cette analogie permet d'envisager l'utilisation de l'\ac{adn} pour stocker des données. +Il est donc naturel de penser à utiliser l'\ac{adn} pour stocker des données. Plusieurs démonstrations de faisabilité du stockage sur l’\ac{adn} ont déjà été réalisées ces dernières années. Les travaux publiés pour l’instant se basent essentiellement sur l’utilisation d’\emph{oligonucléotides}, qui sont des courts segments d’\ac{adn} contenant quelques dizaines de nucléotides. -- cgit v1.2.3 From 7fe30b10492c2c48a6163484e69e19cae967dbe2 Mon Sep 17 00:00:00 2001 From: LeilaRenard <70601248+LeilaRenard@users.noreply.github.com> Date: Tue, 9 Nov 2021 23:56:26 +0100 Subject: micro erreur de frappe + suggestions MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit sinon : (pour éviter un nouveau pull request) - l.623 dans ton dernier commit (pas visible dans ma branche) : d'y -> s'y - l.340 quand tu dit "sans même parler de leur prix", peut être mettre une estimation ? sinon ça fait un peu vague à mon sens - l.267 limiter la casse c'est marrant mais jsp si c'est très rapport de stage haha --- pdf/doc.tex | 3 +-- 1 file changed, 1 insertion(+), 2 deletions(-) diff --git a/pdf/doc.tex b/pdf/doc.tex index b54b863..968fb91 100644 --- a/pdf/doc.tex +++ b/pdf/doc.tex @@ -176,7 +176,6 @@ Ainsi, l'Adénine est appariée à la Thymine, et la Guanine à la Cytosine. Chaque brin d'\ac{adn} est alors complémentaire de l'autre. Il est donc possible d'établir un parallèle entre l'information génétique, codée par les 4 nucléotides formant l'\ac{adn}, en base~4, et la donnée informatique, codée par une suite de bits en base~2. -Il est donc naturel de penser à utiliser l'\ac{adn} pour stocker des données. Plusieurs démonstrations de faisabilité du stockage sur l’\ac{adn} ont déjà été réalisées ces dernières années. Les travaux publiés pour l’instant se basent essentiellement sur l’utilisation d’\emph{oligonucléotides}, qui sont des courts segments d’\ac{adn} contenant quelques dizaines de nucléotides. @@ -357,7 +356,7 @@ La difficulté principale était donc de réussir à implémenter cette fonction La proposition qui suit s'inscrit dans le cadre d'une réponse à court terme au problème posé. Nous avons choisi de ne pas nous projeter trop loin dans le temps et avons donc basé l'ensemble de la réflexion sur les capacités actuelles des technologies de synthèse et de séquençage \ac{adn}. -L'objectif principal du système d'archivage de fichiers proposé est de réduire la quantité de données écrites, tout minimisant la quantité de données à lire pour récupérer les données. +L'objectif principal du système d'archivage de fichiers proposé est de réduire la quantité de données écrites, tout en minimisant la quantité de données à lire pour récupérer les données. Toutes les contraintes citées précédemment nous ont incité % TODO: j'aime bof ce mot à nous orienter plus vers un système de sauvegardes que vers un véritable système de fichiers. -- cgit v1.2.3