O DNA na era digital

Cientistas desenvolvem nova técnica capaz de sintetizar DNA de maneira mais rápida, barata e precisa. Por meio dessa técnica, será possível construir um genoma completo de uma bactéria em apenas um dia!

Em Abril de 1953, a revista Nature publicou um pequeno artigo de apenas 1 página no qual os autores, J.D. Watson e F.H. Crick, propuseram o modelo da estrutura do DNA que veio a ser amplamente aceito pela comunidade científica. Controvérsias à parte, o modelo da dupla hélice proposto pelos autores também sugeria claramente um mecanismo de replicação do DNA, e resultou na consolidação do que conhecemos hoje como Biologia Molecular. Começou aí também a corrida para desvendar o chamado código genético, que descreve as regras pelas quais se dá a relação entre a sequência de nucleotídeos no DNA e a sequência de aminoácidos nas proteínas. Desde então, o DNA ganhou um papel central nas explicações dos processos moleculares e no entendimento da relação entre os genes, as características físicas dos organismos e a herança.

Termos como ‘armazenamento de informação’, ‘código’, ‘programa’, ‘receita’, manual de instruções’ e ‘mensagem’ inundaram a comunidade de biólogos buscando caracterizar o papel dos genes e/ou da informação genética contida nas moléculas de DNA. Essas metáforas informacionais estão largamente presentes em livros didáticos, assim como no discurso de muitos pesquisadores da área. Por exemplo, é muito comum encontrarmos a ideia de que o DNA contém o “programa para o desenvolvimento do organismo”, ou que o DNA é um “manual de instruções do funcionamento celular”. As limitações dessas metáforas para o ensino de ciências e para a própria pesquisa biológica já foram amplamente discutidas, mas elas continuam sendo utilizadas a todo vapor.

No início do século XXI, no entanto, essas metáforas foram alçadas a um novo patamar. Pela primeira vez, cientistas desenvolveram um mecanismo de armazenamento de informação não-biológica utilizando o DNA, dando início à chamada era do armazenamento de informação digital no DNA (do inglês, DNA digital data storage). Cinco anos depois, cientistas da Harvard University foram capazes de armazenar no DNA a informação digital de um texto escrito em HTML, imagens em JPEG e um programa escrito em JavaScript. Mas, para entendermos como isso é possível, precisamos entender um pouco mais sobre como a informação é armazenada nos computadores e laptops que utilizamos diariamente.

Hoje, grande parte dos computadores e aparelhos digitais utiliza um sistema binário (ou de base 2) de armazenamento de informação, no qual todas as quantidades são representadas com base em dois números: 0 e 1. Vem daí o nome bit, ou dígito binário, do inglês Binary Digit. Um agrupamento de 8 bits corresponde a 1 byte (do inglês Binary Term), unidade básica da computação. De maneira análoga, os cientistas propuseram a utilização dos blocos de construção do DNA (A, C, T e G) para armazenar qualquer tipo de informação. Assim, ao invés de 1s e 0s, utilizaríamos As, Cs, Ts e Gs. Nos últimos anos, cientistas foram capazes de estocar as mais variadas informações em longas cadeias de DNA, incluindo as 587.287 palavras de Guerra e Paz de Lev N. Tolstoi, o clássico Smoke on the Water do Deep Purple, e até um GIF de um cavalo galopando, reproduzindo as 5 imagens de Eadweard Myubridge feita em 1880. Um vídeo interessante que explica a tecnologia utilizada nesse último estudo, e também apresenta o GIF criado, pode ser visto aqui. Se você quiser saber mais sobre CRISPR, veja esse post do Darwinianas.

Mas, quais seriam as vantagens do armazenamento de informações no DNA? Várias características da molécula de DNA são atrativas para cumprir tal função. Por exemplo, o DNA é extremamente compacto. A partir da utilização do DNA como fonte de armazenamento de informação, seríamos capazes de arquivar todos os filmes já produzidos num espaço menor do que um cubo de açúcar de aproximadamente 4 gramas.  Alguns cientistas da computação acreditam que estamos chegando ao limite físico da nossa capacidade de armazenamento de informação em fitas magnéticas, que ainda é a maneira como a maior parte da informação gerada é usualmente armazenada. Portanto, a necessidade da busca de novos meios de armazenamento de informação deriva, em grande parte, da nossa capacidade de geração de uma quantidade tremenda de informação em uma velocidade sem precedentes.  Além disso, se adequadamente preservada, uma molécula de DNA é altamente estável e capaz de armazenar informação por milhares de anos.

Mas, para armazenarmos informação em moléculas de DNA, são requeridos pelo menos três processos: (1) a síntese de moléculas de DNA; (2) a leitura do DNA sintetizado através de técnicas de sequenciamento; e, (3) uma linguagem capaz de traduzir a informação armazenada em algo inteligível.

Nos últimos anos, as novas técnicas de sequenciamento de DNA em larga escala expandiram de maneira surpreendente a velocidade, assim como o tamanho dos fragmentos sequenciados. Além disso, diversas linguagens de programação já foram utilizadas para processar a informação armazenada no DNA. O gargalo dessa nova era encontra-se, principalmente, no alto custo associado à síntese in vitro de DNA, técnica também chamada de DNA printing.

Contudo, em Junho desse ano, foi publicado em Nature Biotechnology um artigo que promete solucionar esse problema. Palluk e colaboradores descreveram um novo método de síntese de DNA que reduz significativamente o custo, além de aumentar a velocidade de síntese e sua acurácia.  Você deve estar se perguntando como isso é possível. Explico. Os cientistas utilizaram uma enzima já presente em nosso corpo, chamada de desoxinucleotidiltransferase terminal (TdT), ou transferase terminal, presente em células do nosso sistema imune. Essa enzima participa da diversificação dos receptores de partículas estranhas ao corpo (os antígenos), permitindo que o organismo seja capaz de reconhecer uma molécula estranha sem a necessidade de contato prévio. Dentro de um sistema vivo, essa enzima é capaz de adicionar até 200 nucleotídeos por minuto. Mas, como nem tudo são flores, essa enzima normalmente adiciona nucleotídeos randomicamente à ponta do DNA, e portanto não é útil a cientistas que precisam de uma sequência específica de nucleotídeos.

O pulo do gato, descrito por Palluk e colaboradores, é a ligação dessa enzima a nucleotídeos específicos. A ligação enzima-nucleotídeo pode ser posteriormente rompida, liberando a enzima após a adição no novo nucleotídeo ao DNA. Assim, fragmentos de DNA podem ser produzidos passo-a-passo, com a adição de um nucleotídeo a cada ciclo e uma acurácia de cerca de 98%. Os pesquisadores foram capazes de alongar primers de DNA, pequenas fragmentos de ácido nucléico necessários para a iniciação da replicação do DNA, a uma velocidade de um nucleotídeo a cada 10-20 segundos. Dessa forma, um único conjugado é capaz de produzir uma molécula de 4.320 nucleotídeos por dia. Considerando que essa enzima é produzida em larga escala e a baixo custo, milhares dessas enzimas podem ser utilizadas paralelamente para a produção do genoma completo de uma bactéria em um único dia.

Picture1.png
Figura 1: Alongamento da molécula de DNA, nesse caso representada por um primer ou iniciador, por meio da utilização de conjugados de TdT-nucleotídeos. Após a adição de um nucleotídeo à molécula de DNA (extensão), a ligação DNA-TdT é desfeita por meio de uma reação química denominada desproteção. (Figura modificada de Palluk et al. 2018)

É claro que as implicações das possibilidades de produção de baixo custo de uma molécula de DNA são muitas e variadas. Podemos, por exemplo, utilizar essa tecnologia para produzir genes humanos relacionados à produção de proteínas importantes, ou para produzir bactérias e outros organismos com sequências específicas de DNA. Mas, além disso, essa tecnologia nos permite avançar a fronteira da tecnologia da informação, solucionando o primeiro passo na utilização do DNA como substrato para o armazenamento de informação digital: a síntese de DNA a baixo custo.

Apesar de promissoras, as técnicas de síntese de DNA em laboratório trazem consigo implicações éticas importantes. Um dos principais questionamentos refere-se ao desenvolvimento de organismos sintéticos que podem, intencionalmente ou não, ser liberados na natureza. Outra grande preocupação é o uso dessas técnicas para a construção de armas biológicas. As discussões éticas a respeito desse novo campo da Biologia Sintética, do qual as ferramentas de síntese de DNA em laboratório são parte fundamental, não podem ser ignoradas e merecem um post em separado. Essa é uma área na qual precisamos, sem dúvida, avançar cautelosamente para que tenhamos na devida conta as variadas implicações, inicialmente previstas ou não, da técnicas que desenvolvemos.

A descoberta da estrutura do DNA, há 65 anos, teve uma enorme repercussão na Biologia. Hoje, essa molécula ainda nos surpreende. Talvez seja o DNA também a molécula que vai revolucionar a era digital!

Ana Almeida

Para saber mais:

Anderson et al. 2012. Engineering and ethical perspectives in synthetic biology: Rigorous, robust and predictable designs, public engagement and a modern ethical framework are vital to the continued success of synthetic biology. EMBO Rep., 3(7): 584-590.

Church, G.M.; Gao, Y.; Kosuri, S. 2012. Next-Generation Digital Information Storage in DNA. Science, 377(6102): 1628.

Erlich, Y.; Zielinski, D. 2017. DNA Fountain enables a robust and efficient storage architecture. Science, 355(6328): 950-954.

Goldman et al. 2013. Towards practical, high-capacity, low-maintenance information storage in synthesized DNA. Nature, 494(7435). DOI:  10.1038/nature11875

Kosuri, S.; Church, G.M. 2014. Large-scale de novo DNA synthesis: technologies and applications. Nature Methods, 11: 499-507.

(Foto: Digital DNA, Mirahorian Dan)

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.