Replicação: O git clone da Vida

Toda vez que uma célula se divide, ela deve primeiro produzir uma cópia exata de todo o seu genoma. Em humanos, isso significa copiar ~3 bilhões de pares de bases — fielmente, em questão de horas, sem perder nem um ciclo celular de estado de expressão gênica. A taxa de erro é de aproximadamente 1 erro por 10⁹ a 10¹⁰ pares de bases copiados.

Para colocar isso em perspectiva: se você estivesse transcrevendo um arquivo de 750 MB à mão, a taxa de erro equivalente seria de aproximadamente um erro de caractere por 1.000 cópias do arquivo completo. A célula alcança isso por meio de um sistema multicamadas de redundância, proofreading e correção de erros que ainda não conseguimos replicar completamente em sistemas de engenharia.

A Restrição Central: Replicação Semiconservativa

A replicação do DNA segue o modelo semiconservativo — cada nova dupla hélice consiste em uma fita original e uma fita recém-sintetizada. Isso significa que após uma rodada de replicação, você tem duas moléculas de DNA, cada uma com uma fita parental.

Isso foi estabelecido experimentalmente por Meselson e Stahl em 1958 usando marcação isotópica — um dos experimentos mais elegantes da biologia molecular. O mecanismo semiconservativo emerge naturalmente da estrutura do DNA: como as duas fitas são complementares, cada fita é um molde completo para a síntese de sua parceira.

Origens de Replicação: Checkouts Distribuídos

A replicação não começa em uma extremidade e prossegue linearmente até a outra. Se fizesse isso, copiar um único cromossomo humano levaria semanas. Em vez disso, a replicação se inicia em centenas a milhares de sítios específicos chamados origens de replicação, distribuídos por todo o genoma.

Em E. coli, há uma única origem (oriC). Eucariontes — incluindo humanos — têm ~30.000 a 50.000 origens. A replicação prossegue bidirecionalmente a partir de cada origem, criando bolhas de replicação que se expandem até encontrar bolhas adjacentes. Isso paraleliza o processo em todo o genoma.

{ }Origens como operações clone distribuídas

Pense em cada origem de replicação como iniciando um git clone --depth=1 em uma seção diferente do repositório simultaneamente. Em vez de um processo copiando 3 bilhões de caracteres de ponta a ponta, milhares de processos cada um copia um segmento curto em paralelo. Os resultados se fundem quando as forquilhas de replicação adjacentes se encontram. O tempo total é determinado pela bolha de replicação mais lenta, não pelo tamanho total do genoma.

As origens em eucariontes são reconhecidas por um complexo proteico chamado Complexo de Reconhecimento de Origem (ORC), que recruta fatores adicionais para carregar a helicase. Esse carregamento acontece durante a fase G1. O disparo real das origens (quando a síntese começa) é controlado por quinases do ciclo celular que garantem que as origens não disparem duas vezes no mesmo ciclo celular.

A Forquilha de Replicação: Uma Linha de Montagem

Em cada origem ativa, duas forquilhas de replicação se movem em direções opostas. Em cada forquilha, um conjunto coordenado de enzimas copia ambas as fitas simultaneamente:

Helicase: Desfazendo a Dupla Hélice

A DNA helicase (complexo MCM2-7 em eucariontes) quebra as ligações de hidrogênio entre pares de bases e desenrola a dupla hélice à frente da forquilha. Ela se move a ~500–1000 pb/segundo. À medida que se desenrola, cria supercoiling positivo à frente — como torcer uma corda e ver a tensão se acumular. As topoisomerases aliviam essa tensão cortando e rejuntando transitorialmente as fitas de DNA.

Primase: Escrevendo o Endereço de Início

Aqui está uma restrição fundamental: a DNA polimerase não pode iniciar a síntese do zero. Ela só pode estender uma fita existente. Precisa de um primer — um curto trecho de sequência complementar para estender a partir.

A primase (uma RNA polimerase) sintetiza curtos primers de RNA (8–12 nucleotídeos) no início de cada novo segmento de DNA. Esses primers são depois removidos e substituídos por DNA.

Essa restrição tem uma consequência importante: uma fita é sintetizada continuamente (a fita líder, que corre 5'→3' na direção em que a forquilha se move), enquanto a outra deve ser sintetizada em fragmentos curtos direcionados para trás (a fita retardada).

DNA Polimerase: O Motor Central de Cópia

A DNA polimerase III (em bactérias) / DNA polimerase δ/ε (em eucariontes) é a enzima de síntese primária. Ela:

Lê a fita molde 3'→5'
Sintetiza a nova fita 5'→3'
Adiciona ~1.000 nucleotídeos por segundo (bactérias) ou ~50–100 nt/s (eucariontes)
Tem exonuclease de proofreading 3'→5' embutida — verifica cada nucleotídeo recém-adicionado e remove incompatibilidades

A atividade de proofreading reduz a taxa de erro bruta de ~1/10⁵ para ~1/10⁷. Após a replicação, uma segunda rodada de reparo de incompatibilidade (MMR) reduz ainda mais os erros para a taxa final de ~1/10⁹.

Fragmentos de Okazaki: O Problema da Fita Retardada

A fita retardada não pode ser sintetizada como uma fita contínua porque a polimerase só pode se mover 5'→3', o que é se afastar da forquilha nessa fita. Em vez disso, a síntese ocorre em curtas explosões chamadas fragmentos de Okazaki (100–200 pb em eucariontes, 1.000–2.000 pb em bactérias).

Cada fragmento de Okazaki requer:

Um novo primer de RNA
Extensão pela DNA polimerase
Remoção do primer de RNA
Preenchimento da lacuna com DNA
Ligação para unir o fragmento ao anterior

A enzima que une fragmentos é a DNA ligase, que sela a fenda entre fragmentos de Okazaki adjacentes.

Problema da Replicação das Extremidades e Telômeros

Aqui está uma consequência inevitável do mecanismo da fita retardada: a própria extremidade de um cromossomo linear não pode ser completamente copiada. O último fragmento de Okazaki requer um primer na extremidade 3' do molde, mas quando esse primer é removido, não há DNA upstream para preencher a lacuna. O cromossomo se encurta ~50–200 pb a cada divisão celular.

Telômeros — as sequências repetitivas TTAGGG nas extremidades dos cromossomos — agem como buffers sacrificiais. Eles se encurtam a cada divisão sem ameaçar a sequência gênica real. Quando os telômeros ficam muito curtos, a célula entra em senescência replicativa (para de se dividir) ou apoptose.

Telomerase é uma transcriptase reversa que estende os telômeros sintetizando novas repetições. Ela carrega seu próprio molde de RNA. A telomerase está ativa em células germinativas, células-tronco e ~90% das células cancerosas — o câncer mantém o comprimento dos telômeros para permitir proliferação indefinida.

Proofreading e Reparo: Múltiplas Camadas de Correção de Erros

A taxa de erro final de ~1/10⁹ vem de múltiplas camadas independentes:

Mecanismo	Redução de erro	Quando age
Fidelidade de seleção de base	10⁵×	Durante a síntese
Exonuclease de proofreading 3'→5'	10²×	Imediatamente após cada adição de base
Reparo de incompatibilidade (MMR)	10²–10³×	Após a conclusão da replicação

O reparo de incompatibilidade (MMR) é executado por proteínas MutS/MutL (MSH2/MLH1 em humanos) que varrem o DNA recém-sintetizado, detectam incompatibilidades, excisam uma região ao redor delas e ressintetizam corretamente. Mutações herdadas em genes MMR causam a Síndrome de Lynch — uma das predisposições hereditárias ao câncer mais comuns, aumentando marcadamente o risco de câncer colorretal, endometrial e outros.

★Instabilidade de microssatélites (MSI)

A Síndrome de Lynch e tumores com defeitos de MMR mostram instabilidade de microssatélites (MSI) — mudanças no comprimento de motivos de sequência curtos repetitivos que são normalmente mantidos pelo MMR. O status MSI-alto é agora um biomarcador para resposta à imunoterapia: tumores microsatelitalmente instáveis acumulam muitas mutações, gerando neoantígenos que ativam respostas imunes contra o tumor.

Replicação e Câncer

Erros de replicação que escapam de todos os mecanismos de reparo tornam-se mutações permanentes. A maioria é neutra ou deletéria. Uma pequena fração é oncogênica — ativando genes promotores de crescimento ou inativando supressores tumorais.

A taxa de mutação varia pelo genoma:

Heterocromatina (regiões densamente empacotadas, de replicação tardia) tende a ter taxas de mutação mais altas
Regiões transcricionalmente ativas são frequentemente melhor mantidas (reparo acoplado à transcrição)
Assinaturas mutacionais — padrões característicos de mutações — refletem diferentes tipos de erro de replicação, exposições a mutágenos e deficiências de reparo. O catálogo COSMIC de Assinaturas Mutacionais (v3.4+) contém >80 assinaturas validadas usadas na análise de genomas de câncer.

Fase S e a Conexão com o Ciclo Celular

A replicação ocorre exclusivamente durante a fase S do ciclo celular. A entrada na fase S é controlada pelos complexos CDK2/ciclina E; a progressão requer CDK2/ciclina A. Essas quinases fosforilam e assim ativam os fatores de replicação.

Se o DNA está danificado, o checkpoint da fase S interrompe a replicação até que o dano seja reparado. O sensor chave é a quinase ATR, que detecta DNA de fita simples exposto em forquilhas paradas e ativa Chk1, que bloqueia o disparo de origens e a progressão das forquilhas.

A entrada aberrante na fase S — replicar o DNA sem licenciamento adequado e controle de checkpoint — é um dos eventos precoces na oncogênese. O estresse de replicação induzido por oncogene é um mecanismo chave que impulsiona a instabilidade genômica no câncer precoce.