O humano tem aproximadamente 20.000 codificantes de , mas o proteoma humano contém estimados 80.000 a 400.000 distintas. Como isso é possível? A maior parte da resposta é o — a capacidade de um único produzir múltiplas isoformas de por inclusão ou exclusão seletiva de diferentes .
O é como ter um único arquivo de código que, dependendo de flags de compilação, produz executáveis completamente diferentes. Mesma fonte, múltiplas saídas funcionais.
Revisão do Splicing
Após a , o pré- inclui tanto quanto . O spliceossomo — um complexo de ~5 snRNAs (U1, U2, U4, U5, U6) e >150 — remove os e une os em uma reação de dois passos de transesterificação.
O spliceossomo reconhece:
- Sítio de 5': bordas |, conservadas como GU no
- Sítio de 3': bordas |, terminando em AG
- Ponto de ramificação: adenosina ~20–50 nt upstream do sítio 3'
- Tract de polipirimidina: entre o ponto de ramificação e o sítio 3', reconhecido por U2AF
O padrão (também chamado de constitutivo) sempre inclui os mesmos . O seleciona de forma variável entre alternativos.
Os Cinco Modos de Splicing Alternativo
1. Skipping de Éxon
O modo mais comum (~40% dos eventos de ). Um interno e seus flanqueadores são removidos juntos. O resultado é um menor com uma sequência de potencialmente truncada ou alterada.
Exemplo: o 7 de SMN2 é frequentemente pulado, produzindo uma truncada. Drogas como nusinersen (Spinraza) corrigem isso, tratando a atrofia muscular espinhal.
2. Sítios de Splicing 5' Alternativos
Diferentes posições de início de são usadas, alterando o limite 5' do upstream. Isso pode adicionar ou remover alguns do produto proteico.
3. Sítios de Splicing 3' Alternativos
Diferentes posições de término de são usadas, alterando o limite 3' do downstream.
4. Retenção de Íntron
Um não é removido e permanece no maduro. Muito mais comum em plantas; relativamente raro em animais, mas ocorre — muitas vezes como mecanismo de silenciamento gênico (o retido com é degradado por NMD).
5. Éxons Mutuamente Exclusivos
Dois que nunca são incluídos juntos no mesmo . A troponina T muscular tem um par de mutuamente exclusivos regulados pelo tipo de músculo (cardíaco vs. esquelético).
Reguladores do Splicing
O não é aleatório — é precisamente controlado por de ligação ao que reconhecem sequências curtas no pré- e recrutam ou antagonizam o spliceossomo:
SR (ricas em serina-arginina): geralmente ativadoras de quando ligadas a exonic (ESEs). Promovem o reconhecimento do pelo spliceossomo.
hnRNP: geralmente repressoras quando ligadas a exonic silencers (ESSs) ou intronic silencers (ISSs). Bloqueiam a ligação do spliceossomo.
A concentração relativa de SR vs. hnRNP difere entre tipos de , resultando em padrões de diferentes para os mesmos pré-mRNAs. Isso é um mecanismo fundamental de identidade de tipo celular.
Consequências Funcionais do Splicing Alternativo
Isoformas diferentes de criadas pelo podem ter:
Domínios diferentes: a inclusão/exclusão de um pode adicionar ou remover um domínio inteiro de . A tirosina quinase FGFR1 tem isoformas com diferentes domínios de ligação ao , conferindo especificidade de ao FGF diferente.
Propriedades de localização diferentes: peptídeos de sinalização ou âncoras de codificados em alternativos.
Propriedades regulatórias diferentes: a isoforma curta de VEGF (VEGF-121) é secretada; a isoforma longa (VEGF-165) está ligada à heparina e permanece perto da . Ambas as isoformas são codificadas pelo mesmo , com propriedades funcionais diferentes criadas pelo .
Atividade oposta: Bcl-x longa é antiapoptótica; Bcl-x curta (da inclusão alternativa do ) é pró-apoptótica. Drogas modificadoras de que mudam o equilíbrio Bcl-xL/Bcl-xS estão em desenvolvimento clínico para câncer.
Mutações de Splicing e Doença
que afetam o são uma das categorias de mais importantes em doenças genéticas:
no sítio de canônico: mudanças nos dinucleotídeos GT ou AG quase sempre destroem o sítio de . O resultado é tipicamente skipping de ou retenção de .
no ponto de ramificação: mais raras, mas causam skipping de .
ESE/ESS: mudam ESEs ou ESSs, alterando o reconhecimento do . Podem ser clinicamente silenciosas (sinônimas no nível de ) mas funcionalmente deletérias.
Ativação de sítio críptico: uma pode criar uma nova sequência que se parece com um sítio de , redirecionando o spliceossomo para uma posição anormal.
O SpliceAI é uma rede neural profunda que prediz o efeito de qualquer no , pontuando a criação ou destruição de sítios de com alta precisão. Está disponível web e linha de comando. Está agora integrado ao fluxo de trabalho de classificação de de laboratórios clínicos. Para qualquer próxima a uma borda - (±50 pb), verificar o escore SpliceAI é boa prática.
Terapêutica Modificadora de Splicing
O tornou-se um alvo terapêutico:
Oligonucleotídeos antisense (ASOs): pequenas moléculas de sintético que ligam a sequências específicas do pré- e bloqueiam sítios de ou sequências regulatórias. Nusinersen (atrofia muscular espinhal), mipomersen (hipercolesterolemia).
Pequenas moléculas: risdiplam (atrofia muscular espinhal) modifica o do SMN2 para incluir o 7 por ligação a uma SR.
Medindo o Splicing Alternativo
O pode detectar isoformas alternativas:
Nível de isoforma: contagem de que mapeiam para específicos. Ferramentas: Salmon, RSEM, kallisto.
Evento de nível de : para cada evento de candidato, PSI (Percent Spliced In) mede a proporção de que incluem o : PSI = de inclusão / ( de inclusão + de exclusão).
Ferramentas de análise de diferencial: rMATS, SUPPA2, DEXSeq.
Por Que o Splicing Alternativo Importa para a Bioinformática
- Mapeamento de de : que abrangem junções de precisam ser mapeadas corretamente em relação às isoformas conhecidas — STAR e HISAT2 fazem isso por padrão
- Quantificação de nível de : distinguir entre isoformas de um mesmo requer de de comprimento total ou dados de de longa
- Anotação de : em constitutivos têm impacto garantido; em cassete afetam apenas isoformas que o incluem
- Análise de proteoma: proteômica de massa pode distinguir peptídeos exclusivos de diferentes isoformas, validando a expressão da isoforma-específica
O é onde a complexidade do de 20.000 se expande para um proteoma de centenas de milhares de distintas.