Genômica da Biodiversidade Brasileira
Banco genômico brasileiro torna o DNA da biodiversidade mais acessível
Batizado como GenRefBR, o repositório é estratégico para a soberania da ciência nacional. Dados podem abrir caminhos para ações mais eficazes de conservação e de desenvolvimento da bioeconomia.
Por que contar esta história é importante?
Transformar em dados a “sopa de letrinhas” que forma o DNA das espécies passa por enormes desafios, desde a coleta de amostras até o processamento em supercomputadores. Essa história detalha as etapas e também como funciona o Banco de Referências Genômicas de Espécies Brasileiras (GenRefBR).
Parcerias e colaborações
O projeto Genômica da Biodiversidade Brasileira (GBB) é liderado pelo Instituto Tecnológico Vale e pelo Instituto Chico Mendes de Conservação da Biodiversidade. Participam mais de 300 pesquisadores de instituições nacionais e internacionais, como a Universidade de São Paulo, a Universidade Federal do Pará e a Universidade de Oxford, do Reino Unido, além de centenas de organizações, como o Ibama e a Fiocruz.
Glossário Mata N'Ativa
Trabalhamos pelo acesso ao conhecimento científico. Não deixe de explorar o glossário ao final da história para ter uma maior clareza sobre cada um dos conceitos abordados no texto!
Acessar Glossário
Formado por átomos de carbono, hidrogênio, oxigênio, nitrogênio e fósforo, o DNA molécula presente no núcleo de cada célula onde estão as informações genéticas de um organismo; é considerado a essência da hereditariedade compostos orgânicos que contêm átomos de nitrogênio e fazem parte da estrutura do DNA e do RNA. Elas são essenciais para o armazenamento e transmissão da informação genéticaDNA
bases nitrogenadas
Para pesquisadores, transformar essa “sopa de letrinhas orgânicas”, ou os nucleotídeos do DNA são as unidades básicas da molécula de DNA. Cada nucleotídeo é formado por três partes: uma base nitrogenada (A, T, C, G), um açúcar e um grupo fosfatonucleotídeos
Até aqui, porém, cientistas brasileiros precisavam recorrer a bancos genômicos dos Estados Unidos, Japão e Europa, que são pouco “amigáveis” a estrangeiros. Sequer é possível identificar ali quais espécies são brasileiras. “A gente começou a procurar e não tinha como fazer, porque muitas dessas bases têm o dado, têm o nome da espécie, mas não perguntam a origem daquele indivíduo”, explica Gisele Nunes, pesquisadora de genômica ambiental na área de bioinformática no Instituto Tecnológico Vale (ITV).
Diante de tantas dificuldades, Nunes começou a pensar em formas de facilitar o acesso a dados genômicos de espécies brasileiras. A ideia se materializou com o projeto Genômica da Biodiversidade Brasileira (GBB), parceria público-privada entre o ITV e o Instituto Chico Mendes de Conservação da Biodiversidade (ICMBio). Com investimento previsto de R$ 110 milhões até 2027, o consórcio reúne centenas de pesquisadores para estudar a genética de mais de 600 espécies da fauna e da flora de todos os biomas do país. As informações são compartilhadas gratuitamente por meio do Banco de Referências Genômicas de Espécies Brasileiras (GenRefBR).
O banco já reúne dados de vertebrados produzidos no âmbito do GBB e também informações de plataformas estrangeiras, mas agora com a acessibilidade que faltava. As espécies inseridas são selecionadas a partir do Sistema de Avaliação do Risco de Extinção da Biodiversidade (SALVE), plataforma gerida pelo ICMBio. “Se quiser saber de aves, anfíbios, répteis, quantos têm genoma? Inclusive, a gente tem seis biomas. Se eu quiser saber quantas espécies de aves são registradas na Amazônia, eu consigo. Quantas dessas têm algum nível de ameaça?”, detalha Nunes.
Os dados não são armazenados diretamente no GenRefBR. Até mesmo os genomas produzidos pelo GBB são publicados primeiro no GenBank, base de dados pública do Centro Nacional de Informações sobre Biotecnologia dos Estados Unidos, o NCBI, na sigla em inglês: o maior banco genômico do mundo. O GenRefBR apenas os torna acessíveis depois de publicados pelo GenBank. A partir de 2026, o banco brasileiro começa a receber dados de plantas e, depois, de invertebrados.
Dados genéticos e genômicos ajudam a responder perguntas fundamentais sobre a biodiversidade. A linhagem Xenarthra, por exemplo, surgiu na América do Sul durante a transição Cretáceo-Paleógeno, há cerca de 66 milhões de anos, período marcado pela extinção em massa dos dinossauros e pela explosão adaptativa dos mamíferos.
As ramificações da árvore filogenética mostram hipóteses sobre como as espécies estão relacionadas. Muitas vezes elas indicam possíveis eventos de especiação, quando uma linhagem ancestral deu origem a duas ou mais.
O primeiro evento de especiação originou as ordens Pilosa (preguiças e tamanduás) e Cingulata (tatus), estabelecendo as principais linhagens dos xenartros.
A diversificação das principais famílias dentro das ordens Pilosa e Cingulata ocorreu entre o Eoceno e o Oligoceno, durante o período Paleógeno, que marca o início da Era Cenozoica.
A ordem Cingulata (tatus) passou por uma importante diferenciação há cerca de 36 milhões de anos, durante o Eoceno tardio. Já as subordens Folivora (preguiças) e Vermilingua (tamanduás), dentro da ordem Pilosa, divergiram entre 28 e 44 milhões de anos atrás, entre o Eoceno e o Oligoceno.
A partir do Mioceno (entre 23 e 5 milhões de anos atrás), várias linhagens de xenartros apresentaram aumento significativo de tamanho, resultando em formas gigantescas.
Atualmente são reconhecidas 38 espécies vivas de xenartros, a maioria já presente no Pleistoceno. No entanto, a perda de habitats, atropelamentos, incêndios florestais e mudanças climáticas colocam essas espécies em risco, ameaçando a continuidade de uma história evolutiva que começou há milhões de anos.
Do campo ao banco, de moléculas a dados
O GBB reúne pesquisadores de mais de 100 instituições brasileiras e do exterior – como universidades, organizações não governamentais e museus. Com o intermédio dos Centros Nacionais de Pesquisa e Conservação do ICMBio, foram elencadas as espécies prioritárias em cada uma das abordagens: conservação; exóticas invasoras são aquelas que se encontram fora de sua área de distribuição natural; quando se proliferam descontroladamente, ameaçam a biodiversidade e os serviços ecossistêmicosespécies exóticas invasoras
Primeiro, a equipe define a abordagem estratégica para cada espécie. Serão produzidos pelo menos 80 genomas de referência sequência de DNA que serve como modelo ou padrão para representar o genoma completo de uma espécie, exemplificando sua organização genética; é usado para comparações e análises das variações genéticas entre indivíduos, populações ou espécies conjunto de variações genéticas dentro de uma população de organismos; o estudo do genoma populacional examina como o DNA varia entre indivíduos de uma mesma espécie em diferentes locais geográficos, períodos de tempo ou condições ambientais, permitindo o cálculo de importantes parâmetros indicadores do risco de extinção das espécies conhecidos em inglês como DNA barcodes, esses trechos curtos e padronizados do DNA funcionam como identificadores únicos de espécies; assim como um código de barras em produtos identifica rapidamente um item no supermercado, o DNA barcode identifica uma espécie com agilidade, comparando seu trecho de DNA com um banco de dadosgenoma de referência
genoma populacional
códigos de barras de DNA
A busca por amostras pode ocorrer em campo ou a partir de materiais que estavam armazenados nas instituições, à espera de uma oportunidade para serem sequenciados. Nos dois casos, a amostra é enviada ao laboratório de genômica trecho do código genético, que, quando lido ou ativado, gera algum efeito na célula, como a fabricação de uma proteína específicagene
A extração do DNA é feita por meio de um processo químico. Se passar pelo controle de qualidade, a amostra segue para a etapa de preparação da biblioteca genômica conjunto padronizado de fragmentos do DNA de um organismo preparados para o sequenciamento e contendo tags (etiquetas moleculares) anexadas às extremidades, que permitem a orientação do sequenciamento e a identificação da informação genéticabiblioteca genômica
Após o sequenciamento, tem início então a etapa da bioinformática, que, a partir do enorme arquivo de texto, remonta o quebra-cabeça contendo bilhões de letras que representam as bases, para a identificação dos diferentes genes. É um processo longo, de montagem e curadoria, que exige vultoso recurso computacional, além de profissionais com expertise em informática, porque é quando moléculas se transformam em dados. “Os bioinformatas vão pegar esse arquivo de texto e começar a separar: olha isso aqui é o gene X, isso aqui faz parte do cromossomo 1, isso faz parte do cromossomo 2”, diz Aleixo.
Por último, os bioinformatas trabalham na anotação para responder: cada gene trecho do código genético, que, quando lido ou ativado, gera algum efeito na célula, como a fabricação de uma proteína específica molécula essencial para a vida, formada por uma cadeia de aminoácidos ligados em sequência. É responsável por quase todas as funções do organismogene
proteína
O processo começa com a coleta de material biológico, como plantas ou animais, e de amostras ambientais, como água e solo. No caso de animais, pode ser necessário aplicar sedação, seguindo protocolos éticos, para garantir a segurança do organismo e a integridade da amostra.
Cada célula contida nesse material carrega o DNA completo do organismo.
O DNA é a chave para todas as próximas etapas.
No laboratório, as células do material coletado são quebradas usando reagentes e enzimas para liberar o DNA.
Nessa etapa, proteínas e outros contaminantes são removidos, deixando o DNA limpo e puro.
Agora, o DNA está pronto para a análise.
A etapa seguinte é a preparação da biblioteca de DNA.
O DNA extraído é fragmentado em pedaços menores.
Cada fragmento recebe sequências sintéticas chamadas adaptadores, que servem de pontos de ancoragem para as máquinas de sequenciamento.
Esse passo é essencial para permitir que milhões de fragmentos sejam lidos ao mesmo tempo, maximizando velocidade e precisão.
Na fase do sequenciamento, os fragmentos preparados são inseridos em máquinas que leem a ordem das bases nitrogenadas (A, T, C, G) em cada pedaço.
Equipamentos de short reads (leituras curtas) fazem leituras rápidas de pequenos trechos.
Os de long reads (leituras longas) conseguem decifrar sequências muito maiores.
As máquinas sequenciadoras geram arquivos de texto no formato FASTQ, que podem chegar a 1 terabyte de dados.
Aqueles trechos de DNA que tinham sido separados por adaptadores foram digitalizados. Todo o DNA está codificado em quatro letras, que representam as quatro bases nitrogenadas: Adenina (A), Citosina (C), Guanina (G) e Timina (T).
Mas como o DNA foi fragmentado para poder ser lido pelas máquinas sequenciadoras, ele precisa ser remontado.
Softwares de bioinformática entram em ação para processar todos esses dados e alinhar os fragmentos que se sobrepõem.
O processo de montagem do genoma é como montar um gigantesco quebra-cabeça.
Regiões repetidas e sequências semelhantes representam o maior desafio.
Depois de reconstruído, o genoma é analisado em busca de genes, mutações e padrões específicos.
Ferramentas computacionais identificam variações genéticas, delimitam espécies, estabelecem parentescos e até revelam sinais de adaptação evolutiva, incluindo genes relacionados à resistência a doenças.
Os genomas sequenciados no âmbito do GBB são disponibilizados no GenBank, o maior banco genômico do mundo, e no GenRefBR, um banco de dados que compila informações das espécies brasileiras, atualmente com foco em vertebrados. Os dados estão disponíveis gratuitamente para todas as pessoas.
Armazenamento e processamento
Todas essas etapas exigem um elevado investimento financeiro. A infraestrutura destinada para High Performance Computing (HPC), os chamados supercomputadores, e outros equipamentos para processamento de dados genômicos teve um custo aproximado de R$ 11,4 milhões.
Há ainda o investimento em profissionais especializados. No ITV, atuam 24 bioinformatas. Muitos são biólogos que deixaram as bancadas e passaram a se dedicar à bioinformática. Afinal, não basta produzir dados. É necessário ter conhecimento para analisá-los e interpretá-los.
O equipamento a ser utilizado para o sequenciamento do DNA depende do objetivo. Os sequenciadores PacBio e Nanopore são destinados a leituras longas (long reads o termo, que em português significa leituras longas, refere-se a fragmentos longos de DNA sequenciados de uma só vez, geralmente com mais de 10 mil pares de bases (10 kb), podendo ultrapassar 100 kb storyBancoGenomico.glossary.items.14.text técnica que permite a identificação simultânea de múltiplas espécies a partir do sequenciamento de DNA de uma única amostra em massa contendo organismos inteiros ou de uma única amostra ambiental, como de solo ou água o termo significa leituras curtas em português e define pequenos fragmentos de DNA sequenciados de uma só vez, geralmente com comprimento entre 50 e 300 pares de bases (pb)storyBancoGenomico.glossary.items.12.title
storyBancoGenomico.glossary.items.14.title
metabarcoding
storyBancoGenomico.glossary.items.13.title
E uma curiosidade: assim como o armazenamento de dados é medido em bits, bytes, megabytes etc., as bases do DNA também contam com uma unidade de medida: os pares de base (pb). “Quando a gente obtém um genoma de 3 gigabases, esse arquivo vai ter em torno de 3 gigabytes unidade de medida usada na computação para expressar a quantidade de dados ou a capacidade de armazenamento. Um gigabyte (GB) corresponde a 1.024 megabytes (MB)storyBancoGenomico.glossary.items.16.title
A estimativa é que apenas para genomas de referência sejam utilizados de 120 a 250 terabytes. A capacidade de armazenamento era de um petabyte para todo o ITV, mas apenas o GBB já consumiu 400 terabytes. Um novo sistema de armazenamento de um petabyte foi adquirido. O preço? R$ 3 milhões.
No fim de 2024, teve início um processo de migração da montagem de genomas para processamento em nuvem. Para montar os genomas de referência, por exemplo, o custo estimado está em cerca de R$ 30 mil por mês.
Todo o investimento deve representar um salto para a ciência nacional. “Gerando informação genética para esse monte de espécies, a gente está gerando recursos para diferentes tipos de pesquisa. Imagina: eu só montei o genoma, mas aquele outro grupo [de cientistas] vai trabalhar com o melhoramento genético conjunto de técnicas usadas para selecionar e desenvolver plantas ou animais com características desejadas, como maior produtividade, resistência a doenças, melhor qualidade ou adaptação ao ambientemelhoramento genético
Além do Banco de Referências Genômicas de Espécies Brasileiras (GenRefBR) ser público e gratuito, a equipe desenvolveu softwares e pipelines – sequências de processos conectados –, que estão abertos para quem quiser usar (https://genrefbr.itv.org/#tools). “Em vez de você rodar software por software, o pipeline pode ser instalado em qualquer máquina e, com apenas uma linha de comando, você consegue gerar todos os processos automaticamente”, resume Nunes.
“Se quiser saber de aves, anfíbios, répteis, quantos têm genoma? Se eu quiser saber quantas espécies de aves são registradas na Amazônia, eu consigo. Quantas dessas têm algum nível de ameaça?”
Gisele Nunes, pesquisadora de genômica ambiental na área de bioinformática no ITV
Das gavetas para o sequenciador
As cifras, os equipamentos e o armazenamento necessários explicam por que há centenas de estudos paralisados. Muitas das instituições participantes do GBB já tinham grandes coleções de amostras das espécies, que são úteis para análises de populações ou de códigos de barras. É o caso do soldadinho-do-araripe (Antilophia bokermanni), um pequeno pássaro do tamanho de uma mão, descrito pela ciência em 1997. A espécie é considerada de interesse para a conservação, já que está “criticamente em perigo de extinção”, de acordo com a Lista Nacional (Portaria MMA nº 444/2014).
Endêmico da Serra do Araripe, no sul do Ceará, estima-se que existam menos de mil indivíduos na natureza. “A distribuição se dá em uma única linha na encosta da serra. A ave não ocorre lá embaixo, na base, nem no alto da serra – só na encosta. E é uma área onde já existe uma fragmentação das matas”, observa Péricles Sena, pesquisador que viu um soldadinho-do-araripe pela primeira vez em 1998, quando ainda era aluno de graduação na Universidade Federal do Ceará (UFCE).
Sena foi um dos participantes de uma expedição organizada especialmente para conhecer a espécie de perto. “Quando retiramos o soldadinho da rede, foi como se eu tivesse um fantasma nas mãos.”
Hoje o pesquisador é especialista em genética e biologia molecular. O laboratório onde atua, ligado à Universidade Federal do Pará (UFPA), guarda um conjunto com cerca de 150 amostras do soldadinho-do-araripe, inclusive o holótipo exemplar utilizado para descrever uma nova espécie; uma referência científicaholótipo
Ao longo da sua carreira, Sena acompanhou a evolução das tecnologias. Para se ter uma ideia, as primeiras pesquisas com marcadores genéticos clássicos nem sequer eram capazes de diferenciar o soldadinho-do-araripe da sua ‘espécie-irmã’ (Antilophia galeata), o soldadinho encontrado no Cerrado.
Em um artigo publicado em 2022 na revista Ornithological Applications, Sena e outros pesquisadores analisaram a baixa diversidade e a diminuição da população da ave. E uma das conclusões foi categórica: a necessidade de fazer estudos genômicos para pensar em estratégias de conservação. “A gente não queria olhar apenas um pedaço, mas todo o genoma da espécie”, conta o cientista.
Agora o futuro chegou: por meio do Genômica da Biodiversidade Brasileira, o soldadinho-do-araripe finalmente terá um genoma de referência e um estudo de genômica populacional para chamar de seu. Além disso, por meio do GenRefBR, outros pesquisadores também poderão ter acesso facilitado às informações genéticas dessa e de outras espécies.

As primeiras pesquisas com marcadores genéticos clássicos nem sequer eram capazes de diferenciar o soldadinho-do-araripe, na foto, da sua ‘espécie-irmã’ (Antilophia galeata), o soldadinho encontrado no Cerrado. Agora, o sequenciamento genômico da espécie vai permitir definir estratégias mais precisas de conservação. FOTO: Rick Elis Simpson
Os desafios do campo
Não é qualquer amostra que permite fazer um genoma de referência. O sequenciamento técnica que utiliza processos bioquímicos para 'ler' o DNA de um ser vivosequenciamento genético
Quando a espécie é encontrada apenas em locais de difícil acesso, o trabalho ganha complexidade e os custos se elevam. Santana recorda-se de uma expedição desafiadora: Abrolhos, arquipélago 70 quilômetros distante da costa sul da Bahia. “Foi uma novela”, diz.
O objetivo era coletar amostras de uma anêmona gigante (Condylactis gigantea) ameaçada de extinção para gerar o genoma de referência da espécie em um projeto de interesse do Centro Nacional de Pesquisa e Conservação da Biodiversidade Marinha do Nordeste (CEPENE). Em tese, essas amostras deveriam ser mantidas em tanque de nitrogênio líquido, cujo transporte via avião é de difícil autorização. Na realidade, nem sequer foi possível encontrar o nitrogênio líquido em Salvador para ser levado até Porto Seguro, de onde sairiam as equipes de coleta. A alternativa foi levar dois isopores com 40 quilos de gelo seco de uma fábrica em São Paulo, um material que evapora muito rápido. Quando o barco voltou ao continente, restava pouco gelo – no limite do tempo para entregar o material à transportadora especializada na logística de material biológico em cadeia fria.
Emanuel Neuhaus, bolsista de pós-doutorado do GBB que participou da expedição, conta que a equipe aproveitou a oportunidade para testar quatro diferentes meios de preservação de amostras que não dependem tanto da cadeia fria. Os resultados ainda não ficaram prontos. “É um projeto-piloto para melhorar a logística para as saídas de campo que teremos mais à frente”, afirma.
O estudo genômico pode revelar o fluxo gênico entre populações do tatu-bola-do-nordeste e identificar possíveis isolamentos, orientando ações como criação de corredores ecológicos, reestoques, conservação ex situ e novas áreas protegidas. CRÉDITO: Felipe Peters
Genética como ferramenta de conservação
Quem também espera ansioso pelas respostas e novos caminhos para a conservação que o GBB vai trazer é o tatu-bola-do-nordeste, que inspirou o Fuleco. Lembra dele? O mascote da Copa do Mundo de 2014 no Brasil foi uma sugestão do Instituto Tamanduá, que integra a rede de colaboradores do GBB. Mais de dez anos depois, a espécie continua ameaçada de extinção, com populações dispersas pela Caatinga.
O estudo genômico pode mudar essa realidade. Com os resultados a partir de amostras coletadas em distintos locais, vai ser possível entender o fluxo gênico movimento de genes entre populações diferentes de uma mesma espécie; acontece quando indivíduos migram, se reproduzem em outro grupo e passam seus genes adiante, misturando características genéticas reintrodução de indivíduos de uma espécie em uma área onde sua população foi reduzida ou extinta para recuperar o equilíbrio ecológico ou restaurar a biodiversidadefluxo gênico
reestoque
A relevância desses esforços ganha outra dimensão quando o tatu-bola-do-nordeste é visto como uma espécie guarda-chuva da Caatinga: protege a biodiversidade do bioma e beneficia outros animais menos carismáticos. “Um mamífero bonitinho como o tatu é um chamariz para que a sociedade se sensibilize para preservar”, explica Flávia Miranda, CEO do instituto. “Muito mais fácil do que preservar uma cobra ou uma minhoca da Caatinga.”
Os esforços do GBB estão garantidos até 2027. Depois disso, ainda não há respostas sobre a continuidade dos estudos e nem do Banco de Referências Genômicas de Espécies Brasileiras. Apenas o GenRefBR tem um custo anual de manutenção estimado em R$ 144 mil. “A ideia é que as atualizações sejam automáticas, mas sempre tem que ter alguém por trás. Ou a gente vai ter que terceirizar isso ou, quem sabe, não vira algo do governo? Que seja algo mais amplo, que saia um pouco do ITV e talvez vire algo nacional”, sugere Gisele Nunes.
Na ciência é assim: quando respostas são reveladas, surgem novas perguntas. Que bom! O mais importante é que, assim como no GBB, o Brasil continue protagonista nessa história — superando os desafios que vão desde a coleta de amostras até o processamento e disponibilização dos dados, desde os estudos genômicos até a implementação de políticas públicas eficazes. Que venham os próximos capítulos!
As ilustrações desta página são recursos artísticos visuais para fins didáticos e não representam ilustrações científicas.
OUTRAS ESPÉCIES
GLOSSÁRIO
DNA
molécula presente no núcleo de cada célula onde estão as informações genéticas de um organismo; é considerado a essência da hereditariedade
bases nitrogenadas
compostos orgânicos que contêm átomos de nitrogênio e fazem parte da estrutura do DNA e do RNA. Elas são essenciais para o armazenamento e transmissão da informação genética
nucleotídeos
são as unidades básicas da molécula de DNA. Cada nucleotídeo é formado por três partes: uma base nitrogenada (A, T, C, G), um açúcar e um grupo fosfato
espécies exóticas invasoras
são aquelas que se encontram fora de sua área de distribuição natural; quando se proliferam descontroladamente, ameaçam a biodiversidade e os serviços ecossistêmicos
genoma de referência
sequência de DNA que serve como modelo ou padrão para representar o genoma completo de uma espécie, exemplificando sua organização genética; é usado para comparações e análises das variações genéticas entre indivíduos, populações ou espécies
genoma populacional
conjunto de variações genéticas dentro de uma população de organismos; o estudo do genoma populacional examina como o DNA varia entre indivíduos de uma mesma espécie em diferentes locais geográficos, períodos de tempo ou condições ambientais, permitindo o cálculo de importantes parâmetros indicadores do risco de extinção das espécies
códigos de barras de DNA
conhecidos em inglês como DNA barcodes, esses trechos curtos e padronizados do DNA funcionam como identificadores únicos de espécies; assim como um código de barras em produtos identifica rapidamente um item no supermercado, o DNA barcode identifica uma espécie com agilidade, comparando seu trecho de DNA com um banco de dados
identificação taxonômica
processo de reconhecer, nomear e classificar um organismo; permite saber a qual grupo (espécie, gênero, família etc.) o indivíduo pertence dentro do sistema de classificação biológica
biblioteca genômica
conjunto padronizado de fragmentos do DNA de um organismo preparados para o sequenciamento e contendo tags (etiquetas moleculares) anexadas às extremidades, que permitem a orientação do sequenciamento e a identificação da informação genética
bioinformática
área interdisciplinar que combina biologia, computação e matemática para analisar, interpretar e entender dados biológicos complexos
gene
trecho do código genético, que, quando lido ou ativado, gera algum efeito na célula, como a fabricação de uma proteína específica
proteína
molécula essencial para a vida, formada por uma cadeia de aminoácidos ligados em sequência. É responsável por quase todas as funções do organismo
long reads
o termo, que em português significa leituras longas, refere-se a fragmentos longos de DNA sequenciados de uma só vez, geralmente com mais de 10 mil pares de bases (10 kb), podendo ultrapassar 100 kb
short reads
o termo significa leituras curtas em português e define pequenos fragmentos de DNA sequenciados de uma só vez, geralmente com comprimento entre 50 e 300 pares de bases (pb)
terabyte
unidade de medida usada na computação para expressar a quantidade de dados ou a capacidade de armazenamento. Um terabyte (TB) corresponde a 1.024 gigabytes (GB)
metabarcoding
técnica que permite a identificação simultânea de múltiplas espécies a partir do sequenciamento de DNA de uma única amostra em massa contendo organismos inteiros ou de uma única amostra ambiental, como de solo ou água
gigabyte
unidade de medida usada na computação para expressar a quantidade de dados ou a capacidade de armazenamento. Um gigabyte (GB) corresponde a 1.024 megabytes (MB)
melhoramento genético
conjunto de técnicas usadas para selecionar e desenvolver plantas ou animais com características desejadas, como maior produtividade, resistência a doenças, melhor qualidade ou adaptação ao ambiente
espécie endêmica
espécies que ocorrem exclusivamente em determinada região geográfica
holótipo
exemplar utilizado para descrever uma nova espécie; uma referência científica
sequenciamento genético
técnica que utiliza processos bioquímicos para 'ler' o DNA de um ser vivo
fluxo gênico
movimento de genes entre populações diferentes de uma mesma espécie; acontece quando indivíduos migram, se reproduzem em outro grupo e passam seus genes adiante, misturando características genéticas
reestoque
reintrodução de indivíduos de uma espécie em uma área onde sua população foi reduzida ou extinta para recuperar o equilíbrio ecológico ou restaurar a biodiversidade

