As plataformas de sequenciamento de segunda geração também conhecidas como NGS - Next Generation Sequencing produzem grande volume de dados, o que demanda alta complexidade e custo computacional no processamento destes dados. Essas plataformas geram leituras duplicadas que surgem na preparação da biblioteca genômica e são introduzidas na etapa de amplificação por PCR. Essa redundância de leituras pode aumentar os requisitos computacionais e tempo de processamento de análises subsequentes (exemplo, a montagem de novo). Para reduzir o custo computacional dessas análises é necessário realizar a remoção dessas leituras do conjunto de dados do organismo sequenciado. Neste livro apresentamos o NGSReadsTreatment uma ferramenta computacional para a remoção de leituras duplicadas em conjuntos de dados pareados ou fragmentos. A entrada de dados consiste em leituras oriundas de qualquer plataforma de sequenciamento com o mesmo ou diferentes comprimentos. A sua engine utiliza a estrutura probabilística Cuckoo Filter para identificar e remover as leituras redundantes, a identificação é feita comparando as leituras entre si, assim, nenhum pré-requisito é necessário além do conjunto de leituras.