banner

Новости

Nov 15, 2023

Минимальные требования для валидации и аккредитации ISO15189 трех процедур секвенирования нового поколения для SARS

Научные отчеты, том 13, Номер статьи: 6934 (2023) Цитировать эту статью

774 Доступа

1 Альтметрика

Подробности о метриках

Быстрые и периодические открытия новых штаммов (вариантов) SARS-CoV-2 побудили органы общественного здравоохранения во всем мире создать сети эпиднадзора для мониторинга распространения вызывающих озабоченность вариантов. Использование технологий секвенирования нового поколения повысило потребность в оценке контроля качества, необходимой в клинических лабораториях. Настоящее исследование является первым, в котором предлагается руководство по валидации типирования SARS-CoV-2 с использованием трех различных методов NGS, соответствующих стандартам ISO15189. К ним относятся оценка риска, специфичности, точности, воспроизводимости и повторяемости методов. Среди трех используемых методов два основаны на ампликонах с использованием полимеразной цепной реакции с обратной транскрипцией (Artic v3 и Midnight v1) от Oxford Nanopore Technologies, а третий основан на ампликонах с использованием полимеразной цепной реакции с обратной транскрипцией (Nimagen) на технологии Illumina. Мы обнаружили, что все методы соответствуют требованиям качества (например, 100% согласованность результатов типирования по точности, воспроизводимости и повторяемости) для типирования SARS-CoV-2 в клинических условиях. Кроме того, результаты типирования, полученные в результате каждого из трех методов секвенирования, сравнивались с использованием трех широко известных номенклатур (WHO, Pangolineage и Nextclade). Их также сравнивали по вариациям отдельных нуклеотидов. Результаты показали, что Artic v3 и Nimagen должны иметь преимущество при расследовании вспышек, поскольку они обеспечивают более качественные результаты для образцов, которые не соответствуют критериям включения для анализа в клинических условиях. Это исследование является первым шагом на пути к валидации разработанных в лаборатории тестов NGS в контексте нового европейского регламента для медицинских изделий и диагностики in vitro.

Коронавирусы представляют собой оболочечные одноцепочечные РНК-вирусы, широко распространенные среди млекопитающих и птиц и вызывающие широкий спектр заболеваний, включая респираторные инфекции. Эти вирусы обладают большим генетическим разнообразием и высокой способностью осуществлять генетическую рекомбинацию и мутации1,2. В конце 2019 года новый представитель подсемейства коронавирусов, названный SARS-CoV-2, был впервые обнаружен в Китае (Ухань) и стал ответственным за последовавшую беспрецедентную глобальную пандемию. Несмотря на низкую частоту мутаций по сравнению с другими РНК-вирусами3, высокая скорость передачи SARS-CoV-2 у людей увеличивает вероятность приобретения мутаций и последующей эволюции. Таким образом, со временем появилось множество вариантов SARS-CoV-2, включая варианты, представляющие интерес, и варианты, вызывающие беспокойство (ЛОС). Последний обладает более высокой трансмиссивностью и/или способностью уклоняться от иммунитета, чем ранее циркулировавшие штаммы3,4,5,6.

Большинство стран пытались контролировать новые волны инфекции, принимая меры общественного здравоохранения с целью избежать затопления медицинских учреждений и тем самым обеспечить доступ к медицинской помощи для людей, нуждающихся в необходимом лечении. В этом контексте было важно разработать эффективную сеть эпиднадзора, позволяющую на ранней стадии выявлять новые циркулирующие варианты и их передачу среди населения7,8. Полногеномное секвенирование не только помогает ученым изучать вирус и разрабатывать вакцины, но также является ключевым инструментом для создания надежных сетей эпиднадзора.

Весь геном SARS-CoV-2 был впервые секвенирован в начале 2020 года с использованием инфицированных вирусом клеток и сочетания нескольких технологий секвенирования следующего поколения (NGS) (например, Illumina и Oxford Nanopore Technologies)9. Обе технологии до сих пор широко используются во всем мире для получения последовательностей циркулирующих штаммов5,6,7,10,11. В сентябре 2020 года национальная сеть Великобритании по секвенированию, называемая Консорциумом геномики Великобритании по борьбе с коронавирусной болезнью 2019 (COVID-19), идентифицировала первый ЛОС, известный сегодня как альфа-вариант (B.1.1.7). Этот вариант SARS-CoV-2 характеризуется делецией HV69-70 и мутацией аминокислоты N501Y. Он был способен распространяться очень быстро и имел в общей сложности 14 замен аминокислот, специфичных для линии, по сравнению с первым штаммом, выявленным в Ухане, включая три мутации, которые, как известно, приносят эпидемиологические преимущества (например, N501Y, делеция 69-70, P681H)7,12 . С тех пор во всем мире были выявлены четыре основных варианта, вызывающих обеспокоенность: бета (K417N, E484K), гамма (K417T, V1176F), дельта (L19R, L452R, делеция 157-158, L452R, T478K, D950N) и новейший омикрон. (R346K, L452X, F486V) вариант. Каждый из этих вариантов накопил мутации, дающие им эволюционные преимущества вплоть до наиболее распространенных в настоящее время вариантов омикрон, которые приобрели более 60 мутаций по сравнению с эталонным геномом Ухани6,13,14.

25. 40 \(\upmu\)L of each pool diluted with 60 \(\upmu\)L of RC-PCR Low-TE buffer (Nimagen B.V.; Nijmegen, Netherlands) was purified using 85 \(\upmu\)L of Solid Phase Reversible Immobilization (SPRI) AmplicleanTM magnetic beads (Nimagen B.V.; Nijmegen, Netherlands) by mixing DNA and beads (beads:DNA ratio = 0.85), followed by incubation of the mix at room temperature (RT) for 5 min, then beads were washed twice with 75% ethanol. Beads covered with DNA fragments of interest were mixed with 110 \(\upmu\)L of RC-PCR Low TE Buffer (Nimagen B.V.; Netherlands) and incubated at RT for 2 min. The purification procedure was repeated a second time. Eluted DNA from each pool was quantified using the 1xdsDNA HS kit (Thermo Fisher Scientific; MA, USA) with the Qubit 4.0 (Thermo Fisher Scientific; MA, USA) and amplicons size and integrity were checked using the QIAxcel fragment analyzer (Qiagen; Hilden, Germany) with the DNA Screening Kit (Qiagen; Hilden, Germany)./p>9) and their length (Artic: minimum length= 400 bp - maximum length= 700 bp, Midnight: minimum length= 600 bp - maximum length= 1,200 bp) to avoid chimeric reads. The passed reads were mapped to the reference genome of SARS-CoV-2 MN908947.3 using minimap2 (version 2.18-r1015) and SNVs were called for positions with depth of reads \(\ge\) 20, and consensus sequence obtained using medaka (version 1.4.3, model r941_prom_variant_g360) a software using trained neural network-based models to appropriately call sequence variations29./p> 0.81 for SNV identification./p> 0.81 for SNV identification./p> 100x, run 2: mean coverage= 0x, 0% > 100x, run 3: mean coverage= 5x, 1.5% > 100x)./p> 0.8) for all samples with a qPCR Ct value < 25 (Artic v3: mean \(\kappa\) = 0.9918 ± 0.01060, Midnight v1: mean \(\kappa\) = 1 ± 0, Nimagen: mean \(\kappa\) = 0.9433 ± 0.1468). For the sample with the highest qPCR Ct value (Ct = 29.01), coefficients are lower (Artic v3: \(\kappa\) = 0.6896 ± 0.02007, Midnight v1: \(\kappa\) = 0 ± 0.00005, Nimagen: \(\kappa\) = 0.7659 ± 0.05119) indicating a greater discrepancy, especially for the Midnight v1 SOP. Both short-amplicon methods (Artic v3 and Nimagen) have a coefficient indicating a high correlation (Fig. 1 left panel). Although the reproducibility of the three methods is similar for samples with a qPCR Ct value <25, the reproducibility of the Midnight v1 SOP is significantly different from that of both other methods for samples with a qPCR Ct value >25 (Supplementary table 3)./p> 100x, repeat 2: mean coverage= 0x, 0% > 100x, repeat 3: mean coverage= 1x, 0% > 100x) (Supplementary table 4)./p> 25 (Artic v3: \(\kappa\) = 0.7279 ± 0.08269, Midnight v1: \(\kappa\) = 0 ± 0, Nimagen: \(\kappa\) = 0.8837 ± 0.03753) still showing a high repeatability for Nimagen and Artic while Midnight v1 is not repeatable./p>25 (Artic v3: \(\kappa\) = 0.7581 ± 0.01951, Nimagen: \(\kappa\) = 0.8287 ± 0.01903), especially for the Midnight v1 SOP which had a \(\kappa\) coefficient = 0 ± 0.00003, indicating that it was not repeatable for samples with a qPCR Ct value > 25 (Fig. 1 right panel). This was due to the low read depth (<20) at most nucleotide positions for two repeats performed with the Midnight v1 SOP. As this depth was the minimum threshold set in the bio-informatics pipeline for nucleotide calling in the consensus sequence, and as the third repeat had a sufficient read depth at these positions, the analysis resulted in a complete mismatch. Although the repeatability is not significantly different between the three methods for samples with qPCR Ct value <25, the repeatability of the Midnight v1 SOP is significantly different when compared with both other methods for qPCR Ct value >25 (Supplementary table 3)./p> 25 in clinical setting, sequencing results and strain typing can be obtained in non-clinical setting but should be interpreted with caution. Therefore, we compared the three methods using fifty-five samples without considering the Ct value exclusion criteria./p>30 for the N-gene (Table 2)./p>25 (Table 2), which led us to study the evolution of genome coverage as a function of viral load. We observed that for the three SOPs, the coverage was high for all samples with a N-gene qPCR Ct values <25 (96% and 90% of samples had a mean coverage above 380x for Artic v3 and Midnight v1 methods, respectively, and 90% of samples have a mean coverage above 600\(\times\) for Nimagen method) but the sequencing coverage dropped drastically with the three SOPs for samples with a qPCR Ct value >25 (Fig. 2)./p>25./p>25, the kappa coefficient decreased progressively with the increase of Ct value. This decrease was similar when comparing any method to one another (Fig. 3). However, all the mismatches observed can be explained by a too low read depth at the position of the mismatch for the method that did not identify the mutation (<20 reads for the Nanopore methods or <5 reads for the Illumina method). When, at that genomic position, the depth of reads was greater than 0 but below the previously mentioned cut-offs, we observed that the mutation was present in more than 70% of the reads, indicating that the discrepancies were not due to sequencing errors inherent to the methods but rather to the detection thresholds set in the bio-informatics pipelines./p>25 usually showed insufficient read depth which provided low reliability on some key mutations, which could lead to wrong or approximate lineage designation, highlighting the importance of sample selection criteria in the context of national surveillance programs using clinical samples8,38. Our data confirmed that the three methods validated here provided similar quality results and were adequate for epidemiological monitoring of SARS-CoV-2 using samples with N-gene qPCR CT value <25 in clinical setting./p>25), a method using smaller amplicons (Artic v3 and Nimagen) should be preferred as they exhibit better reproducibility and repeatability, and a higher mean coverage of the genome. This variability in coverage for samples with a low viral load had already been reported by Freed et al. Nevertheless, they have shown that it was possible to reach good quality results by generating more sequencing data than for samples with high or medium viral loads. This was not achieved in our study as we sequenced all samples under the same conditions. It has also been shown that in order to effectively detect SNVs and by extension reach a minimum coverage of 400x with an amplicon-based NGS technique, the material used for reverse transcription should contain at least 1,000 copies of viral RNA39,40./p>

ДЕЛИТЬСЯ