к МР 3.1.0272-22
Требования к файлам, содержащим информацию о нуклеотидной последовательности
Каждый геном SARS-CoV-2 должен быть представлен одной нуклеотидной последовательностью в форматах "*.fasta", "*.fas", "*.fa".
Требования к наименованию последовательности:
- должно содержать латинские буквы, цифры, нижнее подчёркивание, не должно содержать пробелов
- должно быть полностью идентично названию образца, введенному в форму для представления метаданных.
Требования к буквенным обозначениям нуклеотидов в файлах:
- в случае наличия не покрытых (неотсеквенированных) областей в геноме, они должны быть замаскированы последовательностью, состоящей из букв NNN;
- в случае наличия вырожденных нуклеотидных позиций они обозначаются вырожденным кодом, согласно номенклатуре IUPАС (например R, для обозначения A/G и т.п.)».