SAM-TB
首页
我的数据
我的分析
我的样本
帮助中心
FAQ
English
登录
线上提问
## FAQ ###关于网站功能 #### 1. 这个网站有什么实用性的功能?能完成哪些事情? 本网站旨在建立了一个界面友好、功能丰富的结核分枝杆菌全基因组测序数据分析平台,支持Illumina平台测序的paired-end数据分析。目前具有以下功能: (1)测序数据质量控制:对样本的测序质量进行评估,并通过质控改进数据质量; (2)非结核分枝杆菌(NTM)菌种鉴定:网站根据样本比对到参考序列H37Rv(NC_000962.2)的结果,对基因组比对率≤95%的菌株进行NTM菌种鉴定。若样本属于mlstverse 软件[1]菌种库中175种NTM中的一种,则报告鉴定到的NTM菌种;否则,报告为未知。若检测到样本为MTB和NTM混合样本,则报告MTB及与其混合的NTM菌种。 (3)结核分枝杆菌(MTB)混合感染鉴定:对属于MTB的样本,网站使用Mixinfect[2]软件检测样本是否存在两种或者以上MTB的混合感染。如果混合感染,将报告样本中主要菌株的预估比例。需要注意的是,当样本中次要菌株占比低于10%时,软件检测混合感染的能力可能会降低。 (4)变异检测和注释:若样本含有完整的结核分枝杆菌复合群(MTBC)特有序列(H37Rv 315947- 316534区域),并且基因组平均测序深度≥5,则对样本进行变异检测和注释,提供全基因组变异信息,包括SNPs、短的indels和长的deletion(≥50bp)。 (5)核心基因组多位点序列分型(cgMLST)分析:网站根据已发表的包含2891个核心基因的cgMLST方案[3]来确定MTB菌株的cgMLST等位基因谱。 (6)耐药预测:检测结核分枝杆菌样本对17种抗结核药物(异烟肼、利福平、乙胺丁醇、皮嗪酰胺、链霉素、乙硫异烟胺、阿米卡星、卡那霉素、卷曲霉素、氧氟沙星、莫西沙星、对氨基水杨酸、环丝氨酸、利奈唑胺、氯法齐明、贝达喹啉、德拉马尼)的分子药敏,提供耐药突变及其频率(可判断是否为异质性耐药),以及注释预测耐药可靠性低的突变(包括可靠性低[4]和可靠性未知的突变)。本网站还可以分析菌株对四种一线药物敏感性(详见帮助中心“一线药物敏感性和耐药性预测“)。 (7)菌株亚型鉴定:对属于结核分枝杆菌复合群(MTBC)的样本,本网站可进行Lineage鉴定(L1-9、M. bovis、M.caprae和 M.orygis)。 (8)菌株间遗传距离分析:网站可以对多个样本进行两两菌株间SNP距离(pairwise SNP distance)分析。 (9)进化树构建:网站可以对多个样本进行进化树构建(基于SNP或cgMLST)。用户可使用figtree, ggtree和iTOL等进化树美化工具将SNP距离小于某个阈值(如12个SNPs)的菌株对应到进化树上,根据它们在进化树上的位置(是否位于同一个clade),可以鉴定成簇菌株。 注意:对于MTB和NTM混合样本,网站会进行变异检测和注释、耐药预测、亚型鉴定分析,但是结果不准确。若选择了不适用于亲缘关系分析的样本计算菌株间SNP距离和构建进化树,可能会影响分析结果。 ####2. 我有大量的批测序数据,可以一直使用你们这个网站进行分析吗? 目前每位用户的可分析样本的上限为100。当分析达到上限后,用户可下载分析结果,删除已分析的数据后可再进行分析。若需要提高可分析样本的上限,可发送邮件至samtb2018@163.com申请。 ####3. 数据分析完成之后,能否导出分析结果? 网站可以导出分析完成样本的质控结果、耐药结果、耐药突变和变异信息。并且,网站支持批量导出这些分析结果,其中批量导出的变异信息经过整合,列出了每个变异在样本中的分布情况。 ###关于输入 ####1. 你们的网站对测序数据的格式有要求吗? 目前网站只支持双末端测序(paired-end)数据的分析,并且只支持上传fastq/fastq.gz文件。如果您拿到的测序数据为bam格式,可通过 [bamtofastq](http://bedtools.readthedocs.io/en/latest/content/tools/bamtofastq.html) 网页的说明进行格式的转化。 ####2. 构建进化树有什么要求吗? 构建进化树要求至少有4个样本,最多不超过2000个样本。但是要注意当样本量超过500个时,使用最大似然法构建进化树(基于SNP)会很慢。网站提供了用于构建进化树的fasta文件,用户可以下载后采用其他软件进行进化树构建。此外,网站还提供了基于cgMLST建树功能,该功能能够显著提升建树速度。 ###关于网站使用 ####1. 网站的具体使用流程是怎样的? (1)创建账号:进入SAM-TB首页后 ,点击“登录”。在登录页面输入注册邮箱及密码。如果您还未申请账号,可以点击“免费申请试用”,填写简单的信息之后会收到后台发送的邮件,其中包含账号的初始密码。密码可以在设置中修改。 (2)上传数据、创建分析以及查看分析结果请阅读“帮助中心”。 ####2. 数据分析过程看起来时间很长,对于我们不做分析的人来说很难把握产生结果的时间,能不能加上一个进度条? 分析过程中会受到集群状态以及系统任务调度等因素的影响,导致即使同样大小的文件的运算时间也会发生变化,因此无法提供进度条。通常一个结核分枝杆菌样本如果开始分析了,20分钟左右能够得到单样本变异检测、耐药、亚型鉴定等结果。 ####3. 如果我中途网页不小心关闭,正在运行的分析会不会受到影响? 如果样本已经提交分析了,关闭或刷新网页不会对分析过程造成影响。但是如果在数据上传过程中关闭或者刷新网页,会造成数据上传中断。如果发生错误操作导致数据上传中断,重新上传文件后会从断点续传。批量上传数据时可开其他网页进行搜索和浏览。 ####4. 我的数据太多了,每个样本都对应着两个测序文件,难道我只能每次一个一个地把菌株的数据与样本对应链接起来吗? 本网站提供两种方法将数据与对应的样本链接起来: ①本网站在“我的数据”页面“批量操作”栏提供“批量更新Metadata”,点击浮框中的“下载模板”,按要求填写后并上传,即可将数据与样本关联起来。 ②本网站在“我的数据”页面下提供“批量创建分析”,按要求创建分析后便可将样本与数据对应起来,并且网站会自动开始分析。 ####5. 不小心删除了某一个样本怎么找回? 到“我的样本”中“回收站”选择恢复该样本即可。 ####6. 为什么浏览器导不出表格? 浏览器兼容问题。推荐使用谷歌浏览器、Safari浏览器或火狐浏览器。不支持表格导出的浏览器有QQ浏览器等。 ###关于网站安全性 ####1. 怎么修改密码? 点击右上角“账号设置”,可以修改您的基本信息以及密码。请注意,后台暂时不能查看用户的密码,请自行保存密码。 ####2. 忘记密码怎么办? 在登录页面点击“忘记密码”。在浮框中输入你的注册邮箱,点击“找回密码”,跳转到新页面后填写您在注册账号时填写的邮箱即会收到一封邮件,按照邮件的提示即可重新填写密码。 ####3. 我上传都是未发表的测序数据,你们的网站有可能会泄密吗? 关于信息安全问题,用户可以完全不用担心。在注册账号时我们提供了比较详细的“用户协议”,包括“使用规则”、“用户信息保护”、“风险提示”、 “免责声明”等内容。在进行分析时,您完全可以不用填写病人的任何信息,只需要填写您自己可以清楚分辨且不重复的样本名。 ###关于分析结果 ####1. 数据质量控制的每一项代表什么意思?如果质控不通过的话,后面的分析结果就完全不能参考了吗? (1)数据质量控制的具体含义可参考:[用FastQC检查高通量测序原始数据的质量](https://www.cnblogs.com/longjianggu/p/5078782.html) (2)网站“数据质控”页根据基因组平均深度和10X coverage判断数据质量是否满足耐药性和敏感性预测。对于质控通过的样本如果多个其他质控项结果为“差”,可能也会影响药物敏感性预测结果。 (3)质控不通过的样本,如果基因组平均深度≥20(或比20稍低),并且10X coverage≥ 97%(或比97%稍低),变异检测结果可以参考,但是耐药性和敏感性预测结果可能会受影响。 ####2. 为什么网站上有些变异在ref列没有给出具体的序列,中间用…表示,如C...T1358del? 网站中对大于50bp的deletion省略了其在参考基因组上的具体序列,而注释成该deletion的“起始碱基””…””末位碱基“”deletion长度“”del“。如C...T1358del表示这个deletion最开始的碱基是C,最后的碱基是T,是一个长度为1358bp的deletion。如果大于50bp的deletion跨了整个基因或多个基因或跨基因和基因间区,则”基因位置“列注释为该deletion在染色体上的位置,如Chromosome:1541947_1543304,”基因名“和”基因标签“列注释出其涉及的所有基因或者基因间区,如:Rv1369c,Rv1370c,lprF-Rv1369c,Rv1370c-Rv1371。 ####3. 我想要知道样本在某个基因上的所有突变,如katG基因上的所有突变;或者某种特定类型的突变,如所有非同义突变,网站可以实现吗? 可以。在我的分析页面点击“分析编号”进入“分析首页“,然后切换至”变异信息“页面。该页面提供了变异的搜索及筛选。 ①在页面右上角的搜索框中输入基因名称,即可查看样本在该基因上的所有突变。如输入katG则可查看katG基因上的所有突变(如果该基因上有突变)。 ②点击页面右侧的筛选标志,还可以依据基因组位置、基因标签、变异类型等进行变异筛选。网站的变异类型注释有以下11种:Delete、Delete\_frameshift、Delete\_non\_frameshift、Delete\_SV(结构变异,这里指≥50bp的deletion)、Insert、Insert\_frameshift、Insert\_non\_frameshift、Intergenic、Nonsynonymous、Small RNA、Synonymous。其中,基因间区的indel注释为Delete或Insert,基因上的indel注释为Delete\_frameshift、Delete\_non\_frameshift、Insert\_frameshift或Insert\_non\_frameshift,跨了整个基因或多个基因或跨基因和基因间区的deletion注释为Delete\_SV。在“变异类型”栏输入某种变异类型,将会得到基因组上所有该类型的变异,如中输入Nonsynonymous,可得到该样本所有非同义突变。 ####4. 为什么有些耐药突变,在“变异信息”页搜不到? 为检测样本是否存在异质性耐药,网站对检测到的频率≥10%的耐药突变都进行报告,但在“变异信息“页只报告频率≥75%的固定突变。 ####5. 网站中批量导出的变异信息,有什么用? 本网站提供了多个样本变异信息的批量导出。这是经过整合的结果,依据用户给的分析或样本列表,将这些样本的所有变异整整合到一起,每一行代表一个变异,前12列表示变异信息,第13列表示有多少个样本有该变异,后面的列是有该变异的样本,及变异位点的mapping结果。 基于这个结果,用户可以查看某个或某些变异在样本中的分布情况,与样本表型结合进行特异性分析。 ####6. 进化树文件如何使用? 从网站下载的进化树文件是.nwk格式(一种把进化树转化为各分支节点的文本格式,不是进化树的图),本质是文本文件,用户可以自行用记事本查看。 访问“MEGA”官网,下载并安装合适版本的MEGA 7/10。打开MEGA 7/10 ,左上角“file” 中的“Open A File”,选择nwk文件就可以生产一棵进化树,与网站形成的进化树一致。MEGA还具有很多功能,用户可查看官网说明。还有一些其他像figtree软件,ggtree、iTOL网站,都是很好的进化树展示和美化工具。 ####7. 为什么“菌株SNP距离”分析结果包含不同Lineage的菌株成簇的现象? 一般情况下是因为样本菌株存在混合感染的情况。可以先在“单样本变异检测”中查看质量控制是否通过,并查看突变数量是否与其他菌株相差很多。由于同一个亚型的菌株通常积累了相似数量的SNPs,故在统计菌株SNP时,SNP异常少或者异常多的菌株(即离群值)通常是有问题的,在分析中可以排除。这种情况可能是测序错误,也可能是DNA本身就存在污染。 ###参考文献 [1] Yuki Matsumoto, Takeshi Kinjo, Daisuke Motooka, Daijiro Nabeya, Nicolas Jung, Kohei Uechi, Toshihiro Horii, Tetsuya Iida, Jiro Fujita & Shota Nakamura. Comprehensive subspecies identification of 175 nontuberculous mycobacteria species based on 7547 genomic profiles. Emerging Microbes & Infections. 2019;8(1):1043-1053. doi: 10.1080/22221751.2019.1637702. PubMed PMID: 31287781; PubMed Central PMCID: PMC6691804. [2] Sobkowiak, B., Glynn, J.R., Houben, R.M.G.J. et al. Identifying mixed Mycobacterium tuberculosis infections from whole genome sequence data. BMC Genomics 19, 613 (2018). https://doi.org/10.1186/s12864-018-4988-z [3] Kohl TA, Harmsen D, Rothgänger J, Walker T, Diel R, Niemann S (2018) Harmonized genome wide typing of tubercle bacilli using a web-based gene-by-gene nomenclature system. EBioMedicine 34:131–138. https://doi.org/10.1016/j.ebiom.2018.07.030 [4] Paolo Miotto, Belay Tessema, Elisa Tagliani, Leonid Chindelevitch, Angela M Starks, Claudia Emerson, Debra Hanna, Peter S Kim, Richard Liwski, Matteo Zignol, Christopher Gilpin, Stefan Niemann, Claudia M Denkinger, Joy Fleming, Robin M Warren, Derrick Crook, James Posey, Sebastien Gagneux, Sven Hoffner, Camilla Rodrigues, Iñaki Comas, David M Engelthaler, Megan Murray, David Alland, Leen Rigouts, Christoph Lange, Keertan Dheda, Rumina Hasan, Uma Devi K Ranganathan, Ruth McNerney, Matthew Ezewudo, Daniela M Cirillo, Marco Schito, Claudio U Köser, Timothy C Rodwell. A standardised method for interpreting the association between mutations and phenotypic drug resistance in Mycobacterium tuberculosis. European Respiratory Journal. 2017;50(6):1701354. doi: 10.1183/13993003.01354-2017. PubMed PMID: 29284687; PubMed Central PMCID: PMC5898944.
<< 返回帮助中心
标题:
描述:
感谢您使用我们的服务,我们将尽快邮件回复您。