记录一下如何在SnapGene中为一段基因组序列,添加多个不同外显子/CDS的完整结构。

这里以拟南芥的序列为例,比方说选择这个由三个外显子(三段CDS)组成的AT4G10310(HKT1)。

image.png

首先下载该区域的全长基因组序列,这里简单起见就直接下载TAIR上的,也可以下载别处带有启动子等额外信息的序列,该序列在Sequences部分的full length genomic。

image.png

点击进入后在序列底部有Copy Sequence按钮,点击复制序列。

image.png

打开SnapGene,选择 New DNA or RNA File,贴入刚刚的序列,选择线性DNA并输入文件名,点击OK确认。

image.png

接下来后退页面回到Sequences处,点击full length CDS,进入并复制全长的CDS序列(或者cDNA,按需要来),并到SnapGene中点击左侧的序列比对,将刚刚的CDS序列与基因组序列进行比对。

image.png

此时在Map界面能看到CDS的部分比对到了基因组上,内含子区域显示为空缺。

image.png

之后点击底部的Sequence,切换到序列面板,从第一个开始比对上的位置(ATG)开始选中序列,一直拖动直到选中最后一个比对上的位置(终止密码子TAA),在顶部点选Feature-Add Feature。

image.png

在弹出窗口中随意输入Feature名称(这里我输入了CDS),并在Type处为序列类型选择为CDS,点击OK进行创建。

image.png

这样得到的是没有区分出内含子区域的结构,接下来我们为其拆分出内含子。

在序列比对的Sequence界面,从第一个内含子的起始到第一个内含子结束选中序列,再去Feature菜单中选择Create Feature Segment,弹出界面中就会将完整的结构按选中位置进行拆分。

image.png

再点击选中内含子区域的片段,按右侧的删除片段,即可创建第一个内含子,重复此过程直到所有内含子都添加完成。

image.png

最后构选上Translate this feature in Sequence view,即可将序列按照CDS翻译为氨基酸序列。

image.png

image.png

记得保存得到的文件,就完成了。