首先要去除低质量的序列,这个一般测序公司已经给你做好了,软件SolexaQA。然后回来你可能要校正错误序列,软件SEECER。这时候你的fastq文件就变成fasta了。然后你拼接序列啊,用Triity,拼好后可以进行blast比对,看有没有匹配。还可以用blast输出的文件做blast2go,得到GO号,做GO的注释,KEGG pathway分析。还有进行差异表达基因的分析分等等,我现在说的是没有参考基因的转录组数据处理。还有有参考基因的,那个不用从头组装,把你的序列和参考基因比对就行。要往具体了说就太多了,我可以给你一些资料。
首先您做的事芯片呢?还是转录组测序呢?
芯片我不是太了解,可能是封闭系统,目前看对于发现新转录本不是很有利。
若是做转录组测序,首先去除污染序列,然后片段重叠。然后将将每一个read定位到基因组,取得GO值,功能注释,转录水平评估,功能富集及pathway分析,若对新发现的转录本感兴趣还可以做转录本的功能预测及细胞定位。希望有高手来评价---说的不对的尽管指出。OVER.