第三步,加入缓冲溶液,这时候序列自由端的部分就会和旁边的adpater进行匹配。
第四步,进行一轮PCR,在PCR的过程中,序列是弯成桥状,所以叫桥式PCR,一轮桥式PCR可以使得序列扩增1倍
如此循环下去,就会得到一个具有完全相同序列的簇,一般叫cluster。
1.2.1. 3 测序
测序的过程主要步骤有碱基延伸,荧光激发和拍照,剪切等。这3个步骤重复进行,想测定多少个碱基,就重复多少次。首先是来一个primer,然后加入特殊处理过的A,T,C,G四种碱基。特殊的地方有两点,一个是脱氧核糖3号位加入了叠氮基团而不是常规的羟基,保证每次只能够在序列上添加1个碱基;另一方面是,碱基部分加入了荧光基团,可以激发出不同的颜色。在测序过程中,每1轮测序,保证只有1个碱基加入的当前测序链。这时候测序仪会发出激发光,并扫描荧光。因为一个cluster中所有的序列是一样的,所以理论上,这时候cluster中发出的荧光应该颜色一致。随后加入试剂,将脱氧核糖3号位的—N2改变成—OH,然后切掉部分荧光基团,使其在下一轮反应中,不再发出荧光。如此往复,就可以测出序列的内容。
1.3 材料
材料来自实验室的水稻品种“Nipponbare”,种子在室温下发芽3天。然后将发芽的种子播种在土壤中以在温室中继续生长。收集两周龄的幼苗用于蛋白质和DNA分离。经ChIP得到fastq文件分别是:
LS-15_ATCACG_L000_R1.fastq、LS-16_CGATGT_L000_R1.fastq、LS-15_ATCACG_L000_R2.fastq 、LS-16_CGATGT_L000_R2.fastq。
Fastq格式是以@开头,后边是read的ID以及其他信息。第二行为read的序列。第三行以+开头,后边跟read名称,此处被省略。第四行代表read的质量,用ASCii码来表示,-10lgP的值转换成ASCII码,而P则代表该碱基被测序错误的概率。