Distribution of restriction sites in the human genome

Enzyme:  CdpI               Longest uncut segments
Specificity:  GCGGAG               Repeats in uncut segments
Number of sites:  461685               Genes in uncut segments
Mean distance between sites:  6197 base pairs
Standard deviation:  9382 base pairs
Site density 161.4 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   494766  chr15  NT_037852.6  1396889-1891655    0.86 % in   19 repeats    0.00 % in 0 genes
2   404705  chr6  NT_167244.1  2359747-2764452    0.18 % in   3 repeats    0.00 % in 0 genes
3   324250  chrY  NT_011875.12  8390592-8714842    82.21 % in   49 repeats    0.00 % in 0 genes
4   282482  chr4  NT_016354.19  32185824-32468306    55.20 % in   417 repeats    27.86 % in 2 genes
5   251793  chr10  NT_033985.7  1-251794    69.85 % in   207 repeats    6.68 % in 29 genes
6   223886  chr19  NT_011109.16  1-223887    99.80 % in   58 repeats    0.00 % in 0 genes
7   208488  chr6  NT_167244.1  4389907-4598395    0.28 % in   3 repeats    0.00 % in 0 genes
8   203845  chr11  NT_167190.1  21643-225488    99.85 % in   56 repeats    0.00 % in 0 genes
9   203456  chrY  NT_011896.9  426635-630091    75.54 % in   312 repeats    0.00 % in 0 genes
10   202837  chr6  NT_007299.13  224257-427094    57.51 % in   139 repeats    0.00 % in 0 genes
11   199087  chr6  NT_167248.1  488876-687963    12.83 % in   40 repeats    0.00 % in 0 genes
12   196094  chr6  NT_167244.1  3788519-3984613    4.51 % in   36 repeats    0.00 % in 0 genes
13   184367  chr7  NT_007933.15  311033-495400    98.34 % in   48 repeats    0.00 % in 0 genes
14   175638  chr6  NT_167244.1  3179779-3355417    0.14 % in   5 repeats    0.00 % in 0 genes
15   175278  chr6  NT_167247.1  4420757-4596035    1.04 % in   9 repeats    0.00 % in 0 genes
16   172945  chrX  NT_011669.17  253022-425967    88.87 % in   114 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
494766  chr15  NT_037852.6  1396889-1891655    19  16       L2a (3)  L1M5 (2)  U2 (1) 
404705  chr6  NT_167244.1  2359747-2764452    3       L1MEg (1)  AluY (1)  AluSp (1) 
324250  chrY  NT_011875.12  8390592-8714842    49  22       LTR12B (17)  AT_rich (4)  AluY (4) 
282482  chr4  NT_016354.19  32185824-32468306    417  162       AT_rich (35)  MIR (30)  L2a (16) 
251793  chr10  NT_033985.7  1-251794    207  43       ALR/Alpha (21)  HSATII (20)  (GAATG)n (17) 
223886  chr19  NT_011109.16  1-223887    58  12       ALR/Alpha (31)  L1PA3 (13)  L1PA4 (2) 
208488  chr6  NT_167244.1  4389907-4598395    3       AluSx (1)  AluSg/x (1)  AluJo (1) 
203845  chr11  NT_167190.1  21643-225488    56  7       ALR/Alpha (33)  L1PA4 (5)  L1PA3 (5) 
203456  chrY  NT_011896.9  426635-630091    312  130       AT_rich (23)  AluY (9)  AluJb (9) 
10  202837  chr6  NT_007299.13  224257-427094    139  76       ALR/Alpha (16)  AT_rich (7)  MIRb (4) 
11  199087  chr6  NT_167248.1  488876-687963    40  33       AT_rich (4)  MER4D (2)  L1PA14 (2) 
12  196094  chr6  NT_167244.1  3788519-3984613    36  28       L2a (6)  MLT1H-int (2)  L1M5 (2) 
13  184367  chr7  NT_007933.15  311033-495400    48  14       ALR/Alpha (26)  AluY (4)  L1PA4 (3) 
14  175638  chr6  NT_167244.1  3179779-3355417    3       GC_rich (3)  (CCG)n (1)  AluSp (1) 
15  175278  chr6  NT_167247.1  4420757-4596035    9       (TTAAA)n (1)  MIR (1)  MER11A (1) 
16  172945  chrX  NT_011669.17  253022-425967    114  59       ALR/Alpha (15)  AT_rich (6)  L1PA4 (4) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
4   282482       chr4  NT_016354.19  32185824-32468306    LOC100421495 
DKK2  dickkopf-related_protein_2_precursor
5   251793       chr10  NT_033985.7  1-251794    LOC100506968 
LOC100506743 
LOC100506987 
LOC100507020  hypothetical_protein_LOC100507020
LOC100507045 
LOC100507078 
LOC100507104 
LOC100507129 
LOC100507154  hypothetical_protein_LOC100507154
LOC100507189 
LOC100507216 
LOC100507234 
LOC100507262 
LOC100507287 
LOC100507320 
LOC100507339  hypothetical_protein_LOC100507339
LOC100507366 
LOC100507385 
LOC100507409 
LOC100507432 
LOC100507451 
LOC100507471 
LOC100507491  hypothetical_protein_LOC100507491
LOC100507517 
LOC100507542  hypothetical_protein_LOC100507542
LOC100507565 
LOC100507597 
LOC100506770 
LOC100507622 



Posfai@neb.com
May 11, 2011