Distribution of restriction sites in the human genome

Enzyme:  CjeNII               Longest uncut segments
Specificity:  GAGNNNNNGT               Repeats in uncut segments
Number of sites:  6260096               Genes in uncut segments
Mean distance between sites:  457 base pairs
Standard deviation:  541 base pairs
Site density2187.8 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488096  chr15  NT_037852.6  1397111-1885207    0.14 % in   5 repeats    0.00 % in 0 genes
2   401413  chr6  NT_167244.1  2359956-2761369    0.00 % in   1 repeats    0.00 % in 0 genes
3   207913  chr6  NT_167244.1  4390009-4597922    0.03 % in   2 repeats    0.00 % in 0 genes
4   180786  chr6  NT_167244.1  3789873-3970659    0.18 % in   3 repeats    0.00 % in 0 genes
5   175560  chr6  NT_167244.1  3179918-3355478    0.16 % in   4 repeats    0.17 % in 1 genes
6   172441  chr6  NT_167247.1  4421827-4594268    0.01 % in   1 repeats    100.00 % in 1 genes
7   166103  chr6  NT_167249.1  2137401-2303504    0.53 % in   4 repeats    0.00 % in 0 genes
8   160452  chr6  NT_167248.1  521226-681678    0.71 % in   2 repeats    0.00 % in 0 genes
9   150499  chr9  NT_008470.19  21693188-21843687    0.09 % in   2 repeats    0.00 % in 0 genes
10   143356  chr6  NT_167244.1  2894338-3037694    0.21 % in   4 repeats    0.00 % in 0 genes
11   118038  chr6  NT_167245.1  2605849-2723887    0.43 % in   3 repeats    0.00 % in 0 genes
12   115619  chr6  NT_167247.1  1177101-1292720    0.49 % in   1 repeats    0.00 % in 0 genes
13   113586  chr6  NT_167246.1  3261198-3374784    0.06 % in   1 repeats    0.00 % in 0 genes
14   110293  chrY  NT_011875.12  8557738-8668031    54.61 % in   5 repeats    0.00 % in 0 genes
15   109953  chr10  NT_008705.16  38718874-38828827    24.17 % in   183 repeats    0.00 % in 0 genes
16   109329  chr6  NT_167245.1  136722-246051    1.30 % in   2 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488096  chr15  NT_037852.6  1397111-1885207    5       MIRc (1)  MIRb (1)  L1M3 (1) 
401413  chr6  NT_167244.1  2359956-2761369    1       AluSp (1) 
207913  chr6  NT_167244.1  4390009-4597922    2       AluSg/x (1)  AluJo (1) 
180786  chr6  NT_167244.1  3789873-3970659    3       MLT1H-int (1)  MER52D (1)  AluJb (1) 
175560  chr6  NT_167244.1  3179918-3355478    3       GC_rich (2)  (CCG)n (1)  AluSp (1) 
172441  chr6  NT_167247.1  4421827-4594268    1       AluSc (1) 
166103  chr6  NT_167249.1  2137401-2303504    4       L1MC4a (1)  L1MB8 (1)  AT_rich (1) 
160452  chr6  NT_167248.1  521226-681678    2       L1PREC2 (1)  HERVH-int (1) 
150499  chr9  NT_008470.19  21693188-21843687    2       MIR3 (1)  L1M5 (1) 
10  143356  chr6  NT_167244.1  2894338-3037694    4       L1MC5 (1)  AluY (1)  AluSg1 (1) 
11  118038  chr6  NT_167245.1  2605849-2723887    3       MLT1E2 (1)  L2a (1)  L2 (1) 
12  115619  chr6  NT_167247.1  1177101-1292720    1       ERV3-16A3_I-int (1) 
13  113586  chr6  NT_167246.1  3261198-3374784    1       MIRb (1) 
14  110293  chrY  NT_011875.12  8557738-8668031    1       LTR12B (5) 
15  109953  chr10  NT_008705.16  38718874-38828827    183  24       GA-rich (19)  (AAATG)n (19)  (GAATG)n (18) 
16  109329  chr6  NT_167245.1  136722-246051    2       MLT1E2 (1)  LTR12C (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   175560       chr6  NT_167244.1  3179918-3355478    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
6   172441       chr6  NT_167247.1  4421827-4594268    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011