Distribution of restriction sites in the human genome

Enzyme:  LlaDII               Longest uncut segments
Specificity:  GCNGC               Repeats in uncut segments
Number of sites:  6096431               Genes in uncut segments
Mean distance between sites:  469 base pairs
Standard deviation:  681 base pairs
Site density2130.6 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488699  chr15  NT_037852.6  1398224-1886923    0.01 % in   1 repeats    0.00 % in 0 genes
2   401730  chr6  NT_167244.1  2359600-2761330    0.08 % in   1 repeats    0.00 % in 0 genes
3   208591  chr6  NT_167244.1  4389972-4598563    0.33 % in   4 repeats    0.00 % in 0 genes
4   180708  chr6  NT_167244.1  3790040-3970748    0.20 % in   3 repeats    0.00 % in 0 genes
5   175386  chr6  NT_167244.1  3180302-3355688    0.18 % in   2 repeats    0.00 % in 0 genes
6   172378  chr6  NT_167247.1  4422046-4594424    0.10 % in   2 repeats    100.00 % in 1 genes
7   166736  chr6  NT_167249.1  2137910-2304646    0.71 % in   8 repeats    0.00 % in 0 genes
8   164283  chr6  NT_167247.1  1562936-1727219    0.01 % in   1 repeats    0.01 % in 1 genes
9   159544  chr6  NT_167248.1  521813-681357    0.15 % in   2 repeats    0.00 % in 0 genes
10   150775  chr9  NT_008470.19  21692611-21843386    0.43 % in   2 repeats    0.00 % in 0 genes
11   143843  chr6  NT_167244.1  2893910-3037753    0.45 % in   5 repeats    0.00 % in 0 genes
12   117873  chr6  NT_167245.1  2605837-2723710    0.34 % in   1 repeats    0.00 % in 0 genes
13   117094  chr10  NT_008705.16  38712144-38829238    26.46 % in   212 repeats    0.00 % in 0 genes
14   114838  chr6  NT_167247.1  1177533-1292371    0.11 % in   1 repeats    0.00 % in 0 genes
15   114378  chr6  NT_167246.1  3261178-3375556    0.41 % in   3 repeats    0.00 % in 0 genes
16   107996  chr6  NT_167245.1  137980-245976    0.09 % in   2 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488699  chr15  NT_037852.6  1398224-1886923    1       AT_rich (1) 
401730  chr6  NT_167244.1  2359600-2761330    1       AluSp (1) 
208591  chr6  NT_167244.1  4389972-4598563    4       L1MC (1)  AluSx (1)  AluSg/x (1) 
180708  chr6  NT_167244.1  3790040-3970748    3       MLT1H-int (1)  MER52D (1)  AluJb (1) 
175386  chr6  NT_167244.1  3180302-3355688    2       Charlie4a (1)  AluSp (1) 
172378  chr6  NT_167247.1  4422046-4594424    2       MER11A (1)  AluSc (1) 
166736  chr6  NT_167249.1  2137910-2304646    4       L1MB8 (3)  AluSx (3)  L1MC4a (1) 
164283  chr6  NT_167247.1  1562936-1727219    1       MIR (1) 
159544  chr6  NT_167248.1  521813-681357    2       L1PREC2 (1)  HERVH-int (1) 
10  150775  chr9  NT_008470.19  21692611-21843386    2       LTR67B (1)  L1M5 (1) 
11  143843  chr6  NT_167244.1  2893910-3037753    5       L1MC5 (1)  AluY (1)  AluSg1 (1) 
12  117873  chr6  NT_167245.1  2605837-2723710    1       L2a (1) 
13  117094  chr10  NT_008705.16  38712144-38829238    212  27       GA-rich (24)  (GAATG)n (22)  (AAATG)n (22) 
14  114838  chr6  NT_167247.1  1177533-1292371    1       ERV3-16A3_I-int (1) 
15  114378  chr6  NT_167246.1  3261178-3375556    2       MIRb (2)  AluSx (1) 
16  107996  chr6  NT_167245.1  137980-245976    2       MLT1E2 (1)  LTR12C (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
6   172378       chr6  NT_167247.1  4422046-4594424    LOC100507722  hypothetical_protein_LOC100507722
8   164283       chr6  NT_167247.1  1562936-1727219    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011