Distribution of restriction sites in the human genome

Enzyme:  BspLU11III               Longest uncut segments
Specificity:  GGGAC               Repeats in uncut segments
Number of sites:  3802003               Genes in uncut segments
Mean distance between sites:  752 base pairs
Standard deviation:  925 base pairs
Site density1328.7 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   489682  chr15  NT_037852.6  1397506-1887188    0.13 % in   6 repeats    0.00 % in 0 genes
2   403211  chr6  NT_167244.1  2359653-2762864    0.13 % in   2 repeats    0.00 % in 0 genes
3   211274  chr6  NT_167244.1  4387856-4599130    1.55 % in   10 repeats    0.00 % in 0 genes
4   180947  chr6  NT_167244.1  3789853-3970800    0.26 % in   3 repeats    0.00 % in 0 genes
5   175706  chr6  NT_167244.1  3180061-3355767    0.24 % in   5 repeats    0.09 % in 1 genes
6   173353  chr6  NT_167247.1  4422028-4595381    0.65 % in   2 repeats    100.00 % in 1 genes
7   166299  chr6  NT_167249.1  2137926-2304225    0.62 % in   8 repeats    0.00 % in 0 genes
8   165255  chr6  NT_167247.1  1562922-1728177    0.41 % in   4 repeats    0.02 % in 1 genes
9   159655  chr6  NT_167248.1  521772-681427    0.22 % in   2 repeats    0.00 % in 0 genes
10   151712  chr9  NT_008470.19  21691966-21843678    0.63 % in   5 repeats    0.00 % in 0 genes
11   143519  chr6  NT_167244.1  2894290-3037809    0.29 % in   4 repeats    0.00 % in 0 genes
12   117622  chr6  NT_167245.1  2606058-2723680    0.15 % in   1 repeats    0.00 % in 0 genes
13   115678  chr9  NT_113916.2  47825-163503    99.99 % in   2 repeats    0.00 % in 0 genes
14   113714  chr6  NT_167246.1  3261229-3374943    0.20 % in   2 repeats    0.00 % in 0 genes
15   109226  chr6  NT_167245.1  137797-247023    1.17 % in   4 repeats    0.00 % in 0 genes
16   106684  chr6  NT_167244.1  3487953-3594637    3.13 % in   11 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
489682  chr15  NT_037852.6  1397506-1887188    6       MLT1L (1)  MIRc (1)  MIRb (1) 
403211  chr6  NT_167244.1  2359653-2762864    2       L1MEg (1)  AluSp (1) 
211274  chr6  NT_167244.1  4387856-4599130    10  8       MER57-int (2)  AluSx (2)  (TTCC)n (1) 
180947  chr6  NT_167244.1  3789853-3970800    3       MLT1H-int (1)  MER52D (1)  AluJb (1) 
175706  chr6  NT_167244.1  3180061-3355767    4       GC_rich (2)  Charlie4a (1)  (CCG)n (1) 
173353  chr6  NT_167247.1  4422028-4595381    2       MER11A (1)  AluSc (1) 
166299  chr6  NT_167249.1  2137926-2304225    4       L1MB8 (3)  AluSx (3)  L1MC4a (1) 
165255  chr6  NT_167247.1  1562922-1728177    3       MIR (2)  (GGAA)n (1)  AluSq (1) 
159655  chr6  NT_167248.1  521772-681427    2       L1PREC2 (1)  HERVH-int (1) 
10  151712  chr9  NT_008470.19  21691966-21843678    4       LTR67B (2)  MSTA (1)  MIR3 (1) 
11  143519  chr6  NT_167244.1  2894290-3037809    4       L1MC5 (1)  AluY (1)  AluSg1 (1) 
12  117622  chr6  NT_167245.1  2606058-2723680    1       L2a (1) 
13  115678  chr9  NT_113916.2  47825-163503    1       ALR/Alpha (2) 
14  113714  chr6  NT_167246.1  3261229-3374943    2       MIRb (1)  AluSx (1) 
15  109226  chr6  NT_167245.1  137797-247023    4       MLT1F (1)  MLT1E2 (1)  LTR12C (1) 
16  106684  chr6  NT_167244.1  3487953-3594637    11  5       L1M2 (4)  AluSg (3)  AluSx (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   175706       chr6  NT_167244.1  3180061-3355767    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
6   173353       chr6  NT_167247.1  4422028-4595381    LOC100507722  hypothetical_protein_LOC100507722
8   165255       chr6  NT_167247.1  1562922-1728177    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011