Distribution of restriction sites in the human genome

Enzyme:  MaeII               Longest uncut segments
Specificity:  ACGT               Repeats in uncut segments
Number of sites:  2150794               Genes in uncut segments
Mean distance between sites:  1330 base pairs
Standard deviation:  1440 base pairs
Site density 751.7 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   494043  chr15  NT_037852.6  1398212-1892255    0.74 % in   15 repeats    0.00 % in 0 genes
2   409763  chr6  NT_167244.1  2358724-2768487    1.01 % in   17 repeats    0.00 % in 0 genes
3   210540  chr6  NT_167244.1  4387974-4598514    1.24 % in   8 repeats    0.00 % in 0 genes
4   183932  chr6  NT_167244.1  3788582-3972514    1.17 % in   13 repeats    0.00 % in 0 genes
5   175095  chr6  NT_167244.1  3180261-3355356    0.03 % in   1 repeats    0.00 % in 0 genes
6   172618  chr6  NT_167247.1  4421640-4594258    0.00 % in   1 repeats    100.00 % in 1 genes
7   168385  chr6  NT_167247.1  1559751-1728136    1.37 % in   11 repeats    1.90 % in 1 genes
8   165539  chr6  NT_167249.1  2137611-2303150    0.26 % in   2 repeats    0.00 % in 0 genes
9   162324  chr6  NT_167248.1  521243-683567    1.86 % in   2 repeats    0.00 % in 0 genes
10   158725  chr6  NT_167244.1  2006173-2164898    1.16 % in   9 repeats    0.00 % in 0 genes
11   153286  chr9  NT_008470.19  21691322-21844608    0.96 % in   7 repeats    0.00 % in 0 genes
12   147562  chr6  NT_167244.1  2893710-3041272    2.24 % in   20 repeats    0.00 % in 0 genes
13   122543  chr6  NT_167245.1  2605570-2728113    2.85 % in   10 repeats    0.00 % in 0 genes
14   115823  chr6  NT_167247.1  1176676-1292499    0.85 % in   1 repeats    0.00 % in 0 genes
15   115046  chr6  NT_167246.1  3261319-3376365    0.84 % in   6 repeats    0.00 % in 0 genes
16   110802  chr6  NT_167245.1  137561-248363    2.22 % in   9 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
494043  chr15  NT_037852.6  1398212-1892255    15  12       L2a (3)  L1M5 (2)  U2 (1) 
409763  chr6  NT_167244.1  2358724-2768487    17  12       AluY (3)  LTR84b (2)  L1MC4a (2) 
210540  chr6  NT_167244.1  4387974-4598514    7       MER57-int (2)  (TTCC)n (1)  L1MC (1) 
183932  chr6  NT_167244.1  3788582-3972514    13  11       MLT1H-int (2)  AT_rich (2)  MLT1H (1) 
175095  chr6  NT_167244.1  3180261-3355356    1       AluSp (1) 
172618  chr6  NT_167247.1  4421640-4594258    1       AluSc (1) 
168385  chr6  NT_167247.1  1559751-1728136    11  9       Tigger7 (2)  MIR (2)  MIRc (1) 
165539  chr6  NT_167249.1  2137611-2303150    2       L1MC4a (1)  AT_rich (1) 
162324  chr6  NT_167248.1  521243-683567    2       L1PREC2 (1)  HERVH-int (1) 
10  158725  chr6  NT_167244.1  2006173-2164898    6       AluSx (4)  MIRb (1)  MIR (1) 
11  153286  chr9  NT_008470.19  21691322-21844608    5       LTR67B (2)  L2 (2)  MSTA (1) 
12  147562  chr6  NT_167244.1  2893710-3041272    20  10       L1MC5 (6)  AluSc (3)  L2c (2) 
13  122543  chr6  NT_167245.1  2605570-2728113    10  8       Tigger1 (2)  L2 (2)  MLT2A2 (1) 
14  115823  chr6  NT_167247.1  1176676-1292499    1       ERV3-16A3_I-int (1) 
15  115046  chr6  NT_167246.1  3261319-3376365    4       MIRb (2)  AluSx (2)  L2a (1) 
16  110802  chr6  NT_167245.1  137561-248363    8       L2c (2)  (TTTC)n (1)  MLT1F (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
6   172618       chr6  NT_167247.1  4421640-4594258    LOC100507722  hypothetical_protein_LOC100507722
7   168385       chr6  NT_167247.1  1559751-1728136    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011