Distribution of restriction sites in the human genome

Enzyme:  MspI               Longest uncut segments
Specificity:  CCGG               Repeats in uncut segments
Number of sites:  2296918               Genes in uncut segments
Mean distance between sites:  1245 base pairs
Standard deviation:  2198 base pairs
Site density 802.7 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   494167  chr15  NT_037852.6  1397345-1891512    0.76 % in   18 repeats    0.00 % in 0 genes
2   403510  chr6  NT_167244.1  2359391-2762901    0.13 % in   3 repeats    0.00 % in 0 genes
3   211617  chr6  NT_167244.1  4386646-4598263    1.75 % in   11 repeats    0.00 % in 0 genes
4   191795  chr7  NT_023603.5  39772-231567    99.99 % in   7 repeats    0.00 % in 0 genes
5   183036  chr6  NT_167244.1  3787910-3970946    0.63 % in   8 repeats    0.00 % in 0 genes
6   176052  chr6  NT_167244.1  3180254-3356306    0.19 % in   3 repeats    0.07 % in 1 genes
7   172762  chr6  NT_167247.1  4421952-4594714    0.27 % in   2 repeats    100.00 % in 1 genes
8   167293  chr6  NT_167248.1  521847-689140    2.85 % in   5 repeats    0.54 % in 1 genes
9   164605  chr6  NT_167247.1  1562946-1727551    0.21 % in   2 repeats    0.00 % in 0 genes
10   156248  chr9  NT_008470.19  21688517-21844765    2.64 % in   13 repeats    0.00 % in 0 genes
11   156244  chr6  NT_167244.1  2008359-2164603    0.50 % in   4 repeats    0.00 % in 0 genes
12   144968  chr6  NT_167244.1  2892602-3037570    0.80 % in   6 repeats    0.00 % in 0 genes
13   120502  chr6  NT_167244.1  1451387-1571889    10.28 % in   24 repeats    0.00 % in 0 genes
14   120386  chr6  NT_167245.1  2605360-2725746    2.22 % in   5 repeats    0.00 % in 0 genes
15   119955  chr6  NT_167247.1  1172409-1292364    3.90 % in   8 repeats    0.00 % in 0 genes
16   115650  chr6  NT_167246.1  3259885-3375535    0.56 % in   4 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
494167  chr15  NT_037852.6  1397345-1891512    18  15       L2a (3)  L1M5 (2)  U2 (1) 
403510  chr6  NT_167244.1  2359391-2762901    3       L4 (1)  L1MEg (1)  AluSp (1) 
211617  chr6  NT_167244.1  4386646-4598263    11  8       MER57-int (3)  AluSx (2)  (TTTTA)n (1) 
191795  chr7  NT_023603.5  39772-231567    3       ALR/Alpha (4)  L1PA2 (2)  L1PA3 (1) 
183036  chr6  NT_167244.1  3787910-3970946    7       AT_rich (2)  MLT1H-int (1)  MIR (1) 
176052  chr6  NT_167244.1  3180254-3356306    3       GC_rich (1)  Charlie4a (1)  AluSp (1) 
172762  chr6  NT_167247.1  4421952-4594714    2       MER11A (1)  AluSc (1) 
167293  chr6  NT_167248.1  521847-689140    4       AT_rich (2)  L1PREC2 (1)  HERVH-int (1) 
164605  chr6  NT_167247.1  1562946-1727551    2       MIR (1)  AluSq (1) 
10  156248  chr9  NT_008470.19  21688517-21844765    13  10       LTR67B (2)  L2 (2)  L1M4b (2) 
11  156244  chr6  NT_167244.1  2008359-2164603    4       MIRb (1)  MIR (1)  AluY (1) 
12  144968  chr6  NT_167244.1  2892602-3037570    5       AluY (2)  (TCC)n (1)  MER21C (1) 
13  120502  chr6  NT_167244.1  1451387-1571889    24  15       L1MA1 (7)  MSTA (2)  AluSx (2) 
14  120386  chr6  NT_167245.1  2605360-2725746    4       L2 (2)  MLT1E2 (1)  L2a (1) 
15  119955  chr6  NT_167247.1  1172409-1292364    5       L2 (3)  ERV3-16A3_I-int (2)  MLT1E2 (1) 
16  115650  chr6  NT_167246.1  3259885-3375535    3       MIRb (2)  MIR3 (1)  AluSx (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
6   176052       chr6  NT_167244.1  3180254-3356306    TNXB  tenascin-X_isoform_1_precursor
7   172762       chr6  NT_167247.1  4421952-4594714    LOC100507722  hypothetical_protein_LOC100507722
8   167293       chr6  NT_167248.1  521847-689140    OR12D1P 



Posfai@neb.com
May 11, 2011