Distribution of restriction sites in the human genome

Enzyme:  MchCM4I               Longest uncut segments
Specificity:  GAGGAG               Repeats in uncut segments
Number of sites:  2147076               Genes in uncut segments
Mean distance between sites:  1332 base pairs
Standard deviation:  1797 base pairs
Site density 750.4 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488936  chr15  NT_037852.6  1396833-1885769    0.18 % in   6 repeats    0.00 % in 0 genes
2   404644  chr6  NT_167244.1  2357110-2761754    0.55 % in   9 repeats    0.00 % in 0 genes
3   263004  chrY  NT_011875.12  8455353-8718357    80.87 % in   27 repeats    0.00 % in 0 genes
4   212795  chr6  NT_167244.1  4386653-4599448    2.16 % in   15 repeats    0.00 % in 0 genes
5   181351  chr6  NT_167244.1  3789588-3970939    0.31 % in   3 repeats    0.00 % in 0 genes
6   175722  chr6  NT_167244.1  3180286-3356008    0.18 % in   2 repeats    0.00 % in 0 genes
7   173643  chr6  NT_167247.1  4422001-4595644    0.77 % in   4 repeats    100.00 % in 1 genes
8   165686  chr6  NT_167249.1  2138075-2303761    0.32 % in   5 repeats    0.00 % in 0 genes
9   159908  chr6  NT_167248.1  521873-681781    0.37 % in   2 repeats    0.00 % in 0 genes
10   159520  chr7  NT_023603.5  47104-206624    100.00 % in   6 repeats    0.00 % in 0 genes
11   152387  chr9  NT_008470.19  21692034-21844421    0.62 % in   4 repeats    0.00 % in 0 genes
12   146592  chr6  NT_167244.1  2894345-3040937    2.03 % in   18 repeats    0.00 % in 0 genes
13   118367  chr6  NT_167245.1  2605399-2723766    0.73 % in   2 repeats    0.00 % in 0 genes
14   115498  chr6  NT_167246.1  3260187-3375685    0.57 % in   4 repeats    0.00 % in 0 genes
15   115277  chr6  NT_167247.1  1177104-1292381    0.49 % in   1 repeats    0.00 % in 0 genes
16   114125  chr6  NT_167245.1  133611-247736    3.52 % in   12 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488936  chr15  NT_037852.6  1396833-1885769    6       MIRc (1)  MIRb (1)  L1M3 (1) 
404644  chr6  NT_167244.1  2357110-2761754    7       L4 (2)  AluJb (2)  MER8 (1) 
263004  chrY  NT_011875.12  8455353-8718357    27  10       LTR12B (15)  L1PA16 (4)  (TATAA)n (1) 
212795  chr6  NT_167244.1  4386653-4599448    15  11       MER57-int (3)  AluSx (3)  (TTTTA)n (1) 
181351  chr6  NT_167244.1  3789588-3970939    3       MLT1H-int (1)  MER52D (1)  AluJb (1) 
175722  chr6  NT_167244.1  3180286-3356008    2       Charlie4a (1)  AluSp (1) 
173643  chr6  NT_167247.1  4422001-4595644    4       (TTAAA)n (1)  MER11A (1)  AluSg/x (1) 
165686  chr6  NT_167249.1  2138075-2303761    3       L1MB8 (2)  AluSx (2)  AT_rich (1) 
159908  chr6  NT_167248.1  521873-681781    2       L1PREC2 (1)  HERVH-int (1) 
10  159520  chr7  NT_023603.5  47104-206624    3       ALR/Alpha (3)  L1PA2 (2)  L1PA3 (1) 
11  152387  chr9  NT_008470.19  21692034-21844421    3       LTR67B (2)  MIR3 (1)  L1M5 (1) 
12  146592  chr6  NT_167244.1  2894345-3040937    18  9       L1MC5 (6)  L2c (2)  AluY (2) 
13  118367  chr6  NT_167245.1  2605399-2723766    2       L2a (1)  L2 (1) 
14  115498  chr6  NT_167246.1  3260187-3375685    3       MIRb (2)  MIR3 (1)  AluSx (1) 
15  115277  chr6  NT_167247.1  1177104-1292381    1       ERV3-16A3_I-int (1) 
16  114125  chr6  NT_167245.1  133611-247736    12  10       L2c (2)  AluSx (2)  tRNA-Ala-GCY_ (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
7   173643       chr6  NT_167247.1  4422001-4595644    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011