Distribution of restriction sites in the human genome

Enzyme:  MseI               Longest uncut segments
Specificity:  TTAA               Repeats in uncut segments
Number of sites:  19045642               Genes in uncut segments
Mean distance between sites:  150 base pairs
Standard deviation:  214 base pairs
Site density6656.2 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   402118  chr6  NT_167244.1  2359285-2761403    0.11 % in   2 repeats    0.00 % in 0 genes
2   208264  chr6  NT_167244.1  4389729-4597993    0.19 % in   4 repeats    0.00 % in 0 genes
3   180943  chr6  NT_167244.1  3789987-3970930    0.32 % in   3 repeats    0.00 % in 0 genes
4   175275  chr6  NT_167244.1  3180294-3355569    0.16 % in   2 repeats    0.00 % in 0 genes
5   173049  chr6  NT_167247.1  4421447-4594496    0.15 % in   3 repeats    100.00 % in 1 genes
6   165286  chr6  NT_167249.1  2138378-2303664    0.24 % in   5 repeats    0.00 % in 0 genes
7   164315  chr6  NT_167247.1  1562412-1726727    0.02 % in   1 repeats    0.33 % in 1 genes
8   159653  chr6  NT_167248.1  521571-681224    0.21 % in   2 repeats    0.00 % in 0 genes
9   156705  chr6  NT_167244.1  2009678-2166383    0.01 % in   1 repeats    0.00 % in 0 genes
10   143062  chr6  NT_167244.1  2894550-3037612    0.15 % in   3 repeats    0.00 % in 0 genes
11   118141  chr6  NT_167245.1  2605722-2723863    0.52 % in   3 repeats    0.00 % in 0 genes
12   115954  chr6  NT_167247.1  1177448-1293402    0.19 % in   1 repeats    0.00 % in 0 genes
13   109612  chr6  NT_167245.1  136526-246138    1.56 % in   3 repeats    0.00 % in 0 genes
14   105479  chr6  NT_167244.1  1451070-1556549    0.73 % in   3 repeats    0.00 % in 0 genes
15   105030  chr6  NT_167244.1  1833591-1938621    0.74 % in   4 repeats    0.00 % in 0 genes
16   103237  chr6  NT_167244.1  3490943-3594180    0.12 % in   2 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
402118  chr6  NT_167244.1  2359285-2761403    2       L4 (1)  AluSp (1) 
208264  chr6  NT_167244.1  4389729-4597993    4       (TTCC)n (1)  MER57-int (1)  AluSg/x (1) 
180943  chr6  NT_167244.1  3789987-3970930    3       MLT1H-int (1)  MER52D (1)  AluJb (1) 
175275  chr6  NT_167244.1  3180294-3355569    2       Charlie4a (1)  AluSp (1) 
173049  chr6  NT_167247.1  4421447-4594496    3       MIR (1)  MER11A (1)  AluSc (1) 
165286  chr6  NT_167249.1  2138378-2303664    3       L1MB8 (2)  AluSx (2)  AT_rich (1) 
164315  chr6  NT_167247.1  1562412-1726727    1       A-rich (1) 
159653  chr6  NT_167248.1  521571-681224    2       L1PREC2 (1)  HERVH-int (1) 
156705  chr6  NT_167244.1  2009678-2166383    1       MER5A1 (1) 
10  143062  chr6  NT_167244.1  2894550-3037612    3       L1MC5 (1)  AluY (1)  AluSg1 (1) 
11  118141  chr6  NT_167245.1  2605722-2723863    3       MLT1E2 (1)  L2a (1)  L2 (1) 
12  115954  chr6  NT_167247.1  1177448-1293402    1       ERV3-16A3_I-int (1) 
13  109612  chr6  NT_167245.1  136526-246138    3       MLT1E2 (1)  MER6 (1)  LTR12C (1) 
14  105479  chr6  NT_167244.1  1451070-1556549    3       ERV3-16A3_I-int (1)  AluY (1)  AluSg1 (1) 
15  105030  chr6  NT_167244.1  1833591-1938621    3       AluSx (2)  MIR (1)  AluSg/x (1) 
16  103237  chr6  NT_167244.1  3490943-3594180    2       L1M2 (1)  AluS (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   173049       chr6  NT_167247.1  4421447-4594496    LOC100507722  hypothetical_protein_LOC100507722
7   164315       chr6  NT_167247.1  1562412-1726727    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011