Distribution of restriction sites in the human genome

Enzyme:  NspI               Longest uncut segments
Specificity:  RCATGY               Repeats in uncut segments
Number of sites:  3074605               Genes in uncut segments
Mean distance between sites:  930 base pairs
Standard deviation:  1020 base pairs
Site density1074.5 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488547  chr15  NT_037852.6  1397291-1885838    0.12 % in   5 repeats    0.00 % in 0 genes
2   403824  chr6  NT_167244.1  2359809-2763633    0.09 % in   2 repeats    0.00 % in 0 genes
3   209873  chr6  NT_167244.1  4388922-4598795    0.93 % in   9 repeats    0.00 % in 0 genes
4   181734  chr6  NT_167244.1  3789094-3970828    0.39 % in   5 repeats    0.00 % in 0 genes
5   175929  chr6  NT_167244.1  3180308-3356237    0.18 % in   2 repeats    0.03 % in 1 genes
6   172249  chr6  NT_167247.1  4422056-4594305    0.03 % in   1 repeats    100.00 % in 1 genes
7   166748  chr6  NT_167249.1  2137851-2304599    0.74 % in   8 repeats    0.00 % in 0 genes
8   165952  chr6  NT_167247.1  1562298-1728250    0.43 % in   5 repeats    0.39 % in 1 genes
9   162584  chr6  NT_167248.1  520519-683103    2.01 % in   2 repeats    0.00 % in 0 genes
10   150535  chr9  NT_008470.19  21693281-21843816    0.04 % in   1 repeats    0.00 % in 0 genes
11   148128  chr6  NT_167244.1  2892009-3040137    2.79 % in   22 repeats    0.00 % in 0 genes
12   122092  chr6  NT_167245.1  2603957-2726049    2.99 % in   9 repeats    0.00 % in 0 genes
13   117554  chr6  NT_167247.1  1176186-1293740    1.25 % in   2 repeats    0.00 % in 0 genes
14   114578  chr6  NT_167246.1  3260375-3374953    0.32 % in   3 repeats    0.00 % in 0 genes
15   110322  chr6  NT_167245.1  135900-246222    2.02 % in   4 repeats    0.00 % in 0 genes
16   107351  chr6  NT_167244.1  1449927-1557278    1.54 % in   6 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488547  chr15  NT_037852.6  1397291-1885838    5       MIRc (1)  MIRb (1)  L1M3 (1) 
403824  chr6  NT_167244.1  2359809-2763633    2       L1MEg (1)  AluSp (1) 
209873  chr6  NT_167244.1  4388922-4598795    7       MER57-int (2)  AluSx (2)  (TTCC)n (1) 
181734  chr6  NT_167244.1  3789094-3970828    5       MLT1H-int (1)  MIR (1)  MER52D (1) 
175929  chr6  NT_167244.1  3180308-3356237    2       Charlie4a (1)  AluSp (1) 
172249  chr6  NT_167247.1  4422056-4594305    1       AluSc (1) 
166748  chr6  NT_167249.1  2137851-2304599    4       L1MB8 (3)  AluSx (3)  L1MC4a (1) 
165952  chr6  NT_167247.1  1562298-1728250    4       MIR (2)  (GGAA)n (1)  A-rich (1) 
162584  chr6  NT_167248.1  520519-683103    2       L1PREC2 (1)  HERVH-int (1) 
10  150535  chr9  NT_008470.19  21693281-21843816    1       MIR3 (1) 
11  148128  chr6  NT_167244.1  2892009-3040137    22  12       L1MC5 (6)  AluY (3)  AluSc (3) 
12  122092  chr6  NT_167245.1  2603957-2726049    8       L2 (2)  MLT1N2 (1)  MLT1E2 (1) 
13  117554  chr6  NT_167247.1  1176186-1293740    1       ERV3-16A3_I-int (2) 
14  114578  chr6  NT_167246.1  3260375-3374953    3       MIRb (1)  MIR3 (1)  AluSx (1) 
15  110322  chr6  NT_167245.1  135900-246222    4       MLT1E2 (1)  MER6 (1)  MER39 (1) 
16  107351  chr6  NT_167244.1  1449927-1557278    6       L1MA1 (1)  ERV3-16A3_I-int (1)  AT_rich (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   175929       chr6  NT_167244.1  3180308-3356237    TNXB  tenascin-X_isoform_1_precursor
6   172249       chr6  NT_167247.1  4422056-4594305    LOC100507722  hypothetical_protein_LOC100507722
8   165952       chr6  NT_167247.1  1562298-1728250    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011