Distribution of restriction sites in the human genome

Enzyme:  NspIII               Longest uncut segments
Specificity:  CYCGRG               Repeats in uncut segments
Number of sites:  999012               Genes in uncut segments
Mean distance between sites:  2864 base pairs
Standard deviation:  4569 base pairs
Site density 349.1 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   494271  chr15  NT_037852.6  1397344-1891615    0.78 % in   18 repeats    0.00 % in 0 genes
2   405383  chr6  NT_167244.1  2357702-2763085    0.51 % in   9 repeats    0.00 % in 0 genes
3   219502  chr7  NT_023603.5  17024-236526    98.59 % in   26 repeats    0.00 % in 0 genes
4   213892  chr6  NT_167244.1  4386823-4600715    2.30 % in   17 repeats    0.00 % in 0 genes
5   197222  chr6  NT_167244.1  3790000-3987222    4.82 % in   32 repeats    0.00 % in 0 genes
6   183952  chrX  NT_011669.17  94561-278513    99.54 % in   37 repeats    0.00 % in 0 genes
7   180809  chr6  NT_167248.1  518903-699712    7.66 % in   24 repeats    1.86 % in 2 genes
8   175179  chr6  NT_167247.1  4420608-4595787    1.03 % in   8 repeats    100.00 % in 1 genes
9   175124  chr6  NT_167244.1  3180253-3355377    0.05 % in   2 repeats    0.00 % in 0 genes
10   169592  chr6  NT_167249.1  2133840-2303432    1.91 % in   15 repeats    0.00 % in 0 genes
11   164626  chr6  NT_167247.1  1562924-1727550    0.21 % in   2 repeats    0.00 % in 0 genes
12   156107  chr6  NT_167244.1  2008865-2164972    0.18 % in   2 repeats    0.00 % in 0 genes
13   151912  chr9  NT_008470.19  21691760-21843672    0.77 % in   5 repeats    0.00 % in 0 genes
14   146125  chr6  NT_167244.1  2893127-3039252    1.54 % in   13 repeats    0.00 % in 0 genes
15   137409  chr5  NW_003315917.1  1145024-1282433    13.39 % in   60 repeats    0.00 % in 0 genes
16   132803  chr9  NT_078070.3  956397-1089200    59.85 % in   26 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
494271  chr15  NT_037852.6  1397344-1891615    18  15       L2a (3)  L1M5 (2)  U2 (1) 
405383  chr6  NT_167244.1  2357702-2763085    7       L4 (2)  AluJb (2)  L1MEg (1) 
219502  chr7  NT_023603.5  17024-236526    26  14       ALR/Alpha (6)  L1PA2 (4)  AT_rich (3) 
213892  chr6  NT_167244.1  4386823-4600715    17  13       MER57-int (3)  AluSx (2)  AluSg/x (2) 
197222  chr6  NT_167244.1  3790000-3987222    32  25       L2a (6)  MLT1H-int (2)  L1M5 (2) 
183952  chrX  NT_011669.17  94561-278513    37  11       ALR/Alpha (19)  L1PA2 (4)  L1PA3 (3) 
180809  chr6  NT_167248.1  518903-699712    24  17       AT_rich (5)  L1MA9 (3)  L1MC5 (2) 
175179  chr6  NT_167247.1  4420608-4595787    8       (TTAAA)n (1)  MIR (1)  MER11A (1) 
175124  chr6  NT_167244.1  3180253-3355377    2       GC_rich (1)  AluSp (1) 
10  169592  chr6  NT_167249.1  2133840-2303432    15  10       MLT1H1 (2)  MLT1A (2)  AluSx (2) 
11  164626  chr6  NT_167247.1  1562924-1727550    2       MIR (1)  AluSq (1) 
12  156107  chr6  NT_167244.1  2008865-2164972    2       MIRb (1)  MIR (1) 
13  151912  chr9  NT_008470.19  21691760-21843672    4       LTR67B (2)  MSTA (1)  MIR3 (1) 
14  146125  chr6  NT_167244.1  2893127-3039252    13  7       L1MC5 (3)  AluSc (3)  AluY (2) 
15  137409  chr5  NW_003315917.1  1145024-1282433    60  37       AT_rich (8)  MLT1A (3)  L1PA3 (3) 
16  132803  chr9  NT_078070.3  956397-1089200    26  13       ERVL-E-int (5)  ALR/Alpha (3)  (TAA)n (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
7   180809       chr6  NT_167248.1  518903-699712    OR12D1P 
OR11A1  olfactory_receptor_11A1
8   175179       chr6  NT_167247.1  4420608-4595787    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011