Distribution of restriction sites in the human genome

Enzyme:  NgoBI               Longest uncut segments
Specificity:  RGCGCY               Repeats in uncut segments
Number of sites:  549280               Genes in uncut segments
Mean distance between sites:  5209 base pairs
Standard deviation:  8358 base pairs
Site density 192.0 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   494438  chr15  NT_037852.6  1397157-1891595    0.82 % in   18 repeats    0.00 % in 0 genes
2   406639  chr6  NT_167244.1  2357670-2764309    0.56 % in   10 repeats    0.00 % in 0 genes
3   221084  chr6  NT_167244.1  4387607-4608691    5.43 % in   24 repeats    0.00 % in 0 genes
4   196641  chr6  NT_167244.1  3774540-3971181    2.59 % in   24 repeats    6.59 % in 1 genes
5   195479  chr6  NT_007299.13  235208-430687    57.67 % in   147 repeats    0.27 % in 1 genes
6   195107  chr6  NT_167248.1  504585-699692    13.88 % in   42 repeats    1.72 % in 2 genes
7   186270  chr6  NT_167247.1  1550691-1736961    7.41 % in   58 repeats    6.58 % in 1 genes
8   177083  chr6  NT_167244.1  3179938-3357021    0.41 % in   6 repeats    0.63 % in 2 genes
9   176686  chr6  NT_167247.1  4421805-4598491    1.74 % in   12 repeats    0.00 % in 0 genes
10   175938  chr6  NT_167249.1  2129852-2305790    4.44 % in   33 repeats    0.00 % in 0 genes
11   173815  chrY  NT_011875.12  8482774-8656589    71.16 % in   9 repeats    0.00 % in 0 genes
12   169638  chr4  NT_167250.1  315222-484860    67.55 % in   273 repeats    0.00 % in 0 genes
13   169607  chr4  NT_022778.16  9813669-9983276    67.59 % in   269 repeats    0.00 % in 0 genes
14   160322  chr9  NT_008470.19  21684459-21844781    4.22 % in   22 repeats    0.00 % in 0 genes
15   159808  chr7  NT_077528.2  300515-460323    26.09 % in   193 repeats    0.00 % in 0 genes
16   155593  chr6  NT_167244.1  2009060-2164653    0.07 % in   1 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
494438  chr15  NT_037852.6  1397157-1891595    18  15       L2a (3)  L1M5 (2)  U2 (1) 
406639  chr6  NT_167244.1  2357670-2764309    10  8       L4 (2)  AluJb (2)  L1MEg (1) 
221084  chr6  NT_167244.1  4387607-4608691    24  14       HERVH-int (4)  AluSx (4)  MER57-int (2) 
196641  chr6  NT_167244.1  3774540-3971181    24  16       MIR (3)  L2a (3)  AT_rich (3) 
195479  chr6  NT_007299.13  235208-430687    147  80       ALR/Alpha (16)  LTR49-int (12)  AT_rich (6) 
195107  chr6  NT_167248.1  504585-699692    42  32       AT_rich (5)  L1MA9 (3)  MER4D (2) 
186270  chr6  NT_167247.1  1550691-1736961    58  37       L1PB2 (4)  MIRc (3)  MIR3 (3) 
177083  chr6  NT_167244.1  3179938-3357021    5       GC_rich (2)  Charlie4a (1)  (CCG)n (1) 
176686  chr6  NT_167247.1  4421805-4598491    12  9       AluSx (3)  MLT1J (2)  (TTAAA)n (1) 
10  175938  chr6  NT_167249.1  2129852-2305790    33  18       AluSx (5)  MamGypLTR1b (3)  L1MB8 (3) 
11  173815  chrY  NT_011875.12  8482774-8656589    2       LTR12B (8)  LTR12D (1) 
12  169638  chr4  NT_167250.1  315222-484860    273  108       AT_rich (29)  L1MB2 (14)  L1M4b (8) 
13  169607  chr4  NT_022778.16  9813669-9983276    269  106       AT_rich (26)  L1MB2 (13)  L1M4b (8) 
14  160322  chr9  NT_008470.19  21684459-21844781    22  15       L1M5 (3)  MER5B (2)  LTR67B (2) 
15  159808  chr7  NT_077528.2  300515-460323    193  47       (GAATG)n (20)  AT_rich (20)  (CGAAT)n (18) 
16  155593  chr6  NT_167244.1  2009060-2164653    1       MIRb (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
4   196641       chr6  NT_167244.1  3774540-3971181    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor
5   195479       chr6  NT_007299.13  235208-430687    MTRNR2L9  MTRNR2-like_9
6   195107       chr6  NT_167248.1  504585-699692    OR12D1P 
OR11A1  olfactory_receptor_11A1
7   186270       chr6  NT_167247.1  1550691-1736961    LOC100421582  tripartite_motif-containing_protein_26
8   177083       chr6  NT_167244.1  3179938-3357021    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor



Posfai@neb.com
May 11, 2011