Distribution of restriction sites in the human genome

Enzyme:  EcoHK31I               Longest uncut segments
Specificity:  YGGCCR               Repeats in uncut segments
Number of sites:  1725297               Genes in uncut segments
Mean distance between sites:  1658 base pairs
Standard deviation:  2054 base pairs
Site density 603.0 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   490107  chr15  NT_037852.6  1397710-1887817    0.16 % in   6 repeats    0.00 % in 0 genes
2   404820  chr6  NT_167244.1  2357901-2762721    0.45 % in   9 repeats    0.00 % in 0 genes
3   246260  chr6  NT_167244.1  2008701-2254961    0.95 % in   12 repeats    2.06 % in 2 genes
4   212562  chr6  NT_167244.1  4386536-4599098    2.16 % in   14 repeats    0.00 % in 0 genes
5   181071  chr6  NT_167244.1  3790304-3971375    0.43 % in   5 repeats    0.00 % in 0 genes
6   176519  chr6  NT_167244.1  3180246-3356765    0.31 % in   4 repeats    0.33 % in 1 genes
7   173734  chr6  NT_167247.1  4420635-4594369    0.32 % in   6 repeats    100.00 % in 1 genes
8   172157  chr6  NT_167247.1  1559921-1732078    2.14 % in   17 repeats    1.76 % in 1 genes
9   167458  chr6  NT_167249.1  2136066-2303524    1.08 % in   9 repeats    0.00 % in 0 genes
10   164028  chrY  NT_011875.12  8555055-8719083    69.38 % in   20 repeats    0.00 % in 0 genes
11   163483  chr6  NT_167248.1  521836-685319    2.55 % in   2 repeats    0.00 % in 0 genes
12   154823  chr7  NT_023603.5  39589-194412    100.00 % in   2 repeats    0.00 % in 0 genes
13   151166  chr9  NT_008470.19  21692803-21843969    0.35 % in   3 repeats    0.00 % in 0 genes
14   142914  chr6  NT_167244.1  2894568-3037482    0.06 % in   1 repeats    0.00 % in 0 genes
15   124532  chr14  NT_026437.12  196010-320542    99.64 % in   9 repeats    0.00 % in 0 genes
16   120808  chr22  NT_028395.3  456842-577650    99.61 % in   8 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
490107  chr15  NT_037852.6  1397710-1887817    6       MLT1L (1)  MIRc (1)  MIRb (1) 
404820  chr6  NT_167244.1  2357901-2762721    7       L4 (2)  AluJb (2)  L1MEg (1) 
246260  chr6  NT_167244.1  2008701-2254961    12  10       MIRb (2)  MIR (2)  MER5A1 (1) 
212562  chr6  NT_167244.1  4386536-4599098    14  10       MER57-int (3)  AluSx (3)  (TTTTA)n (1) 
181071  chr6  NT_167244.1  3790304-3971375    5       MLT1H-int (1)  MER52D (1)  LTR19B (1) 
176519  chr6  NT_167244.1  3180246-3356765    4       GC_rich (1)  Charlie4a (1)  AluSx (1) 
173734  chr6  NT_167247.1  4420635-4594369    6       MIR (1)  MER11A (1)  L2b (1) 
172157  chr6  NT_167247.1  1559921-1732078    17  14       Tigger7 (2)  MIR (2)  L1MEe (2) 
167458  chr6  NT_167249.1  2136066-2303524    8       AluSx (2)  MLT1A (1)  MamGypLTR1b (1) 
10  164028  chrY  NT_011875.12  8555055-8719083    20  9       LTR12B (9)  L1PA16 (4)  (TATAA)n (1) 
11  163483  chr6  NT_167248.1  521836-685319    2       L1PREC2 (1)  HERVH-int (1) 
12  154823  chr7  NT_023603.5  39589-194412    2       L1PA2 (1)  ALR/Alpha (1) 
13  151166  chr9  NT_008470.19  21692803-21843969    3       MIR3 (1)  LTR67B (1)  L1M5 (1) 
14  142914  chr6  NT_167244.1  2894568-3037482    1       AluSg1 (1) 
15  124532  chr14  NT_026437.12  196010-320542    6       CER (4)  L1PA4 (1)  AT_rich (1) 
16  120808  chr22  NT_028395.3  456842-577650    5       CER (4)  L1PA4 (1)  AluSx (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
3   246260       chr6  NT_167244.1  2008701-2254961    FLOT1  flotillin-1
DDR1  epithelial_discoidin_domain-containing_receptor_1_isoform_DDR1c
6   176519       chr6  NT_167244.1  3180246-3356765    TNXB  tenascin-X_isoform_1_precursor
7   173734       chr6  NT_167247.1  4420635-4594369    LOC100507722  hypothetical_protein_LOC100507722
8   172157       chr6  NT_167247.1  1559921-1732078    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011