Distribution of restriction sites in the human genome

Enzyme:  Bsu36I               Longest uncut segments
Specificity:  CCTNAGG               Repeats in uncut segments
Number of sites:  938521               Genes in uncut segments
Mean distance between sites:  3048 base pairs
Standard deviation:  3496 base pairs
Site density 328.0 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   508316  chr15  NT_037852.6  1396143-1904459    1.37 % in   38 repeats    1.96 % in 1 genes
2   406268  chr6  NT_167244.1  2357112-2763380    0.60 % in   10 repeats    0.00 % in 0 genes
3   214720  chr6  NT_167244.1  4388201-4602921    2.68 % in   15 repeats    0.00 % in 0 genes
4   183484  chr6  NT_167244.1  3789376-3972860    1.14 % in   12 repeats    0.00 % in 0 genes
5   182633  chr6  NT_167248.1  506482-689115    10.72 % in   18 repeats    0.48 % in 1 genes
6   179014  chr6  NT_167244.1  3177047-3356061    0.98 % in   19 repeats    1.78 % in 1 genes
7   172878  chr6  NT_167247.1  4421887-4594765    0.30 % in   2 repeats    100.00 % in 1 genes
8   167511  chr6  NT_167249.1  2136039-2303550    1.11 % in   9 repeats    0.00 % in 0 genes
9   166229  chr6  NT_167247.1  1561181-1727410    0.73 % in   5 repeats    0.00 % in 0 genes
10   162051  chrY  NT_011875.12  8497594-8659645    69.07 % in   9 repeats    0.00 % in 0 genes
11   157086  chr6  NT_167244.1  2008727-2165813    0.26 % in   3 repeats    0.00 % in 0 genes
12   154957  chr7  NT_023603.5  40976-195933    100.00 % in   3 repeats    0.00 % in 0 genes
13   154630  chr9  NT_008470.19  21690159-21844789    1.71 % in   10 repeats    0.00 % in 0 genes
14   146573  chr6  NT_167244.1  2892356-3038929    1.84 % in   12 repeats    0.00 % in 0 genes
15   126273  chr1  NT_077389.3  264830-391103    99.54 % in   54 repeats    0.00 % in 0 genes
16   125450  chr10  NT_008705.16  38711947-38837397    27.11 % in   221 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
508316  chr15  NT_037852.6  1396143-1904459    38  26       AT_rich (5)  (TA)n (3)  L2a (3) 
406268  chr6  NT_167244.1  2357112-2763380    10  8       L4 (2)  AluJb (2)  MER8 (1) 
214720  chr6  NT_167244.1  4388201-4602921    15  11       MER57-int (2)  HERVH-int (2)  AluSx (2) 
183484  chr6  NT_167244.1  3789376-3972860    12  11       MLT1H-int (2)  (TA)n (1)  MLT1H (1) 
182633  chr6  NT_167248.1  506482-689115    18  15       MER4D (2)  L1PA14 (2)  AT_rich (2) 
179014  chr6  NT_167244.1  3177047-3356061    19  13       GC_rich (3)  AluSx (3)  MER44B (2) 
172878  chr6  NT_167247.1  4421887-4594765    2       MER11A (1)  AluSc (1) 
167511  chr6  NT_167249.1  2136039-2303550    8       AluSx (2)  MLT1A (1)  MamGypLTR1b (1) 
166229  chr6  NT_167247.1  1561181-1727410    5       MIRc (1)  MIR (1)  L1MC3 (1) 
10  162051  chrY  NT_011875.12  8497594-8659645    2       LTR12B (8)  LTR12D (1) 
11  157086  chr6  NT_167244.1  2008727-2165813    3       MIRb (1)  MIR (1)  AluSx (1) 
12  154957  chr7  NT_023603.5  40976-195933    2       L1PA2 (2)  ALR/Alpha (1) 
13  154630  chr9  NT_008470.19  21690159-21844789    10  7       LTR67B (2)  L2 (2)  L1M4b (2) 
14  146573  chr6  NT_167244.1  2892356-3038929    12  8       L1MC5 (2)  AluY (2)  AluSc (2) 
15  126273  chr1  NT_077389.3  264830-391103    54  3       ALR/Alpha (52)  MLT1J (1)  L1HS (1) 
16  125450  chr10  NT_008705.16  38711947-38837397    221  35       GA-rich (24)  (GAATG)n (22)  (AAATG)n (22) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   508316       chr15  NT_037852.6  1396143-1904459    LOC100418897 
5   182633       chr6  NT_167248.1  506482-689115    OR12D1P 
6   179014       chr6  NT_167244.1  3177047-3356061    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
7   172878       chr6  NT_167247.1  4421887-4594765    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011