Distribution of restriction sites in the human genome

Enzyme:  McaTI               Longest uncut segments
Specificity:  GCGCGC               Repeats in uncut segments
Number of sites:  71745               Genes in uncut segments
Mean distance between sites:  39882 base pairs
Standard deviation:  94447 base pairs
Site density 25.1 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   1938705  chrX  NT_167197.1  2087213-4025918    46.25 % in   3821 repeats    17.44 % in 2 genes
2   1770775  chr3  NT_005612.16  9561611-11332386    54.57 % in   2802 repeats    3.54 % in 4 genes
3   1641612  chr13  NT_024524.14  51776684-53418296    40.51 % in   2532 repeats    26.06 % in 3 genes
4   1610650  chrY  NT_011875.12  3769457-5380107    60.45 % in   2751 repeats    0.05 % in 1 genes
5   1480588  chr10  NT_030059.13  8925734-10406322    54.93 % in   2314 repeats    0.00 % in 0 genes
6   1428704  chrX  NT_011651.17  4625513-6054217    80.10 % in   2042 repeats    0.05 % in 2 genes
7   1427476  chr5  NT_034772.6  28299651-29727127    53.42 % in   2146 repeats    8.44 % in 7 genes
8   1409299  chr8  NT_167187.1  21401308-22810607    54.57 % in   2420 repeats    0.31 % in 5 genes
9   1370949  chrX  NT_011630.14  4144130-5515079    82.80 % in   1557 repeats    0.00 % in 0 genes
10   1356560  chr2  NT_005403.17  5964039-7320599    51.48 % in   2019 repeats    0.00 % in 0 genes
11   1350344  chrY  NT_011903.12  1049812-2400156    57.53 % in   1932 repeats    0.00 % in 0 genes
12   1347643  chr13  NT_024524.14  35006520-36354163    49.16 % in   2071 repeats    0.00 % in 0 genes
13   1328717  chrX  NT_011651.17  35258296-36587013    65.00 % in   2289 repeats    0.00 % in 0 genes
14   1327596  chr2  NT_022135.16  31309565-32637161    36.90 % in   1974 repeats    0.00 % in 0 genes
15   1311542  chr4  NT_006238.11  2361750-3673292    56.55 % in   2131 repeats    0.00 % in 0 genes
16   1299812  chr10  NT_030059.13  58114864-59414676    47.27 % in   2175 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
1938705  chrX  NT_167197.1  2087213-4025918    3821  454       AT_rich (302)  AluSx (192)  AluJo (189) 
1770775  chr3  NT_005612.16  9561611-11332386    2802  431       AT_rich (337)  L2a (72)  AluSx (68) 
1641612  chr13  NT_024524.14  51776684-53418296    2532  400       AT_rich (339)  MIR (83)  MIRb (82) 
1610650  chrY  NT_011875.12  3769457-5380107    2751  403       AT_rich (206)  AluSx (118)  AluJo (106) 
1480588  chr10  NT_030059.13  8925734-10406322    2314  415       AT_rich (240)  MIR (87)  MIRb (84) 
1428704  chrX  NT_011651.17  4625513-6054217    2042  361       AT_rich (110)  AluSx (48)  L1PA15 (45) 
1427476  chr5  NT_034772.6  28299651-29727127    2146  384       AT_rich (219)  L2a (58)  MIR (52) 
1409299  chr8  NT_167187.1  21401308-22810607    2420  406       AT_rich (136)  AluSx (108)  L2a (101) 
1370949  chrX  NT_011630.14  4144130-5515079    1557  323       AT_rich (58)  AluSx (47)  L1MA2 (41) 
10  1356560  chr2  NT_005403.17  5964039-7320599    2019  357       AT_rich (259)  MIR (62)  L2a (61) 
11  1350344  chrY  NT_011903.12  1049812-2400156    1932  281       BSR/Beta (173)  AT_rich (112)  AluSx (82) 
12  1347643  chr13  NT_024524.14  35006520-36354163    2071  386       AT_rich (209)  MIRb (81)  MIR (72) 
13  1328717  chrX  NT_011651.17  35258296-36587013    2289  394       AT_rich (115)  AluSx (106)  L2c (77) 
14  1327596  chr2  NT_022135.16  31309565-32637161    1974  349       AT_rich (255)  MIRb (92)  L2a (73) 
15  1311542  chr4  NT_006238.11  2361750-3673292    2131  390       AT_rich (187)  MIR (92)  L2a (85) 
16  1299812  chr10  NT_030059.13  58114864-59414676    2175  367       AT_rich (134)  MIR (113)  MIRb (111) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   1938705       chrX  NT_167197.1  2087213-4025918    LOC100287928 
NLGN4X  neuroligin-4,_X-linked_precursor
2   1770775       chr3  NT_005612.16  9561611-11332386    LOC644681 
LOC100128179 
TRNAE27P 
LOC391562 
3   1641612       chr13  NT_024524.14  51776684-53418296    LOC100288130  uncharacterized_protein_KIAA0802-like
LOC100421226 
RPL35AP31  dachshund_homolog_1_isoform_c
4   1610650       chrY  NT_011875.12  3769457-5380107    STSP1 
6   1428704       chrX  NT_011651.17  4625513-6054217    RPL22P22 
LOC266683 
7   1427476       chr5  NT_034772.6  28299651-29727127    PRR16  proline-rich_protein_16
RPL23AP44 
RPL18P3 
RSL24D1P10 
FTMT  ferritin,_mitochondrial_precursor
SRFBP1  serum_response_factor-binding_protein_1
LOX  protein-lysine_6-oxidase_isoform_2
8   1409299       chr8  NT_167187.1  21401308-22810607    VENTXP5 
RPL6P22 
CYCSP3 
RPL10AP3 
RPL21P80 



Posfai@neb.com
May 11, 2011