Distribution of restriction sites in the human genome

Enzyme:  SpoDI               Longest uncut segments
Specificity:  GCGGRAG               Repeats in uncut segments
Number of sites:  202152               Genes in uncut segments
Mean distance between sites:  14154 base pairs
Standard deviation:  21809 base pairs
Site density 70.6 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   522665  chr15  NT_037852.6  1380920-1903585    3.76 % in   73 repeats    1.91 % in 1 genes
2   492552  chrY  NT_011875.12  8302390-8794942    80.68 % in   293 repeats    0.66 % in 4 genes
3   480351  chr6  NT_025741.15  32127660-32608011    46.38 % in   702 repeats    74.94 % in 3 genes
4   416216  chr6  NT_167244.1  2349240-2765456    2.11 % in   38 repeats    0.00 % in 0 genes
5   394410  chr19  NT_011109.16  1-394411    99.77 % in   99 repeats    0.00 % in 0 genes
6   388860  chr4  NT_022778.16  10858628-11247488    46.66 % in   615 repeats    33.08 % in 10 genes
7   384161  chr14  NT_026437.12  8813191-9197352    56.23 % in   598 repeats    85.70 % in 1 genes
8   356015  chrX  NT_011651.17  4428142-4784157    82.77 % in   544 repeats    0.00 % in 0 genes
9   355802  chr2  NT_022184.15  63537603-63893405    55.26 % in   540 repeats    0.00 % in 0 genes
10   349871  chr1  NT_032977.9  50852879-51202750    51.16 % in   520 repeats    0.00 % in 0 genes
11   347750  chr11  NT_167190.1  1-347751    96.64 % in   112 repeats    0.00 % in 0 genes
12   336190  chrY  NT_011875.12  6855410-7191600    53.69 % in   482 repeats    0.00 % in 0 genes
13   334746  chr11  NT_033899.8  2253600-2588346    53.95 % in   480 repeats    0.00 % in 0 genes
14   333427  chr2  NT_005403.17  6297227-6630654    55.41 % in   475 repeats    0.00 % in 0 genes
15   330571  chr2  NT_005403.17  13474317-13804888    39.39 % in   448 repeats    0.00 % in 0 genes
16   324053  chr6  NT_167244.1  437347-761400    20.53 % in   199 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
522665  chr15  NT_037852.6  1380920-1903585    73  40       Tigger2 (6)  L1MDa (6)  AT_rich (5) 
492552  chrY  NT_011875.12  8302390-8794942    293  109       AT_rich (24)  LTR12B (17)  AluY (14) 
480351  chr6  NT_025741.15  32127660-32608011    702  216       AT_rich (69)  L2a (34)  MIR (27) 
416216  chr6  NT_167244.1  2349240-2765456    38  26       AluJb (4)  L1ME4a (3)  AluSx (3) 
394410  chr19  NT_011109.16  1-394411    99  19       ALR/Alpha (57)  L1PA3 (14)  L1PA4 (7) 
388860  chr4  NT_022778.16  10858628-11247488    615  185       AT_rich (95)  L2a (24)  MIRb (22) 
384161  chr14  NT_026437.12  8813191-9197352    598  191       AT_rich (71)  L2a (21)  MIR (18) 
356015  chrX  NT_011651.17  4428142-4784157    544  183       AT_rich (26)  (TA)n (16)  AluSx (15) 
355802  chr2  NT_022184.15  63537603-63893405    540  178       AT_rich (26)  L2a (18)  AluSx (17) 
10  349871  chr1  NT_032977.9  50852879-51202750    520  186       AT_rich (57)  MIRb (19)  MIR (18) 
11  347750  chr11  NT_167190.1  1-347751    112  29       ALR/Alpha (55)  L1PA4 (7)  L1P1 (6) 
12  336190  chrY  NT_011875.12  6855410-7191600    482  113       AT_rich (38)  AluSx (36)  HUERS-P3b-int (20) 
13  334746  chr11  NT_033899.8  2253600-2588346    480  174       AT_rich (59)  L2a (16)  MIR (15) 
14  333427  chr2  NT_005403.17  6297227-6630654    475  176       AT_rich (58)  AluSx (15)  MIR (11) 
15  330571  chr2  NT_005403.17  13474317-13804888    448  160       AT_rich (42)  MIRb (21)  MIR (20) 
16  324053  chr6  NT_167244.1  437347-761400    199  94       AT_rich (22)  L1PA7 (6)  L1MEf (6) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   522665       chr15  NT_037852.6  1380920-1903585    LOC100418897 
2   492552       chrY  NT_011875.12  8302390-8794942    RCC2P2 
ZNF886P 
ZNF884P 
ZNF885P 
3   480351       chr6  NT_025741.15  32127660-32608011    LOC100421513 
MRPS17P5  protein_THEMIS_isoform_3
PTPRK  receptor-type_tyrosine-protein_phosphatase_kappa_isoform_b
6   388860       chr4  NT_022778.16  10858628-11247488    SULT1D1P 
SULT1E1  estrogen_sulfotransferase
CSN1S1  alpha-S1-casein_isoform_2
CSN2  beta-casein_precursor
STATH  statherin_isoform_b
HTN3  histatin-3
HTN1  histatin-1_precursor
CSN1S2A  casein_alpha_s2-like_A
CSN1S2B  casein_alpha_s2-like_B
C4orf40  hypothetical_protein_LOC401137_precursor
7   384161       chr14  NT_026437.12  8813191-9197352    LOC100505967  hypothetical_LOC100505967,_transcript_variant_3



Posfai@neb.com
May 11, 2011