Distribution of restriction sites in the human genome

Enzyme:  SfoI               Longest uncut segments
Specificity:  GGCGCC               Repeats in uncut segments
Number of sites:  228914               Genes in uncut segments
Mean distance between sites:  12499 base pairs
Standard deviation:  19651 base pairs
Site density 80.0 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   494438  chr15  NT_037852.6  1397157-1891595    0.82 % in   18 repeats    0.00 % in 0 genes
2   484030  chrX  NT_011669.17  4597559-5081589    80.99 % in   713 repeats    0.34 % in 2 genes
3   417901  chr6  NT_167244.1  2357670-2775571    1.88 % in   35 repeats    0.00 % in 0 genes
4   391733  chrX  NT_011651.17  8876031-9267764    54.48 % in   531 repeats    100.00 % in 1 genes
5   378671  chr11  NT_009237.18  50309325-50687996    98.01 % in   103 repeats    2.77 % in 1 genes
6   352567  chr7  NT_007933.15  1-352568    99.53 % in   79 repeats    0.00 % in 0 genes
7   340581  chr20  NT_011362.10  11543138-11883719    46.12 % in   704 repeats    100.00 % in 1 genes
8   339805  chr2  NT_022184.15  685852-1025657    41.98 % in   489 repeats    0.00 % in 0 genes
9   328419  chr19  NT_011109.16  65958-394377    99.77 % in   78 repeats    0.00 % in 0 genes
10   319218  chrY  NT_011875.12  8412519-8731737    82.55 % in   71 repeats    0.00 % in 0 genes
11   315930  chrX  NT_011651.17  22176944-22492874    63.84 % in   402 repeats    0.00 % in 0 genes
12   315111  chr7  NT_007933.15  53536064-53851175    43.30 % in   447 repeats    0.00 % in 0 genes
13   308867  chr12  NT_029419.12  45793820-46102687    57.41 % in   448 repeats    0.00 % in 0 genes
14   301494  chr3  NT_005612.16  67866158-68167652    58.19 % in   475 repeats    0.00 % in 0 genes
15   295185  chr2  NT_022184.15  28034881-28330066    50.49 % in   451 repeats    0.00 % in 0 genes
16   291097  chr8  NT_008046.16  51103248-51394345    56.60 % in   502 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
494438  chr15  NT_037852.6  1397157-1891595    18  15       L2a (3)  L1M5 (2)  U2 (1) 
484030  chrX  NT_011669.17  4597559-5081589    713  181       MIRb (39)  MIRc (24)  MIR (24) 
417901  chr6  NT_167244.1  2357670-2775571    35  22       AluY (4)  L4 (3)  AluJo (3) 
391733  chrX  NT_011651.17  8876031-9267764    531  148       AT_rich (59)  MIR (20)  MIRb (15) 
378671  chr11  NT_009237.18  50309325-50687996    103  34       ALR/Alpha (35)  L1PA4 (7)  L1PA3 (7) 
352567  chr7  NT_007933.15  1-352568    79  16       ALR/Alpha (45)  L1PA4 (7)  L1PA2 (6) 
340581  chr20  NT_011362.10  11543138-11883719    704  181       MIRb (67)  MIR (57)  L2a (36) 
339805  chr2  NT_022184.15  685852-1025657    489  163       AT_rich (40)  MIRb (34)  MIR (20) 
328419  chr19  NT_011109.16  65958-394377    78  15       ALR/Alpha (47)  L1PA3 (9)  L1PA4 (7) 
10  319218  chrY  NT_011875.12  8412519-8731737    71  31       LTR12B (17)  L1PA16 (7)  L1ME3A (6) 
11  315930  chrX  NT_011651.17  22176944-22492874    402  147       AT_rich (38)  MIRb (18)  MIR (11) 
12  315111  chr7  NT_007933.15  53536064-53851175    447  147       AT_rich (54)  MIRb (17)  MIR (17) 
13  308867  chr12  NT_029419.12  45793820-46102687    448  168       AT_rich (37)  L2a (27)  MIR (12) 
14  301494  chr3  NT_005612.16  67866158-68167652    475  175       AT_rich (38)  MIRb (19)  L2c (19) 
15  295185  chr2  NT_022184.15  28034881-28330066    451  143       MIRb (40)  L2a (33)  MIR (29) 
16  291097  chr8  NT_008046.16  51103248-51394345    502  181       MIRb (36)  AT_rich (29)  L2a (20) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
2   484030       chrX  NT_011669.17  4597559-5081589    LOC100129144  zinc_finger_protein_681
LOC100288853 
4   391733       chrX  NT_011651.17  8876031-9267764    BA345E19.2  dachshund_homolog_2_isoform_c
5   378671       chr11  NT_009237.18  50309325-50687996    LOC646813  DEAH_(Asp-Glu-Ala-His)_box_polypeptide_9_pseudogene
7   340581       chr20  NT_011362.10  11543138-11883719    PTPRT  receptor-type_tyrosine-protein_phosphatase_T_isoform_2_precursor



Posfai@neb.com
May 11, 2011