Distribution of restriction sites in the human genome

Enzyme:  RpaBI               Longest uncut segments
Specificity:  CCCGCAG               Repeats in uncut segments
Number of sites:  92417               Genes in uncut segments
Mean distance between sites:  30961 base pairs
Standard deviation:  55857 base pairs
Site density 32.3 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   933814  chr6  NT_007299.13  7363348-8297162    39.55 % in   1359 repeats    80.90 % in 2 genes
2   919323  chr2  NT_022135.16  35381528-36300851    38.55 % in   1320 repeats    39.34 % in 3 genes
3   892060  chr13  NT_024524.14  45376887-46268947    50.71 % in   1412 repeats    0.19 % in 3 genes
4   882623  chr21  NT_011512.11  5952995-6835618    50.21 % in   1463 repeats    3.38 % in 7 genes
5   848348  chr4  NT_016297.16  819658-1668006    51.04 % in   1377 repeats    0.05 % in 1 genes
6   841751  chr6  NT_025741.15  6215664-7057415    46.66 % in   1301 repeats    56.04 % in 1 genes
7   786649  chr13  NT_024524.14  40931256-41717905    45.37 % in   1264 repeats    63.33 % in 1 genes
8   777791  chr12  NT_029419.12  35683990-36461781    60.64 % in   1213 repeats    0.06 % in 1 genes
9   766404  chr4  NT_016354.19  40068582-40834986    43.38 % in   1120 repeats    0.00 % in 0 genes
10   766266  chr7  NT_007933.15  17979801-18746067    41.67 % in   1208 repeats    0.00 % in 0 genes
11   749793  chr5  NT_006713.15  35060517-35810310    57.64 % in   1143 repeats    0.00 % in 0 genes
12   731782  chr1  NT_032977.9  30570880-31302662    57.37 % in   1422 repeats    0.00 % in 0 genes
13   719433  chr9  NT_008413.18  25015830-25735263    52.00 % in   1132 repeats    0.00 % in 0 genes
14   715889  chr11  NT_033899.8  7596993-8312882    49.73 % in   1276 repeats    0.00 % in 0 genes
15   706680  chrX  NT_011669.17  4148946-4855626    79.11 % in   1056 repeats    0.00 % in 0 genes
16   701486  chr2  NT_005403.17  76116895-76818381    42.49 % in   1138 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
933814  chr6  NT_007299.13  7363348-8297162    1359  283       AT_rich (166)  L2a (67)  MIRb (65) 
919323  chr2  NT_022135.16  35381528-36300851    1320  291       AT_rich (159)  L2a (68)  MIR (53) 
892060  chr13  NT_024524.14  45376887-46268947    1412  328       AT_rich (172)  (TA)n (43)  L2a (42) 
882623  chr21  NT_011512.11  5952995-6835618    1463  334       AT_rich (185)  AluSx (41)  AluY (34) 
848348  chr4  NT_016297.16  819658-1668006    1377  325       AT_rich (166)  MIR (55)  L2a (39) 
841751  chr6  NT_025741.15  6215664-7057415    1301  288       AT_rich (182)  MIR (44)  L2a (43) 
786649  chr13  NT_024524.14  40931256-41717905    1264  270       AT_rich (83)  L2a (66)  MIRb (53) 
777791  chr12  NT_029419.12  35683990-36461781    1213  309       AT_rich (130)  L2a (45)  (TA)n (40) 
766404  chr4  NT_016354.19  40068582-40834986    1120  251       AT_rich (142)  L2a (59)  MIR (44) 
10  766266  chr7  NT_007933.15  17979801-18746067    1208  267       AT_rich (104)  AluY (70)  MIR (54) 
11  749793  chr5  NT_006713.15  35060517-35810310    1143  285       AT_rich (151)  (TA)n (38)  MIR (36) 
12  731782  chr1  NT_032977.9  30570880-31302662    1422  273       MIRb (150)  L2c (95)  MIR (94) 
13  719433  chr9  NT_008413.18  25015830-25735263    1132  271       AT_rich (130)  MIR (53)  MIRb (44) 
14  715889  chr11  NT_033899.8  7596993-8312882    1276  296       AT_rich (108)  MIRb (54)  MIR (54) 
15  706680  chrX  NT_011669.17  4148946-4855626    1056  228       MIRb (62)  MIR (54)  L2a (38) 
16  701486  chr2  NT_005403.17  76116895-76818381    1138  261       AT_rich (87)  L2a (53)  MIRb (49) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   933814       chr6  NT_007299.13  7363348-8297162    LOC728052  hypothetical_LOC728052
BAI3  brain-specific_angiogenesis_inhibitor_3_precursor
2   919323       chr2  NT_022135.16  35381528-36300851    SGCEP  hypothetical_LOC401014
LOC100505498  hypothetical_LOC100505498,_transcript_variant_2
RPL6P5 
3   892060       chr13  NT_024524.14  45376887-46268947    LOC100507505  hypothetical_protein_LOC100507505
OR7E104P 
NFYAP1 
4   882623       chr21  NT_011512.11  5952995-6835618    LOC100505973  hypothetical_LOC100505973
SLC6A6P1 
RPL37P4 
LOC100128057 
LOC100421082 
LOC100288151 
C1QBPP 
5   848348       chr4  NT_016297.16  819658-1668006    RPL31P31 
6   841751       chr6  NT_025741.15  6215664-7057415    LOC100418924  glutamate_receptor,_ionotropic_kainate_2_isoform_2_precursor
7   786649       chr13  NT_024524.14  40931256-41717905    DIAPH3  protein_diaphanous_homolog_3_isoform_b
8   777791       chr12  NT_029419.12  35683990-36461781    RPL31P48 



Posfai@neb.com
May 11, 2011