Distribution of restriction sites in the human genome

Enzyme:  BsaAI               Longest uncut segments
Specificity:  YACGTR               Repeats in uncut segments
Number of sites:  692540               Genes in uncut segments
Mean distance between sites:  4131 base pairs
Standard deviation:  4481 base pairs
Site density 242.0 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   498665  chr15  NT_037852.6  1397851-1896516    0.86 % in   19 repeats    0.69 % in 1 genes
2   411599  chr6  NT_167244.1  2357142-2768741    1.32 % in   22 repeats    0.00 % in 0 genes
3   250564  chr6  NT_167244.1  2005459-2256023    2.11 % in   22 repeats    2.77 % in 3 genes
4   212312  chr6  NT_167244.1  4386201-4598513    2.04 % in   13 repeats    0.00 % in 0 genes
5   184960  chr6  NT_167244.1  3788581-3973541    1.63 % in   17 repeats    0.00 % in 0 genes
6   176910  chr6  NT_167247.1  1558999-1735909    4.44 % in   29 repeats    2.23 % in 1 genes
7   176173  chr6  NT_167247.1  4421639-4597812    1.41 % in   9 repeats    100.00 % in 1 genes
8   175095  chr6  NT_167244.1  3180260-3355355    0.03 % in   1 repeats    0.00 % in 0 genes
9   167088  chr6  NT_167249.1  2137610-2304698    0.89 % in   9 repeats    0.00 % in 0 genes
10   162324  chr6  NT_167248.1  521242-683566    1.86 % in   2 repeats    0.00 % in 0 genes
11   158944  chr7  NT_023603.5  37090-196034    100.00 % in   3 repeats    0.00 % in 0 genes
12   158343  chr9  NT_008470.19  21691305-21849648    1.90 % in   14 repeats    0.00 % in 0 genes
13   147562  chr6  NT_167244.1  2893709-3041271    2.24 % in   20 repeats    0.00 % in 0 genes
14   127815  chr6  NT_167245.1  2600450-2728265    5.82 % in   21 repeats    0.00 % in 0 genes
15   125212  chr6  NT_167244.1  1444668-1569880    12.61 % in   40 repeats    0.00 % in 0 genes
16   124587  chr6  NT_167247.1  1167911-1292498    4.23 % in   12 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
498665  chr15  NT_037852.6  1397851-1896516    19  15       L2a (3)  MER44C (2)  L1M5 (2) 
411599  chr6  NT_167244.1  2357142-2768741    22  16       AluY (3)  LTR84b (2)  L4 (2) 
250564  chr6  NT_167244.1  2005459-2256023    22  16       AluSx (4)  MIRb (2)  MIR (2) 
212312  chr6  NT_167244.1  4386201-4598513    13  9       MER57-int (3)  AluY (2)  AluSx (2) 
184960  chr6  NT_167244.1  3788581-3973541    17  14       MLT1H-int (2)  L2a (2)  AT_rich (2) 
176910  chr6  NT_167247.1  1558999-1735909    29  22       Tigger7 (2)  MSTD (2)  MSTB (2) 
176173  chr6  NT_167247.1  4421639-4597812    7       MLT1J (2)  AluSx (2)  (TTAAA)n (1) 
175095  chr6  NT_167244.1  3180260-3355355    1       AluSp (1) 
167088  chr6  NT_167249.1  2137610-2304698    5       L1MB8 (3)  AluSx (3)  L1MC4a (1) 
10  162324  chr6  NT_167248.1  521242-683566    2       L1PREC2 (1)  HERVH-int (1) 
11  158944  chr7  NT_023603.5  37090-196034    2       L1PA2 (2)  ALR/Alpha (1) 
12  158343  chr9  NT_008470.19  21691305-21849648    14  10       MIRb (2)  LTR67B (2)  L2 (2) 
13  147562  chr6  NT_167244.1  2893709-3041271    20  10       L1MC5 (6)  AluSc (3)  L2c (2) 
14  127815  chr6  NT_167245.1  2600450-2728265    21  17       Tigger1 (2)  MLT1N2 (2)  MER21C (2) 
15  125212  chr6  NT_167244.1  1444668-1569880    40  23       L1MA1 (7)  AluY (4)  L4 (3) 
16  124587  chr6  NT_167247.1  1167911-1292498    12  8       L2 (3)  MIRb (2)  ERV3-16A3_I-int (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   498665       chr15  NT_037852.6  1397851-1896516    LOC100418897 
3   250564       chr6  NT_167244.1  2005459-2256023    LOC100294090  hypothetical_LOC100294090,_transcript_variant_1
FLOT1  flotillin-1
DDR1  epithelial_discoidin_domain-containing_receptor_1_isoform_DDR1c
6   176910       chr6  NT_167247.1  1558999-1735909    LOC100421582  tripartite_motif-containing_protein_26
7   176173       chr6  NT_167247.1  4421639-4597812    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011