Distribution of restriction sites in the human genome

Enzyme:  BmgBIB               Longest uncut segments
Specificity:  CACGTC               Repeats in uncut segments
Number of sites:  269177               Genes in uncut segments
Mean distance between sites:  10629 base pairs
Standard deviation:  12997 base pairs
Site density 94.1 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   501235  chr15  NT_037852.6  1397448-1898683    0.99 % in   24 repeats    1.12 % in 1 genes
2   441919  chr6  NT_167244.1  2329014-2770933    4.99 % in   94 repeats    1.28 % in 1 genes
3   257671  chr6  NT_167244.1  2003262-2260933    3.38 % in   41 repeats    3.55 % in 3 genes
4   215387  chr6  NT_167244.1  3779580-3994967    8.08 % in   66 repeats    3.67 % in 1 genes
5   212195  chr6  NT_167244.1  4387973-4600168    1.60 % in   12 repeats    0.00 % in 0 genes
6   191061  chr6  NT_167249.1  2115830-2306891    7.76 % in   67 repeats    0.00 % in 0 genes
7   190452  chr2  NT_022135.16  29792949-29983401    46.55 % in   290 repeats    0.00 % in 0 genes
8   189497  chr10  NT_030059.13  6263676-6453173    44.13 % in   299 repeats    45.48 % in 1 genes
9   179361  chr6  NT_167244.1  3178010-3357371    0.87 % in   12 repeats    0.00 % in 0 genes
10   177479  chr7  NT_007933.15  47735280-47912759    56.32 % in   245 repeats    0.00 % in 0 genes
11   174073  chr6  NT_167248.1  510216-684289    8.19 % in   7 repeats    0.00 % in 0 genes
12   173709  chr6  NT_167247.1  4421234-4594943    0.46 % in   3 repeats    0.00 % in 0 genes
13   173217  chr10  NT_030059.13  59845530-60018747    60.42 % in   306 repeats    0.00 % in 0 genes
14   171260  chr6  NT_167244.1  395492-566752    27.94 % in   108 repeats    0.00 % in 0 genes
15   169081  chr6  NT_167247.1  1559054-1728135    1.67 % in   14 repeats    0.00 % in 0 genes
16   166780  chr8  NT_008046.16  20391127-20557907    54.58 % in   304 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
501235  chr15  NT_037852.6  1397448-1898683    24  18       L2a (3)  MER44C (2)  L1MEf (2) 
441919  chr6  NT_167244.1  2329014-2770933    94  46       L1MC4a (7)  AluSx (7)  AluJb (7) 
257671  chr6  NT_167244.1  2003262-2260933    41  25       AluSx (5)  MIRb (3)  FRAM (3) 
215387  chr6  NT_167244.1  3779580-3994967    66  44       L2a (9)  L1P3 (3)  L1MEc (3) 
212195  chr6  NT_167244.1  4387973-4600168    12  10       MER57-int (2)  AluSx (2)  (TTCC)n (1) 
191061  chr6  NT_167249.1  2115830-2306891    67  36       AluSx (10)  Charlie2b (5)  AluJb (5) 
190452  chr2  NT_022135.16  29792949-29983401    290  120       AT_rich (28)  AluSx (12)  MIRb (10) 
189497  chr10  NT_030059.13  6263676-6453173    299  127       AT_rich (25)  (TA)n (14)  AluY (12) 
179361  chr6  NT_167244.1  3178010-3357371    12  9       GC_rich (3)  AluSp (2)  LTR23 (1) 
10  177479  chr7  NT_007933.15  47735280-47912759    245  108       AT_rich (19)  L2c (13)  L2a (7) 
11  174073  chr6  NT_167248.1  510216-684289    7       LTR7 (1)  L1PREC2 (1)  L1PA7 (1) 
12  173709  chr6  NT_167247.1  4421234-4594943    3       MIR (1)  MER11A (1)  AluSc (1) 
13  173217  chr10  NT_030059.13  59845530-60018747    306  121       AT_rich (18)  MIR (17)  MIRb (12) 
14  171260  chr6  NT_167244.1  395492-566752    108  62       AT_rich (12)  MIRb (4)  AluSg/x (4) 
15  169081  chr6  NT_167247.1  1559054-1728135    14  11       Tigger7 (2)  MSTD (2)  MIR (2) 
16  166780  chr8  NT_008046.16  20391127-20557907    304  124       AT_rich (29)  L2c (15)  MIR (13) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   501235       chr15  NT_037852.6  1397448-1898683    LOC100418897 
2   441919       chr6  NT_167244.1  2329014-2770933    HCG22  HLA_complex_group_22
3   257671       chr6  NT_167244.1  2003262-2260933    LOC100294090  hypothetical_LOC100294090,_transcript_variant_1
FLOT1  flotillin-1
DDR1  epithelial_discoidin_domain-containing_receptor_1_isoform_DDR1c
4   215387       chr6  NT_167244.1  3779580-3994967    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor
8   189497       chr10  NT_030059.13  6263676-6453173    MIR548F1  microRNA_548f-1



Posfai@neb.com
May 11, 2011