Distribution of restriction sites in the human genome

Enzyme:  NsiI               Longest uncut segments
Specificity:  ATGCAT               Repeats in uncut segments
Number of sites:  922355               Genes in uncut segments
Mean distance between sites:  3102 base pairs
Standard deviation:  3580 base pairs
Site density 322.3 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   501121  chr15  NT_037852.6  1393646-1894767    1.33 % in   27 repeats    0.34 % in 1 genes
2   408559  chr6  NT_167244.1  2357402-2765961    0.90 % in   16 repeats    0.00 % in 0 genes
3   309393  chrY  NT_011875.12  8417228-8726621    83.00 % in   50 repeats    0.26 % in 1 genes
4   246473  chr6  NT_167244.1  3172575-3419048    4.55 % in   58 repeats    8.16 % in 2 genes
5   224725  chr6  NT_167244.1  4389090-4613815    6.42 % in   38 repeats    0.00 % in 0 genes
6   188972  chr6  NT_167244.1  3782796-3971768    2.30 % in   17 repeats    2.48 % in 1 genes
7   182280  chr6  NT_167248.1  505316-687596    11.04 % in   19 repeats    0.00 % in 0 genes
8   178435  chr6  NT_167247.1  4420933-4599368    2.12 % in   18 repeats    100.00 % in 1 genes
9   172655  chr7  NT_023603.5  24402-197057    99.84 % in   8 repeats    0.00 % in 0 genes
10   167312  chr6  NT_167249.1  2137920-2305232    1.02 % in   9 repeats    0.00 % in 0 genes
11   165952  chr6  NT_167247.1  1562300-1728252    0.43 % in   5 repeats    0.00 % in 0 genes
12   156926  chr6  NT_167244.1  2008191-2165117    0.60 % in   4 repeats    0.00 % in 0 genes
13   154169  chr6  NT_167244.1  2887835-3042004    5.28 % in   43 repeats    0.00 % in 0 genes
14   153591  chr9  NT_008470.19  21693157-21846748    0.69 % in   7 repeats    0.00 % in 0 genes
15   150268  chr6  NT_167246.1  3255511-3405779    7.49 % in   54 repeats    0.00 % in 0 genes
16   125488  chrX  NT_011786.16  4272992-4398480    12.52 % in   72 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
501121  chr15  NT_037852.6  1393646-1894767    27  20       L2a (3)  L1MDa (3)  MER44C (2) 
408559  chr6  NT_167244.1  2357402-2765961    16  12       LTR84b (2)  L4 (2)  AluY (2) 
309393  chrY  NT_011875.12  8417228-8726621    50  23       LTR12B (17)  L1PA16 (6)  L1MA3 (4) 
246473  chr6  NT_167244.1  3172575-3419048    58  25       AluSx (10)  L1MC5 (4)  L1MB3 (4) 
224725  chr6  NT_167244.1  4389090-4613815    38  20       AluSx (6)  Harlequin-int (5)  HERVH-int (4) 
188972  chr6  NT_167244.1  3782796-3971768    17  12       L2a (3)  AT_rich (2)  AluSc (2) 
182280  chr6  NT_167248.1  505316-687596    19  16       MER4D (2)  L1PA14 (2)  L1M5 (2) 
178435  chr6  NT_167247.1  4420933-4599368    18  14       AluSx (3)  MLT1J (2)  L1MC5 (2) 
172655  chr7  NT_023603.5  24402-197057    3       L1PA2 (4)  ALR/Alpha (3)  AT_rich (1) 
10  167312  chr6  NT_167249.1  2137920-2305232    5       L1MB8 (3)  AluSx (3)  L1MC4a (1) 
11  165952  chr6  NT_167247.1  1562300-1728252    4       MIR (2)  (GGAA)n (1)  A-rich (1) 
12  156926  chr6  NT_167244.1  2008191-2165117    4       MIRb (1)  MIR (1)  AluY (1) 
13  154169  chr6  NT_167244.1  2887835-3042004    43  20       L1MC5 (6)  AluY (6)  AluSc (4) 
14  153591  chr9  NT_008470.19  21693157-21846748    6       L2 (2)  MIRb (1)  MIR3 (1) 
15  150268  chr6  NT_167246.1  3255511-3405779    54  28       AluSx (7)  MIRb (4)  MIR (4) 
16  125488  chrX  NT_011786.16  4272992-4398480    72  22       MER33 (14)  AluSx (13)  AluSc (13) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   501121       chr15  NT_037852.6  1393646-1894767    LOC100418897 
3   309393       chrY  NT_011875.12  8417228-8726621    ZNF884P 
4   246473       chr6  NT_167244.1  3172575-3419048    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
6   188972       chr6  NT_167244.1  3782796-3971768    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor
8   178435       chr6  NT_167247.1  4420933-4599368    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011