logo
logo
help

You are here: Home

Citation: Huang et al. Nucleic Acids Res. database issue 2018, doi:10.1093/nar/gkx894
Browse by Taxonomy
help
Unclassified  (2) Acidobacteria (8) Actinobacteria (486) Aquificae (15)
Armatimonadetes (1) Bacteroidetes (170) Caldiserica (1) Candidatus Cloacimonetes (1)
Chlamydiae (89) Chlorobi (12) Chloroflexi (25) Chrysiogenetes (1)
Cyanobacteria (90) Deferribacteres (4) Deinococcus-Thermus (25) Dictyoglomi (2)
Elusimicrobia (3) Fibrobacteres (1) Firmicutes (848) Fusobacteria (18)
Gemmatimonadetes (1) Ignavibacteriae (2) Nitrospirae (8) Planctomycetes (7)
Proteobacteria (2001) Spirochaetes (65) Synergistetes (5) Tenericutes (124)
Thermodesulfobacteria (4) Thermotogae (27) Verrucomicrobia (10)
Browse by Family
help
AA1 (81) AA2 (1387) AA3 (6663) AA4 (2924) AA5 (233) AA6 (6150) AA7 (3887)
AA9 (6) AA10 (988) AA11 (1) AA12 (981) AA13 (1)
CBM1 (1) CBM2 (1452) CBM3 (405) CBM4 (541) CBM5 (1464) CBM6 (1029) CBM8 (56)
CBM9 (705) CBM10 (45) CBM11 (128) CBM12 (671) CBM13 (2066) CBM14 (113) CBM15 (5)
CBM16 (798) CBM17 (15) CBM18 (2) CBM19 (7) CBM20 (606) CBM21 (46) CBM22 (426)
CBM23 (193) CBM24 (6) CBM25 (149) CBM26 (138) CBM27 (68) CBM28 (22) CBM29 (14)
CBM30 (224) CBM31 (15) CBM32 (3707) CBM34 (917) CBM35 (1103) CBM36 (75) CBM37 (688)
CBM38 (114) CBM39 (29) CBM40 (743) CBM41 (617) CBM42 (186) CBM43 (4) CBM44 (1681)
CBM45 (3) CBM46 (220) CBM47 (112) CBM48 (6747) CBM49 (25) CBM50 (13741) CBM51 (393)
CBM52 (2) CBM53 (10) CBM54 (184) CBM55 (2) CBM56 (380) CBM57 (213) CBM58 (11)
CBM59 (42) CBM60 (29) CBM61 (327) CBM62 (72) CBM63 (147) CBM64 (29) CBM65 (31)
CBM66 (1149) CBM67 (840) CBM68 (182) CBM69 (224) CBM70 (116) CBM71 (48) CBM72 (21)
CBM73 (487) CBM74 (10) CBM76 (25) CBM77 (54) CBM78 (52) CBM79 (8) CBM80 (27)
CE1 (25496) CE2 (419) CE3 (5035) CE4 (10092) CE5 (1373) CE6 (992) CE7 (2734)
CE8 (697) CE9 (2658) CE10 (16411) CE11 (1592) CE12 (1137) CE13 (120) CE14 (3307)
CE15 (264) CE16 (734)
GH1 (4964) GH2 (3834) GH3 (6171) GH4 (2443) GH5 (2587) GH6 (363) GH8 (825)
GH9 (626) GH10 (864) GH11 (189) GH12 (161) GH13 (17362) GH14 (46) GH15 (1703)
GH16 (1633) GH17 (274) GH18 (3064) GH19 (1170) GH20 (1857) GH22 (18) GH23 (11975)
GH24 (1730) GH25 (1987) GH26 (707) GH27 (335) GH28 (1156) GH29 (1163) GH30 (748)
GH31 (2136) GH32 (2235) GH33 (1422) GH35 (633) GH36 (1218) GH37 (671) GH38 (1218)
GH39 (932) GH42 (1103) GH43 (3734) GH44 (68) GH45 (11) GH46 (169) GH47 (13)
GH48 (121) GH49 (11) GH50 (215) GH51 (970) GH52 (54) GH53 (418) GH54 (70)
GH55 (215) GH56 (2) GH57 (919) GH58 (15) GH59 (45) GH62 (97) GH63 (636)
GH64 (182) GH65 (1279) GH66 (82) GH67 (233) GH68 (256) GH70 (98) GH71 (27)
GH72 (1) GH73 (3324) GH74 (2253) GH75 (74) GH76 (619) GH77 (1941) GH78 (1149)
GH79 (77) GH80 (44) GH81 (112) GH82 (38) GH84 (265) GH85 (184) GH86 (58)
GH87 (288) GH88 (602) GH89 (129) GH90 (15) GH91 (67) GH92 (1252) GH93 (160)
GH94 (851) GH95 (701) GH96 (1) GH97 (463) GH98 (39) GH99 (228) GH100 (112)
GH101 (122) GH102 (1078) GH103 (2132) GH104 (470) GH105 (897) GH106 (303) GH107 (6)
GH108 (522) GH109 (13611) GH110 (105) GH111 (5) GH112 (101) GH113 (361) GH114 (498)
GH115 (216) GH116 (134) GH117 (175) GH118 (2) GH119 (8) GH120 (167) GH121 (73)
GH123 (129) GH124 (24) GH125 (388) GH126 (184) GH127 (899) GH128 (111) GH129 (263)
GH130 (770) GH131 (2) GH133 (328) GH134 (4) GH135 (124)
GT1 (2560) GT2_Cellulose_synt (242) GT2 (33964) GT3 (74) GT4 (31534) GT5 (2306) GT6 (13)
GT7 (185) GT8 (1886) GT9 (5618) GT10 (232) GT11 (318) GT12 (103) GT13 (124)
GT14 (241) GT15 (1) GT17 (55) GT19 (2783) GT20 (1231) GT21 (688) GT22 (75)
GT23 (88) GT24 (1) GT25 (1059) GT26 (2266) GT27 (1207) GT28 (4864) GT29 (26)
GT30 (1844) GT31 (27) GT32 (720) GT33 (23) GT34 (32) GT35 (2671) GT38 (15)
GT39 (764) GT40 (14) GT41 (956) GT42 (68) GT43 (8) GT44 (176) GT45 (107)
GT46 (229) GT47 (33) GT50 (44) GT51 (9393) GT52 (105) GT53 (384) GT55 (21)
GT56 (346) GT57 (2) GT58 (2) GT59 (4) GT60 (77) GT61 (3) GT62 (18)
GT64 (8) GT66 (184) GT67 (1) GT68 (8) GT69 (4) GT70 (246) GT71 (7)
GT73 (195) GT74 (10) GT75 (17) GT76 (447) GT77 (20) GT78 (24) GT80 (13)
GT81 (926) GT82 (106) GT83 (5241) GT84 (431) GT85 (165) GT87 (1144) GT88 (33)
GT89 (284) GT90 (102) GT92 (158) GT93 (3) GT94 (402) GT97 (14) GT99 (199)
PL1 (958) PL2 (72) PL3 (166) PL4 (62) PL5 (327) PL6 (234) PL7 (340)
PL8 (425) PL9 (999) PL10 (125) PL11 (256) PL12 (874) PL13 (10) PL14 (67)
PL15 (87) PL16 (40) PL17 (177) PL18 (15) PL20 (93) PL21 (19) PL22 (1680)
PL24 (28)

Introduction

dbCAN-seq is a database of CAZyme sequence and annotation built upon the dbCAN CAZyme HMMs database, which is further built from the GenBank protein sequences classified/annotated at the CAZy database. Compared to other CAZyme web resources, dbCAN-seq has the following unique features:

  1. It provides a convenient download page for users to batch download all the precomputed CAZyme sequence and annotation data for over 5,000 fully sequenced bacterial genomes;

  2. It provides the most comprehensive annotation data (e.g., WP_007212487.1) for computationally identified CAZymes including signature domains, molecular weight, PI, CDD (conserved domains), signalP (signal peptide), lipoP (lipoprotein prediction), TMHMM (transmembrane protein prediction), EC/enzyme prediction, and sequence homologs in the Swiss-Prot database, PDB database, and CAZy database;

  3. It organizes the bacterial genomes according to the metadata such as disease, ecosystems, habitats, oxygen requirement, temperature, metabolism, etc.;

  4. It provides a tool (CGC-Finder) to identify CAZyme gene clusters (CGCs). CGCs are defined as genomic regions containing at least one CAZyme gene, one transporter gene and one transcription factor gene. The rational is that CAZyme genes often work together with each other and with other important genes (e.g. TFs, sugar transporters) to synergistically degrade or synthesize various highly complex carbohydrates.