La PDB contient, au 19/03/2010, 64098 structures. Les données sont depuis l’origine au format pdb, et sont depuis quelques années également au format mmCif, spécifiquement développé pour les données structurales de la PDB. 6000 à 7000 structures sont ajoutées chaque année.
La banque contient des fichiers pour chaque modèle moléculaire. Ces fichiers décrivent la localisation exacte de chaque atome de la macromolécule étudiée, c'est-à-dire les coordonnées cartésiennes de l’atome dans un repère à trois dimensions. Si l’on s’intéresse plutôt à la séquence de la macromolécule (la liste des acides aminés ou nucléiques), il vaut mieux utiliser d’autres banques bien plus grandes, comme Swiss-Prot. Les fichiers contiennent également des métadonnées.
Statistiques de la PDB (PDB Holdings List) au 10/08/2007 :
Protéines | Acides nucléiques | Complexes protéines / acides nucléiques | Autres | Total | |
---|---|---|---|---|---|
Diffractométrie de rayons X | 35676 | 978 | 1663 | 24 | 38341 |
RMN | 5552 | 779 | 133 | 7 | 6471 |
Microscopie électronique | 105 | 10 | 38 | 0 | 153 |
Autres | 80 | 4 | 4 | 2 | 90 |
Total | 41413 | 1771 | 1838 | 33 | 45055 |
Les fichiers décrivant les modèles moléculaires peuvent être téléchargés à partir du site de la PDB et visualisés grâce à différents logiciels tels que rasmol, Jmol, Protein Segment Finder, chime, une extension VRML (plugin) d'un navigateur ou une bibliothèque mmLib pour le langage de programmation Python. Le site web de la PDB contient également des ressources pour l'enseignement, sur la génomique structurale et d'autres logiciels utiles.