PubChem

De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a buscar
PubChem
Logotipo de PubChem.svg
Contenido
DescripciónProductos químicos y sus bioensayos
Tipos de datos
capturados
dhsh
Organismoshumanos y otros animales
Contacto
Centro de InvestigaciónNCBI
cita principalPMID  15879180
Acceso
Sitio webhttps://pubchem.ncbi.nlm.nih.gov/
URL de descargaFTP
URL del servicio webVista PUG [1]
Misceláneas
LicenciaDominio publico

PubChem es una base de datos de moléculas químicas y sus actividades frente a ensayos biológicos . El sistema es mantenido por el Centro Nacional de Información Biotecnológica (NCBI), un componente de la Biblioteca Nacional de Medicina , que forma parte de los Institutos Nacionales de Salud (NIH) de los Estados Unidos. Se puede acceder a PubChem de forma gratuita a través de una interfaz de usuario web . Millones de estructuras compuestas y conjuntos de datos descriptivos se pueden descargar libremente a través de FTP. PubChem contiene múltiples descripciones de sustancias y moléculas pequeñas con menos de 100 átomos y 1000 enlaces. Más de 80 proveedores de bases de datos contribuyen a la creciente base de datos de PubChem. [2]

Historia

PubChem se lanzó en 2004 como un componente del Programa de Bibliotecas Moleculares (MLP) de los NIH. A partir de noviembre de 2015, PubChem contiene más de 150 millones de descripciones de sustancias proporcionadas por los depositantes, 60 millones de estructuras químicas únicas y 225 millones de resultados de pruebas de actividad biológica (de más de 1 millón de experimentos de ensayo realizados en más de 2 millones de moléculas pequeñas que cubren casi 10,000 secuencias diana de proteínas que corresponden a más de 5.000 genes). También contiene ensayos de detección de ARN de interferencia (ARNi) que se dirigen a más de 15 000 genes. [3]

A partir de agosto de 2018, PubChem contiene 247,3 millones de descripciones de sustancias, 96,5 millones de estructuras químicas únicas, aportadas por 629 fuentes de datos de 40 países. También contiene 237 millones de resultados de pruebas de bioactividad de 1,25 millones de ensayos biológicos, que cubren más de 10 000 secuencias de proteínas diana. [4]

A partir de 2020, con la integración de datos de más de 100 fuentes nuevas, PubChem contiene más de 293 millones de descripciones de sustancias proporcionadas por los depositantes, 111 millones de estructuras químicas únicas y 271 millones de puntos de datos de bioactividad de 1,2 millones de experimentos de ensayos biológicos. [5]

Bases de datos

PubChem consta de tres bases de datos primarias que crecen dinámicamente. A partir del 5 de noviembre de 2020 (el número de Bioensayos no ha cambiado):

  • Compuestos, 111 millones de entradas [5] (frente a 94 millones de entradas en 2017 [4] ), contiene compuestos químicos puros y caracterizados. [6]
  • Sustancias, 293 millones de entradas [5] (frente a 236 millones de entradas en 2017 [7] y 163 millones en septiembre de 2014 [8] ), también contiene mezclas, extractos , complejos y sustancias no caracterizadas.
  • BioAssay, resultados de bioactividad de 1,25 millones [9] (frente a 6000 en septiembre de 2014 [10] ) programas de detección de alto rendimiento con varios millones de valores.

Buscando

Es posible buscar en las bases de datos una amplia gama de propiedades, incluida la estructura química, los fragmentos de nombre, la fórmula química , el peso molecular , XLogP y el recuento de donantes y aceptores de enlaces de hidrógeno .

PubChem contiene su propio editor de moléculas en línea con compatibilidad con SMILES /SMARTS e InChI que permite la importación y exportación de todos los formatos de archivos químicos comunes para buscar estructuras y fragmentos.

Cada resultado proporciona información sobre sinónimos, propiedades químicas, estructura química, incluidas cadenas SMILES e InChI, bioactividad y enlaces a compuestos estructuralmente relacionados y otras bases de datos del NCBI como PubMed .

En el formulario de búsqueda de texto, los campos de la base de datos se pueden buscar agregando el nombre del campo entre corchetes al término de búsqueda. Un rango numérico está representado por dos números separados por dos puntos. Los términos de búsqueda y los nombres de los campos no distinguen entre mayúsculas y minúsculas. Se pueden utilizar paréntesis y los operadores lógicos AND, OR y NOT. Se supone AND si no se utiliza ningún operador.

Ejemplo ( regla de cinco de Lipinski ):

0:500[mw] 0:5[hbdc] 0:10[hbac] -5:5[logp]

Campos de la base de datos


Números de identificación
Número de identificación en la base de datos actual [UID]
Número de identificación de la sustancia [IDS]
Número de identificación del compuesto [CID]
Número de identificación de Bioensayo [BAID], [AYUDA]

General
Cualquier campo de la base de datos [TODOS]
Comentario [CMT]
Fecha de depósito [DDAT], [DEPDAT]
Identificación externa del depositante [SRID], [SRCID]
Nombre de la fuente [SRC], [SRCNAM], [SRCNOMBRE]
Fecha de publicación de la fuente [SRD], [SRDAT], [RLSDAT]
Término de encabezado de tema médico (MeSH) [MSHT], [MALLA]
nodo de árbol MeSH [MSHN], [MESHTN]
Acciones farmacológicas MeSH [PHMA], [FARMA]

Propiedades de la sustancia
sinónimos de sustancia [SINO]
nombre de la IUPAC [UPAC], [IUPAC]
Identificador químico internacional (InChI) [INCHI]
Peso molecular [MW], [MWT], [MOLWT]
Elementos químicos [ELMT], [EL]
Átomos que no son de hidrógeno [HAC], [HACNT]
recuento de isótopos [IAC], [IACNT]
Cargo formal total [TFC], [CHG], [CHRG]
Recuento de átomos quirales [ACC], [ACCNT]
Recuento de átomos quirales definidos [ACDC], [ACDCNT]
Recuento de átomos quirales indefinido [ACUC], [ACUCNT]
Recuento de aceptores de enlaces de hidrógeno [HBAC], [HBACNT]
Recuento de donantes de enlaces de hidrógeno [HBDC], [HBDCNT]
Recuento de tautómeros [TC], [TCNT], [TTMC]
Recuento de bonos giratorios [RBC], [RBCNT]
XLogP [11] [XLGP], [LOGP]

Propiedades compuestas
Sinónimos compuestos [CSYN], [CSYNO]
Recuento de componentes [CC], [CCNT]
Recuento de unidades covalentes (moléculas) [CUC], [CUC]
Recuento de bioactividad total [TAC]

Véase también

  • Base de datos química
    • CAS Common Chemistry: dirigido por la American Chemical Society
    • Base de datos de toxicogenómica comparativa : administrada por la Universidad Estatal de Carolina del Norte
    • ChEMBL - dirigido por el Instituto Europeo de Bioinformática
    • ChemSpider - dirigido por la Royal Society of Chemistry del Reino Unido
    • DrugBank - dirigido por la Universidad de Alberta
    • IUPAC - dirigido por la Unión Internacional de Química Pura y Aplicada (IUPAC) con sede en Suiza
    • Moltable - dirigido por el Laboratorio Químico Nacional de la India
    • PubChem - administrado por el Instituto Nacional de Salud, EE. UU.
    • BindingDB : administrado por la Universidad de California, San Diego
    • SCRIPDB - dirigido por la Universidad de Toronto, Canadá
    • Centro Nacional de Información Biotecnológica (NCBI) - dirigido por el Instituto Nacional de Salud, EE. UU.
    • Entrez - dirigido por el Instituto Nacional de Salud, EE. UU.
    • GenBank : administrado por el Instituto Nacional de Salud de EE. UU.

Referencias

  1. ^ Kim, Sunghwan; Thiessen, Paul A.; Cheng, Tiejun; Zhang, Jian; Gindulyte, Asta; Bolton, Evan E. (9 de agosto de 2019). "PUG-View: acceso programático a anotaciones químicas integrado en PubChem" . Revista de Quimioinformática . 11 (1): 56. doi : 10.1186/s13321-019-0375-2 . PMC 6688265 . PMID 31399858 .  
  2. ^ "Información de origen de PubChem" . El Proyecto PubChem . EE.UU.: Centro Nacional de Información Biotecnológica.
  3. ^ Kim, Sunghwan; Thiessen, Paul A.; Cheng, Tiejun; Yu, Bo; Zapatero, Benjamín A.; Wang, Jiyao; Bolton, Evan E.; Wang, Yanli; Bryant, Stephen H. (2016). "Información bibliográfica en PubChem: asociaciones entre registros de PubChem y artículos científicos" . Revista de Quimioinformática . 8 : Artículo 32.
  4. ^ a b "Resultados de búsqueda para todos los compuestos" . Consultado el 28 de enero de 2016 .
  5. ^ a b c Kim, Sunghwan; Chen, Jie; Cheng, Tiejun; Gindulyte, Asta; él, Jia; Él, Siqian; Li, Qingliang; Zapatero, Benjamín A; Thiessen, Paul A; Yu, Bo; Zaslavsky, Leonid; Zhang, Jian; Bolton, Evan E. (8 de enero de 2021). "PubChem en 2021: nuevo contenido de datos e interfaces web mejoradas" . Investigación de ácidos nucleicos . 49 (D1): D1388–D1395. doi : 10.1093/nar/gkaa971 . PMC 7778930 . IDPM 33151290 .  
  6. ^ "all [filt] - Resultados compuestos de PubChem" . El Proyecto PubChem . EE.UU.: Centro Nacional de Información Biotecnológica . Consultado el 7 de enero de 2011 .
  7. ^ "all [filt] - Resultados de sustancias de PubChem" . El Proyecto PubChem . EE.UU.: Centro Nacional de Información Biotecnológica . Consultado el 28 de enero de 2016 .
  8. ^ "all [filt] - Resultados de sustancias de PubChem" . El Proyecto PubChem . EE.UU.: Centro Nacional de Información Biotecnológica . Consultado el 7 de enero de 2011 .
  9. ^ "todos [filt] - Resultados de PubChem BioAssay" . El Proyecto PubChem . EE.UU.: Centro Nacional de Información Biotecnológica . Consultado el 28 de enero de 2016 .
  10. ^ "todos [filt] - Resultados de PubChem BioAssay" . El Proyecto PubChem . EE.UU.: Centro Nacional de Información Biotecnológica . Consultado el 7 de enero de 2011 .
  11. ^ Cheng T (noviembre de 2007). "Cálculo de coeficientes de partición octanol-agua guiando un modelo aditivo con conocimiento". Revista de Información y Modelado Químico . 47 (6): 2140–2148. doi : 10.1021/ci700257y . PMID 17985865 . 

Enlaces externos