Plusieurs sites internet proposent des bases de données de molécules organiques en format SMILES : ce format se présente sous forme d'une chaîne de caractères, qui représente une molécule.
Par exemple :
CN1C=NC2=C1C(=O)N(C(=O)N2C)C
L'avez-vous reconnue ? c'est la caféine...
Sur le web, on trouve des sites qui génèrent le format SMILES à partir d'un nom de molécule, voire qui en génèrent une image.
Pour les personnes utilisant LaTeX et Python, voici une procédure qui permet d'insérer dans un fichier LaTeX la formule d'une molécule. Cette méthode est intéressante pour les molécules organiques assez complexes, fastidieuses à écrire.
1) Il faut d'abord se procurer la molécule en format SMILES. Quelques sites :
https://cactus.nci.nih.gov/chemical/structure
http://www.chemspider.com/
https://pubchem.ncbi.nlm.nih.gov/
2) Installer le module mol2chemfigPy3 pour Python. Adresse du module : https://pypi.org/project/mol2chemfigPy3/
3) Dans un terminal, taper une commande comme :
mol2chemfig -zw -i direct "C1=CC=C(C=C1)O"
entre guillemets : la molécule SMILES
La commande produit le code chemfig de la molécule, à coller dans le fichier LaTeX. Par exemple :
\chemfig{OH-[:180,,1]=_[:240]-[:180]=_[:120]-[:60]=_(-[:300])}
Chemfig est le principal package LaTEX utilisé pour dessiner des molécules organiques.
L'avantage de cette procédure est que le format SMILES est très utilisé dans le monde académique, et donc que les bases de données disponibles sont très fournies.
J'ai cru comprendre que le module Python mol2chemfigPy3 est une variante d'un autre module, qui semble maintenant indisponible.
Cette page wikipedia (https://fr.wikipedia.org/wiki/Simplified_Molecular_Input_Line_Entry_Specification) explique le principe du format SMILES.