+

WO1996013785A1 - Procede pour extraire de nouveaux composes ligands contenus dans une base de donnees a structure tridimensionelle - Google Patents

Procede pour extraire de nouveaux composes ligands contenus dans une base de donnees a structure tridimensionelle Download PDF

Info

Publication number
WO1996013785A1
WO1996013785A1 PCT/JP1995/002219 JP9502219W WO9613785A1 WO 1996013785 A1 WO1996013785 A1 WO 1996013785A1 JP 9502219 W JP9502219 W JP 9502219W WO 9613785 A1 WO9613785 A1 WO 9613785A1
Authority
WO
WIPO (PCT)
Prior art keywords
hydrogen
compound
biopolymer
trial
trial compound
Prior art date
Application number
PCT/JP1995/002219
Other languages
English (en)
French (fr)
Inventor
Akiko Itai
Miho Mizutani
Original Assignee
Akiko Itai
Miho Mizutani
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Akiko Itai, Miho Mizutani filed Critical Akiko Itai
Priority to KR1019970702847A priority Critical patent/KR970707500A/ko
Priority to US08/817,646 priority patent/US6389378B2/en
Priority to EP95935587A priority patent/EP0790567A1/en
Priority to JP51445296A priority patent/JP3669704B2/ja
Publication of WO1996013785A1 publication Critical patent/WO1996013785A1/ja

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Definitions

  • the present invention relates to a method for searching a three-dimensional structure database that can be used for structural design of drugs, pesticides, and other bioactive compounds.
  • the former structure automatic construction method
  • database method database method
  • the latter method targets databases on commercially available compounds that are stored or available in-house.
  • the most difficult problem in searching a three-dimensional structural database is how to handle the degree of freedom of the conformation of the trial compound.
  • the conformation of the ligand when it binds to the biopolymer forms the most stable complex
  • the same ligand molecule can form the most stable complex in a different conformation depending on the partner biopolymer.
  • a database often contains the atomic coordinates of the three-dimensional structure of one of many possible conformations for a single compound.
  • the information on the three-dimensional structure of each compound is based on a three-dimensional structure calculated from a two-dimensionally input structure.
  • Such a three-dimensional structure is often one of the local stable structures that the molecule itself can take.
  • the search condition is based only on the conformations of the compounds stored in the database. Investigating whether or not satisfies the condition that the compound to be hit may not be properly selected considering other conformations.
  • the number of conformations that need to be considered depends on the number of bonds that can be rotated, and also depends on factors such as how finely the conformation is considered. In general, molecules containing 3 to 6 need to handle tens to hundreds of thousands of conformations. In order to consider these possible conformations, there is no other way than to select the most promising ones and enter them into the database, or to create and examine them at the time of search. In any case, a huge amount of computer resources (storage capacity) and calculation time are required.
  • the search conditions used are the presence or absence of functional groups presumed to be essential for the activity in the active compound to be ⁇ type, and the distance, angle, and direction between them. Among them, although it is the most childish, there is an advantage that the algorithm is easy and the calculation time is short, but the probability that the hit compound actually has the desired activity is not high. The reason for this is that even if only the functional groups are in the desired positional relationship, molecules whose overall shape and size are not appropriate cannot exhibit activity. When the three-dimensional structure of the target biopolymer is known, it is most effective to use the information, and the probability that the hit compound has a desired activity is high.
  • the search condition under which the probability that the hit compound has the desired activity is the highest is whether the compound can stably bind to the ligand binding site of the target biopolymer. However, even if this condition is satisfied, the activity may not be expressed due to physical properties (such as water solubility), but satisfying this condition is the minimum condition for expressing the activity . On the other hand, the presence or absence of a specific functional group and the positional relationship of the functional groups are not necessarily essential for the expression of activity.Even if the compound system is different and the molecular skeleton is different, it is as stable as the target biopolymer If a complex can be formed, the same biological activity may be exerted.
  • a compound that satisfies the condition that it can stably bind to the ligand binding site is likely to be a compound that can actually be a ligand.
  • a search condition of a fit to a ligand binding site of a target biopolymer it becomes possible to select a compound having a desired biological activity and a broader structure from a database.
  • the disadvantage of this method is that it takes a considerable amount of time to cover the binding mode alone.
  • Some refinements have been modified to allow conformational changes for the docking of a single compound, but are not designed to automatically go through the entire docking process.
  • energy evaluation can be performed on the hit compound, only a simple score can be calculated in the process of obtaining the result, and hydrogen bonds and the like cannot be considered.
  • there are also problems with accuracy such as the fact that the correct complex structure observed as a crystal does not give the most stable results and may be estimated at a much lower order.
  • the fatal defect is basically a method in which the conformation is fixed and the degree of freedom in conformation cannot be handled.
  • the above-mentioned disadvantages cannot be compensated for by human handwork, and thus are of very low practicality.
  • the present inventors have developed ADAM as a method for automatically and without prejudice to estimate the structure of the most stable complex between a biopolymer and a ligand molecule, and have solved all of the above problems.
  • Successful PCT / JP93 / 0365, PCT International Publication W0 93/20525; M. Yaraada and A. Itai, Chem. Pharm. Bull., 41,. 1200, 1993; M. Yamada and A. Itai, Cheni. Pharm. Bull., 41, p. 1203, 1993; and M. Yamada Mizutani, N. Tomioka and A. Itai, J. Mol. Biol., 243, pp. 310-326, 1994).
  • ADAM is suitable for the purpose of searching for the structure of the stablest complex between one biopolymer and one ligand molecule, among various compounds contained in the three-dimensional structural database, Therefore, it is not suitable for use in searching for new ligand compounds, and further improvement has been required.
  • an object of the present invention is to solve the problems of the prior art and to provide a method suitable for searching for a novel ligand compound from a wide variety of compounds. Disclosure of the invention
  • the inventors of the present invention have made intensive efforts to form a complex structure by docking the biopolymer and the trial compound while changing the conformation of the trial compound, thereby forming a structure between the biopolymer and the trial compound molecule. Evaluating the action energy (eg, hydrogen bond, electrostatic interaction, and van der Waals force), searching for the most stable binding mode of the complex by repeating structural optimization, and obtaining the most stable.
  • action energy eg, hydrogen bond, electrostatic interaction, and van der Waals force
  • (V) a method of retrieving a ligand compound for a biopolymer from a three-dimensional structural database, comprising: a fifth step of repeating the third step and the fourth step for all trial compounds.
  • the method of the present invention further comprises the step of selecting the candidate ligand compound selected in the fourth step based on the number of hydrogen bonds that can be formed with the biopolymer and / or the value of the interaction energy with the biopolymer.
  • a sixth step of narrowing down may be included.
  • FIG. 1 is a conceptual diagram showing the configuration of the method of the present invention.
  • FIG. 2 is a flowchart showing one embodiment of the method of the present invention.
  • S indicates each step.
  • FIG. 3 is a diagram showing an example of a substrate for dihydrofolate reductase and a known inhibitor analog obtained as a candidate ligand compound by the method of the present invention.
  • FIG. 4 is a diagram showing an example of a candidate ligand compound having a novel structure of dihydrofolate reductase obtained by the method of the present invention.
  • the trial compound is not particularly limited as long as it has a known structure.
  • various compounds stored in an existing database can be used.
  • the hydrogen bonding category number is an identification number for an atomic group capable of forming a hydrogen bond, and is assigned to a heteroatom directly participating in a hydrogen bond in the atomic group. The number instantly creates the geometry of the group and the nature of the hydrogen bond, as well as the location of its partner hydrogen-bonding atom (dummy atom).
  • the information for molecular force field calculation refers to the number and electronic state given to each atom in order to calculate the intramolecular and intermolecular interaction energy using the molecular force field. Used as containing atomic charges.
  • the information for creating a conformation is the initial value, the final value, and the number of rotations of the torsion angles that are used to systematically create different conformations by changing the torsion angle of the rotatable bond.
  • Biopolymer is a concept that includes not only macromolecules found in living organisms but also molecules that simulate macromolecules found in living organisms.
  • the physicochemical information of the ligand binding region refers to the potential effect of all the atoms of the biopolymer within the concave region of the biopolymer to which the ligand can bind, and the three-dimensional lattice points in the ligand binding region Hydrogen bonding (hydrogen-accepting or hydrogen-donating), van der Waals interaction energy and electrostatic interaction acting between the biopolymer and the probe atom when the probe atom is placed at its three-dimensional lattice point Action energy is included.
  • Docking is used as a concept that involves forming a complex between a molecule of a certain ligand compound and a certain biopolymer, and exploring the structure of a stable complex between the two. Docking can be generally performed by a method using a molecular model, a simulation method using a computer and computer graphics, an automatic docking method, or the like.
  • the interaction between the biopolymer and the trial compound means the force acting between the biopolymer and the trial compound, such as hydrogen bonding, electrostatic interaction, van der Waals interaction, and the like.
  • Ligands or ligand compounds are those that bind to biological macromolecules Refers to compounds having a high molecular weight, examples of which include drugs, substrates of enzymes, inhibitors, coenzymes, and other physiologically active substances.
  • the third step includes the following steps:
  • step b For each hydrogen bonding mode and conformation obtained in step b, the coordinates of all atoms of the trial compound are calculated as biomolecules based on the correspondence between the hydrogen bonding heteroatoms and dummy atoms in the trial compound. Step of obtaining complex structure of biopolymer-trial compound by replacing with coordinate system
  • the third step includes the following steps:
  • step b (3) based on the hydrogen bonding mode and conformation obtained in step b, a combination of a dummy atom and a hydrogen bonding hetero atom that gives a hydrogen bonding mode that is impossible in the partial structure of the trial compound; And preserving a hydrogen-bonding heteroatom that cannot form a hydrogen bond with the dummy atom; c.
  • step d (4) combinations containing hydrogen-bonded heteroatoms conserved in step c, and Except for the combinations of dummy atoms and hydrogen-bonding heteroatoms, the association between the dummy atoms and the hydrogen-bonding heteroatoms of the entire trial compound is comprehensively covered, so that Step d covering the preferred mode of binding between the compounds;
  • step e For each hydrogen bonding mode and conformation obtained in step e, the coordinates of all the atoms of the trial compound are calculated as biomolecules based on the correspondence between the hydrogen bonding heteroatoms and the dummy atoms in the trial compound. Step of obtaining a complex structure of biopolymer-trial compound by substituting into the coordinate system of f;
  • the third step it is possible to speed up the search for a stable complex structure of the biopolymer and the trial compound, and to make the biopolymer and the or the trial compound complex. Even if it has, it is possible to search for the structure of the stable complex including the most stable one in a short time.
  • the third step includes the following steps:
  • step b While maintaining the hydrogen bonding mode obtained in step b, optimize the conformation of the trial compound so that the positions of the dummy atoms and the hydrogen-bonding heteroatoms in the trial compound match, and then Removing the conformation of the trial compound having a high intramolecular energy; c.
  • step c For each conformation that was not removed in step c, a hydrogen-bonding heteroatom in the test compound A process of obtaining a composite structure of a biopolymer-trial compound by replacing the coordinates of all atoms of the trial compound with the coordinate system of the biopolymer based on the correspondence relationship with the dummy atoms;
  • step d From the complex structure of the hydrogen-bonding moiety obtained in step d, the intramolecular energy of the hydrogen-bonding moiety in the trial compound and the intermolecular interaction between the biopolymer and the hydrogen-bonding moiety in the trial compound Removing the energetic composite structure and then optimizing the structure of the remaining composite structure e;
  • step e for each complex structure obtained in step e, generating a conformation of the non-hydrogen bonding portion of the trial compound to obtain a new complex structure containing the entire trial compound; f;
  • step f From the complex structure obtained in step f, remove the complex structure having high intramolecular energy and the high intermolecular interaction energy between the biological polymer and the trial compound from the complex structure obtained in step f, and then remove the remaining complex structure Step g of optimizing the structure for
  • the hydrogen bonding functional group includes a functional group and an atom capable of participating in hydrogen bonding.
  • the term “hydrogen-bonding heteroatom” refers to a heteroatom constituting a hydrogen-bonding functional group present in the trial compound.
  • the hydrogen-bonding moiety is a structural part of the test compound that contains a hydrogen-bonding heteroatom associated with a dummy atom, and the non-hydrogen-bonding moiety is a structural part other than the hydrogen-bonding moiety.
  • the three-dimensional coordinates of the trial compound are read and, if necessary, the three-dimensional coordinates of the hydrogen atom are added, and the atom type number, the hydrogen bonding category number, the atomic charge
  • a mode of coupling rotation By providing a mode of coupling rotation, a method of creating a three-dimensional database is provided.
  • ADAM is a biopolymer monoligand disclosed in International Publication TO93 / 20525 (International Publication Date: October 14, 1993). This shows a method for searching for a stable complex structure of a molecule.
  • PCT International Publication WO 93/20525 is included in the disclosure of this specification.
  • an ADAM specification three-dimensional database of two or more test compounds is created (S1).
  • the above database can be created, for example, as follows.
  • the two-dimensional coordinates obtained from the two-dimensional structure database are converted to three-dimensional coordinates by force field calculation, the structure analysis of a single crystal, a model based on the crystal database and energy calculation Coordinates and the like obtained from the three-dimensional structure and the like obtained by building can be used.
  • the geometrical quantities such as the bond distance between atoms and bond angles are accurate, there is basically no need to consider the conformation.
  • a 3D database can be created by automatically adding the electric charge and the mode of bond rotation (such as which bond to rotate, or how many times to start and rotate every other time, etc.). .
  • the atomic type numbers of the atoms constituting the trial compound are described, for example, by Weiner et al. (Weiner. SJ, Kollman, PA, Case, DA, Singh, UC, Ghio. C., Alagona, G., Profeta, S., Jr., and Weiner, P., J. Am. Chem. So, 106, 1984, pp. 765-784).
  • the hydrogen bonding category number of the hydrogen bonding hetero atom present in the trial compound can be added according to Table 1 below.
  • the charge of each atom constituting the trial compound can be calculated by a molecular orbital method calculation using, for example, the Gasteiger method, the MND0 method in the M0PAC program, and the AMI method.
  • a rotation mode in which a single bond capable of torsion rotation is systematically rotated at a constant rotation angle of 60 ° to 120 °.
  • Table 1 Types of atoms constituting hydrogen-bonding functional groups and hydrogen-bonding category numbers
  • the atomic coordinates of a biopolymer can be obtained from information on the three-dimensional structure obtained by X-ray crystallography or NMR analysis, information available from a protein crystal database, etc., or a biopolymer model constructed based on this information. original Child coordinates and the like can be used.
  • the atomic coordinates of the biopolymer are preferably represented by a three-dimensional coordinate system.
  • a cofactor that binds to a biopolymer and plays an important structural and functional role is regarded as a part of the biopolymer, and the atomic coordinates of the biopolymer with the cofactor bound are calculated.
  • the subsequent steps may be performed by inputting.
  • Examples of such a cofactor include a coenzyme, a water molecule, and a metal ion.
  • the atomic coordinates of the hydrogen atoms constituting the amino acid residues present in the biopolymer are calculated (S 3).
  • a hydrogen bonding category—number is added to the heteroatom constituting the hydrogen bonding functional group present in the biopolymer (S5).
  • the charge value is calculated from literature values calculated for each amino acid, for example, Weiner values (Weiner, SJ, Kollman, PA Case, DA, Singh, UC, Ghio, C., Alagona, G., Profeta ,
  • the hydrogen bonding category number may be added according to Table 1 above.
  • the ligand binding region is specified (S6).
  • a region containing an arbitrary site of the biopolymer preferably a rectangular parallelepiped region can be selected.
  • a ligand binding pocket or a site of a biopolymer in the vicinity thereof may be selected, and if necessary, a region including a site of a biopolymer to which another molecule such as effecta is bonded is selected. It is also possible.
  • the ligand binding pocket is an inner hole on the concave molecular surface of the biopolymer to which a ligand molecule such as a substrate or an inhibitor binds.
  • GREEN Tomioka, N., Itai, A., and Iitaka, Y., Journal of Computer Ages Molecular Some of the functions of Design, vol. 1, 1987, pp. 197-210) can be used.
  • Three-dimensional grid points are generated in the area specified in S6, and numbering and grid point information are calculated for each three-dimensional grid point (S7).
  • the three-dimensional lattice points are points on the three-dimensional lattice generated at regular intervals in the ligand-bonded region of the biopolymer, and the lattice point information is an atom that serves as a probe on each three-dimensional lattice point.
  • van der Waals and electrostatic interaction energies acting between biomolecules and probe atoms as calculated assuming that there is, and local physics information on the ligand binding region such as hydrogen bonding It is a concept.
  • the three-dimensional lattice points can be generated at regular intervals of 0.3 to 2.0 angstroms, preferably 0.3 to 0.5 angstroms, in the area designated by S6.
  • the probe atom it is preferable to adopt all the types of atoms contained in the compound that may become a ligand.
  • the van der Waals interaction energy acting between each probe atom arranged at each three-dimensional lattice point and a biomolecule can be calculated by an ordinary atom pair calculation using an empirical potential function. .
  • an empirical potential function a Lennard-Jones type function represented by the following equation can be used.
  • i represents a number indicating the position of a probe atom
  • j represents an atom number of a biopolymer.
  • a and B represent parameters that determine the position and magnitude of the minimal potential. Represents the distance between the i-th probe atom and the j-th atom of the biopolymer.
  • the parameters A and B described above include, for example, values from Weiner et al. (Weiner, SJ, Kollman, PA, Case, DA, Singh, UC, Ghio, C., Alagona, G., Profeta, S., Jr., and Weiner, P., J. Am. Chem. Soc., 106, 1984, pp. 765-784) can be used.
  • the van der Waals interaction energy between the trial compound and the biopolymer when the trial compound is placed on this three-dimensional lattice point is represented by the following formula (where m is the number of an atom in the trial compound, and N Is the number of atoms in the trial compound, and is the number of the 3D lattice point closest to the m-th atom.)
  • the electrostatic interaction energy acting between each probe atom arranged at each three-dimensional lattice point and the biopolymer is expressed by the following equation (where i, j, and are as defined above, qj Indicates the charge of the j-th atom of the biopolymer, K indicates a constant for converting the energy unit, and ⁇ indicates the permittivity.
  • a constant value may be used as the above-mentioned dielectric constant
  • a value dependent on ri as proposed by Warshel et al. (Warshel, A., J. Phys. Chem., 83, 1979, pp. 1640-1652) is preferably used.
  • Hydrogen-bonding lattice point information is defined as the hydrogen-bonding functional group of a biopolymer if any of the hydrogen-donating or hydrogen-accepting atoms is located at its three-dimensional lattice point. Able to form hydrogen bonds, or that either atom can form a hydrogen bond (or cannot form a hydrogen bond) with the hydrogen-bonding functional group of the biopolymer, regardless of which atom is located at the three-dimensional lattice point.
  • the number of 1 is assigned to a certain 3D lattice point, 2 to 3D lattice points that are hydrogen-donating, 3 to 3D lattice points having both properties, and 0 to 3D lattice points without hydrogen bonding.
  • the hydrogen bonding property of the three-dimensional lattice point can be expressed.
  • the hydrogen bonding property of a three-dimensional lattice point can be determined as follows.
  • the distance DP between a certain three-dimensional lattice point P and a certain hydrogen-donating atom D present in the biopolymer is a distance that can form a hydrogen bond (for example, 2.5 to 3.1 angstroms), and If the angle DHP formed by the three-dimensional lattice point P, the hydrogen H, and the hydrogen-donating atom D is such that the hydrogen bond can form a hydrogen bond (for example, 30 ° or more), the three-dimensional lattice point has a hydrogen accepting property. Is determined.
  • the distance PA between a certain three-dimensional lattice point P and a certain hydrogen acceptor atom A present in a biopolymer is a distance at which PA can form a hydrogen bond, and the three-dimensional lattice point P, isolated If the angle ZALP formed by the electron pair L and the hydrogen-accepting atom A can form a hydrogen bond, the three-dimensional lattice point can be determined to be hydrogen-donating. If a 3D lattice point is neither hydrogen-accepting nor hydrogen-donating, it is treated as having no hydrogen-bonding properties.
  • the hydrogen-bonding functional groups existing in the region designated by S6 are expected to form hydrogen bonds with the test compound.
  • a functional functional group is selected (S 8). If a large number of hydrogen bonding functional groups are present, they can be selected according to their importance. Further, based on the lattice point information of the three-dimensional lattice points calculated in S7, a dummy atom is set for each hydrogen-bonding functional group selected in S8 (S9).
  • a region (hydrogen bonding region) that can form a hydrogen bond with each hydrogen bonding functional group selected in S8 is determined.
  • a dummy atom is arranged at the center of a three-dimensional lattice point that forms a hydrogen bonding region including an appropriate number (for example, 5 to 20) of three-dimensional lattice points. Dummy atoms are located outside the van der Waals radii of other atoms within the hydrogen bonding region.
  • the hydrogen bonding region is a region having the same hydrogen bonding property and composed of a group of three-dimensional lattice points adjacent to each other.
  • two or more dummy atoms may be set from one hydrogen bonding functional group, and conversely, one dummy atom may not be set. If the number of set dummy atoms is large, It is preferable to narrow down to 10 or less, preferably 5 to 10 so as to leave only one Dami atom considered to be important deep inside the inner hole of the metal bond region. It should be noted that the dummy atom is given the same hydrogen bonding property as the three-dimensional lattice point where the dummy atom is arranged at the center.
  • one of the trial compounds was selected (S 10), and the three-dimensional coordinates, hydrogen bond category numbers, information for calculating the molecular force field, and the information for creating the conformation of the selected trial compound were stored in S 1.
  • a hydrogen bond correspondence relationship is provided between the dummy atom and the hydrogen bond in the trial compound (S12).
  • the number of combinations (combinations) i that form i hydrogen bonds is N (i) X n C i (where P represents a permutation and C represents a combination). It is preferable to select all possible combinations of dummy atoms and hydrogen bonding heteroatoms in the trial compound.
  • the distance between the dummy atoms is calculated (S14). If both the number of dummy atoms and the number of hydrogen-bonding heteroatoms in the trial compound are one, jump to step S22 without performing steps S14 to S21, and then Jump to step S26 without performing steps S23 to S25. If only one of the number of dummy atoms or the number of hydrogen-bonding atoms present in the trial compound is 1, if S14 to S21 is not performed, S22 Fly to the step.
  • J, k a ⁇ F ⁇ k a ' (wherein, n represents the number of hydrogen bonds, shows a ⁇ between r d ii th dummy monatomic, r u is the hydrogen bonding in the trial compound Indicates the i-th interatomic distance of the Te atom, indicates the lower limit of F, and 'indicates the upper limit of F).
  • 0.6 to 0.8 and k ′ are 1.2 to 1.4.
  • the intramolecular energy of the hydrogen bonding portion of the trial compound optimized in the step S 20 is calculated, and the conformation in which the value of the intramolecular energy is equal to or more than a certain value is removed.
  • the intermolecular interaction energy (sum of van der Waals interaction energy and electrostatic interaction energy) between the biopolymer and the hydrogen bonding part of the trial compound, and the hydrogen bonding part of the trial compound
  • the intramolecular energy of is calculated (S23).
  • the intermolecular interaction energy E inter _ between the biopolymer and the hydrogen-bonding moiety of the trial compound is the van der Waals interaction energy G of the lattice information of the three-dimensional lattice point closest to each atom k in the trial compound.
  • vdw (k) and the electrostatic interaction energy G elêt(k) it can be calculated from the following equation (where q, represents the charge of the atom k).
  • E intr _ a hydrogen bonding moiety of the trial compounds, it is known It can be calculated according to the method.
  • E int uses a published force field such as AMBER4.0 to calculate the following equation (where V n is a constant given to the arrangement of the atom types of the four atoms constituting the torsion angle). Where n is a constant representing the symmetry of the potential with respect to the torsion angle rotation, ⁇ is the torsion angle, and 7 is the phase of the potential with respect to the torsion angle rotation (the atomic type of the four atoms that make up the torsion angle).
  • a i; j and B denote the constants set for the pair of the i-th and j-th atoms in the trial compound molecule.
  • j indicate the distance between the j-th atom
  • qi indicates the charge of the i-th atom in the trial compound
  • indicates the dielectric constant.
  • the conformation of the trial compound in which the sum of the intermolecular interaction energy and the intramolecular energy calculated in S23 becomes a certain value or more is removed (S24). For example, it is preferable to remove the conformation in which the sum of the above energy is 10 kcal / mol or more per 100 molecular weight. Then, the structure of the hydrogen-bonding moiety of the trial compound having a conformation not removed in S24 is optimized (S25). By optimizing the torsion angle of the hydrogen bonding portion of the trial compound and the position and direction of the trial compound by performing a structure optimization calculation, the structure of the hydrogen bonding portion of the trial compound can be optimized.
  • E total E inter + E intra + Whb ⁇ Nhb - Chb
  • E inter and E inla are as described above, Whb is the weight, Nhb is the number of hydrogen bonds, and Chb is the stabilization energy by one hydrogen bond (for example, 2.5 kcal / mol).
  • E TQtal calculated from indicating
  • Powell method Press, f. H., Flannery , ⁇ . P., Teukolsky, SA, Vitterling, WT,, Numerical Recipes in C, 'Cambridge University Press, Cambridge, 1989
  • Powell method Press, f. H., Flannery , ⁇ . P., Teukolsky, SA, Vitterling, WT,, Numerical Recipes in C, 'Cambridge University Press, Cambridge, 1989
  • Steps S27 to S29 are repeated. Specifically, the intermolecular interaction energy between the biopolymer and the trial compound and the intramolecular energy of the trial compound are calculated (S27), and the intermolecular interaction energy calculated in S27 and the intramolecular energy are calculated. The conformation of the trial compound whose sum with the energy exceeds a certain value is removed (S28). afterwards,
  • the intermolecular interaction energy and intramolecular energy can be calculated in the same manner as in S23. (However, in S23, calculation is performed only for the hydrogen bonding portion of the trial compound molecule, but in S27, the entire trial compound molecule is calculated. It is necessary to calculate about).
  • the upper limit of the sum of the above energies is preferably lOkcalZmol per 100 molecular weight.
  • This step results in a stable complex of the biopolymer and the test compound and an active conformation of the test compound.
  • Optimization of the structure of the trial compound molecule can be performed in the same manner as in step S25. (However, in S25, only the structure of the hydrogen-binding portion of the trial compound molecule is optimized. In S29, it is necessary to optimize the structure of the entire trial compound molecule).
  • the docking operation between the biopolymer and the trial compound as described above is performed by an automatic docking program A DAM (PCT International Publication WO93 / 20525; Yamada, M. and Itai, Chem.
  • the trial compound is selected as a candidate compound for ligand (S31).
  • the energy of intermolecular interaction is electrostatic interaction energy, van der Waals interaction, hydrogen Binding energies, and sums thereof.
  • S32 it is determined whether or not all the test compounds have been selected (S32). If not all the test compounds have been selected, the process returns to the step S10 to return to the steps S10 to S31. Repeat the steps and if selected, go to step S33.
  • Narrow down to more promising ligand candidate compounds from the ligand candidate compounds selected in S31 (S33).
  • a list of candidate compound information eg, the intermolecular interaction energy between the biopolymer and the trial compound, the value of the intramolecular energy of the trial compound, the number of hydrogen bonds, the number of rings, etc.
  • the criteria for narrowing down is performed based on the number of hydrogen bonds that can be formed between the biopolymer and the candidate ligand compound, the value of the intermolecular interaction energy between the biopolymer and the candidate ligand compound, and the number of atoms. It is preferred to do so.
  • intermolecular interaction energy examples include electrostatic interaction energy, van der Waals interaction, and a sum thereof.
  • the number of hydrogen bonds can be set arbitrarily according to the type of biopolymer, but it is desirable to set, for example, 2 or more, preferably 3 or more.
  • the number of atoms can be set to any number, and for example, 20 or more, preferably 20 to 40 can be set.
  • a more preferred implementation of the present invention is where a large number of Dami atoms are made from the biopolymer, or where the trial compound has a considerable degree of conformational freedom or has a large number of heteroatoms.
  • the steps from S13 to S25 are performed on the partial structure of the trial compound, and hydrogen bonding modes that are impossible in the partial structure are performed.
  • the information on the combination of a Dami atom giving a hydrogen atom with a hydrogen-bonding heteroatom in the test compound and the hydrogen-bonding heteroatom in the test compound that cannot form a hydrogen bond with the dummy atom is stored.
  • Trial The partial structure of the row compound can be arbitrarily determined without any structural restrictions, but a structural portion containing three or more hydrogen bonding functional groups is preferable. In addition, the presence or absence of the degree of freedom of conformation of the structural part may be ignored.
  • the steps of S13 to S33 are performed for the entire structure of the trial compound, and the combination including the hydrogen-bonding heteroatom and the dummy atom and the hydrogen-bonding heteroatom conserved in the step are performed.
  • the number of combinations and conformations to be tested can be reduced, and the time required to search for the structure of a stable biopolymer-trial compound complex can be significantly reduced.
  • the PP method is based on the hypothesis that hydrogen bond modes that are not possible in the partial structure of the trial compound—ligand conformations are not possible in the overall structure of the trial compound. By employing this PP method, it is possible to significantly reduce the search time without affecting the accuracy and reliability of the complex structure of the obtained biopolymer-trial compound at all.
  • Atomic coordinates of dihydrofolate reductase are the binary complex of 01 ⁇ ? 1? -Methtrexate of Escherichia coli available from the Principal Tin Data Bank Entry 40 13 ⁇ 4. The value obtained from the atomic coordinates of was used. Based on the crystal structure of the ternary complex of DHFR-folate-NADP +, the atomic coordinates of the cofactor NADP + molecule were added to the atomic coordinates of the binary complex. At this time, all the water molecules except the two water molecules, which bind very strongly to DHFR and cannot be chemically removed, were removed from the atomic coordinates of the binary complex. One of the two water molecules not removed was tryptophan at position 21 of DHFR and aspartic acid at position 26, and the other was leucine at position 114 and leucine at position 16. Hydrogen bonds to threonine.
  • ACD-3D Available Chemicals Directory
  • MDL Available Chemicals Directory
  • the criterion to be selected as a candidate ligand compound is that the value of the interaction energy with the target biopolymer (enzyme) is less than -7 Kcal / mol per 100 molecular weight, the number of intermolecular hydrogen bonds is 3 or more, and The number of atoms was set to 25 or more.
  • about 1,400 trial compounds were finally selected as ligand candidate compounds, and the time required from the input of the three-dimensional coordinates of the biopolymer to the selection of the ligand candidate compound was about 80 hours. .
  • These candidate ligand compounds included a number of substrates and known inhibitor analogs, including the compounds shown in FIG.
  • the inhibitor methotrexate and the substrate dihydrofolate were excluded from this search due to the limited number of rotatable bonds, but trimethoprim was selected as a candidate ligand compound.
  • the binding mode and conformation of the ligand candidate compound presented by the method of the present invention are in good agreement with the binding mode and conformation deduced from the crystal structure of the complex between the substrate and the inhibitor analog and the enzyme.
  • a large number of ligand candidate compounds having a novel structure having little similarity to the structures of the substrate and the known inhibitor were also selected.
  • An example is shown in Fig. 4 together with the docking model.
  • the thick line indicates the skeleton of the ligand molecule
  • the dotted line indicates the hydrogen bond
  • the thin solid line indicates a part of the biopolymer
  • the dashed bird cage indicates the region allowed at the center of the ligand atom.
  • a ligand compound for a target biomolecule having a known structure can be searched from a three-dimensional structure database in a short time while considering the degree of freedom of conformation. And very easily obtain extremely reliable search results. Therefore, the method of the present invention is useful for creating a lid compound that acts as an inhibitor agonist or antagonist on biopolymers in the fields of medicine and pharmacy.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Medicinal Chemistry (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

明 細 書 三次元構造デ一夕ベースから新規リガンド化合物を検索する方法 技術分野
本発明は、 医薬、 農薬、 その他の生理活性化合物の構造設計に利用可能な三次 元構造データベースの検索方法に関する。 背景技術
一般に、 薬物は標的となる生体高分子と強い相互作用をすることによってその 薬理作用を発現する。 近年、 X線結晶解析や N M Rの技術の進歩により、 生体内 で重要な働きをする生体高分子の立体構造が次々と解明されている。 このような 研究の進展にともない、 従来もっぱらランダムスク リ一二ングゃ偶然の発見によ つてなされてきた新規薬物のリード創製についても、 生体高分子の三次元構造の 情報に基づいた論理的なアプローチの方法論や成功例が報告されるようになって きた。 現在、 このようなアプローチの重要性はますます強く認識されており、 世 界中で様々な角度から研究が行われている。
これらの研究の目標の 1つは、 リガンドとなり得る構造をコンピューターに構 築させる方法を提供することにあり、 他の目標は、 既存化合物の三次元構造デー タベースからリガンド構造を検索する方法を提供することである。 前者 (構造自 動構築法) は、 可能なリガンド構造を構造既知 ·未知に関係なく広く示唆できる 点で優れてる。 一方、 後者 (データベース法) は、 既存化合物の構造を蓄積した データベースから新しい生理活性化合物を見い出すのに用いられるが、 特に、 自 社内に保存されていたり入手可能な市販化合物についてのデータベースを対象と して検索を行うことにより、 検索条件を満たした化合物 (ヒッ ト化合物) を合成 的労力なしに入手して、 標的生体高分子への結合定数や生物活性を測定すること ができる点で優れている。
新しい骨格構造を有する化合物の合成には、 一般に専門家でも数力月を要する ので、 数多くの有望な構造を合成して活性を測定するには長い年月と多くの労力 を要するが、 入手可能な化合物であれば数十もの有望なリガン ド候補化合物につ いて結合定数や生物活性を測定するのは容易である。 また、 ある程度強い結合や 活性が認められた化合物の構造を基にすれば、 より結合定数や生物活性の強い化 合物を設計し、 合成することによって効率的にリ一ド創製を行うことが可能であ る。 このような理由から、 近年、 既知化合物の三次元構造データベースを検索し て、 新し t、生理活性化合物を発見するアプローチに関心が集まっている。
もっとも、 この方法の問題点は、 どのような検索条件で検索を行うかというこ とにある。 一般には、 铸型となる代表的な生理活性化合物が有する原子団ゃ官能 基のうち、 活性に必須であると推定される原子団ゃ官能基を有しているか否か、 あるいはそれらの位置関係が铸型化合物のものと似ているかどうかを検索条件に して、 三次元構造データベースを検索する方法が採用されている。 標的生体高分 子の構造が不明な場合には基本的にはこの手法に頼らざるを得ないが、 このよう な検索条件は推定や仮説に基づいているために、 ヒッ ト化合物が铸型化合物と同 じ活性を有しない場合も多い。 構造の特徴が異なる 2個以上の分子が同種活性を 有している場合、 それらの分子の構造に関する情報を用いても、 活性に必須な官 能基やそれらの位置関係についてよりもっともらしい作業仮説を構築することが 可能になるにすぎない。
三次元構造データベースを検索する上で最も困難な問題は、 試行化合物の配座 の自由度の取扱いである。 生体高分子に結合する (最安定複合体を形成する) 際 のリガンドの配座は、 その分子自身の結晶中 ·溶液中における構造や、 エネルギー 計算による最安定エネルギーの構造のいずれとも一致する必然性はなく、 同じリ ガンド分子でも相手の生体高分子によつて異なる配座で最安定複合体を形成する ことができることが知られている。 一般に、 データベース中には、 1つの化合物 については存在し得る多数の配座のうちの 1つの配座の三次元構造の原子座標が 収められていることが多い。 また、 結晶構造由来のデータベースを除けば、 各化 合物の三次元構造の情報は、 二次元に入力された構造を計算的に三次元構造にし たものを基にしている。 このような三次元構造は、 その分子自体のとりうる局所 安定構造の 1つであることが多い。
そこで、 データベースに収められている化合物の配座のみを基にして検索条件 を満たすかどうかを調べると、 他の配座を考えればヒッ 卜すべき化合物が適切に 選択されない場合が生じる。 考慮すべき配座の数は、 結合回転可能な結合数によ つて変化し、 また、 どの程度きめ細かく配座を考慮するかなどの要因によっても 変わるが、 中程度にフレキシブルな回転が可能な結合を 3〜 6個含む分子では一 般に数十個から数十万個の配座を扱う必要がある。 これらの可能な配座を考慮す るには、 予め有望な配座を選んでデータベース側に入力しておく力、、 あるいは検 索時に作り出して調べるかのいずれかの方法しかない。 いずれにしても、 膨大な 計算機資源 (記憶容量) と計算時間とが必要となる。
最近、 Merck社の Kearsleyらは、 データベース側で 1化合物につき最大 2 0個の 配座を収めたデータベースを作成し、 官能基間の位置関係を主とした検索条件で 検索するシステム FLOG を発表した (M. D. Miller, S. K. Kearsley, D. J. Underwood, and R. P. Sheridan: Journal of Computer - Aided Molecular Design, 8, 1994, pp. 153-174, FLOD: A system to select 'quasi-flexible ' ligands complementary to a receptor of known three-dimensional structure. ) 0 FLOG は 1 0万化合物の 2 0 0万配座を持つデータベースを検索するのに、 CRAYというスー パーコンピューターを用いて約 1週間を要するという。 各化合物について平均 2 0 個の配座は、 予め各化合物についての配座解析を行ってエネルギーの安定な局所 安定構造を選んで収めてあるが、 そのための時間と労力は莫大なものである。 し かしながら、 1化合物当たり 2 0個の配座では十分とはいえない。
また、 検索条件としては、 铸型となる活性化合物中で活性に必須と推定される 官能基の有無やそれらの間の距離や角度 ·方向を採用しているが、 これらの条件 は考えられる条件のうち最も幼稚なものであり、 アルゴリズムが易しく計算時間 もかからないという利点はあるものの、 ヒッ ト化合物がが実際に所望の活性を有 する確率は高くはない。 この理由は、 官能基だけが望ましい位置関係にあつたと しても、 分子全体の形状や大きさが適当でない分子は活性を発揮し得ないからで ある。標的生体高分子の立体構造が既知の場合にはその情報を用いるのが最も効 果的であり、 ヒッ ト化合物が所望の活性を有する確率が高い。
例えば、 Dupont Merck社の Eyermannらは、 生体高分子との複合体として X線結晶 解析されたリガンド分子中の官能基の位置関係に基づいて、 データベースを検索 した (P. Y. S. Lam, P. K. Jadhav, C. J. Eyermann, C. N. Hodge, Y. Ru, L. T. Bacheler, J. L. Meek, H. J. Otto, M. . Rayner, Y. N. Wong. C. H. Chang, P. C. Weber, D. A. Jackson, T. R. Sharp, and S. Erickson-Viitanen: Science, 263, 1994, pp. 380-384, Rational design of Potent, Bioavailable, nonpeptide cyclic Ureas as HIV Protease Inhibitors. ) 。 HIVプロテアーゼの系では、 ぺ プチド性リガンド分子中の 2個のベンゼン環の中心でプロテアーゼとリガンドと を水素結合で結んでいる水分子中の酸素原子の 3点が同じような位置関係にある ような分子を検索した。 ヒッ ト化合物の中からリガンド結合部位にうまく嵌合し、 検索条件に入れた酸素以外にも水素結合が形成されている化合物を 1つ選び出し た。 この化合物の構造を基にして、 酵素阻害活性を測定しつつ適宜構造を修正し た化合物を合成する作業を繰り返した結果、 非常に活性の高い化合物を見いだし たと報告している。 しかしながら、 検索法についての詳しい記述がなく、 配座を どのように扱っているか不明である。
ヒッ ト化合物が所望の活性を有する確率が最も高くなる検索条件は、 標的生体 高分子のリガンド結合部位に化合物が安定に結合できるか否かという検索条件で ある。 もっとも、 この条件が満たされた場合においても物性面 (水溶性など) が 原因となって活性が発現されない場合もあるが、 この条件を満足することは活性 発現のための最小限の条件である。 一方、 特定の官能基の有無や官能基の位置関 係は必ずしも活性発現にとつて必須ではなく、 化合物系が異なり分子骨格が相違 しても、 標的生体高分子との間で同程度に安定な複合体を形成できれば同様な生 物活性を発揮できる可能性がある。 従って、 リガンド結合部位に安定に結合でき るという条件を満足する化合物は、 実際にリガン ドとなり得る化合物である可能 性が高い。 つまり、 標的生体高分子のリガンド結合部位へのフイ ツ 卜という検索 条件を用いることにより、 所望の生物活性を有するより広汎な構造の化合物をデー タベースから選び出すことが可能になる。
標的生体高分子に対してある特定のリガンド分子が結合できるか否かを判断す るためには、 可能な複合体構造のうち最も安定な複合体構造を探索し、 その複合 体がどの程度に安定かを知る必要があり、 与えられた生体高分子とリガン ド分子 との間の最も安定な複合体構造を探索するには、 すべての可能な結合様式 (一方 の分子を固定して、 他方の分子を回転 '併進させることに対応する) と可能なリ ガンド配座を網羅して安定性を評価する必要がある。 しかしながら、 この作業は 膨大な計算を必要とするために、 人間がグラフィ ック ·ディスプレイに向かって 会話的に行うのは困難であり、 これ作業を自動的かつ効率的に行う自動ドッキン グ法の開発が待ち望まれていた。
自動ドッキングの方法として、 Kuntz らはリガンド結合部位の形状を数個〜数 十個の內接する球を用いて表現し、 それらの球の中心がつくるべク トル群とリガ ンド化合物の分子内の原子間べク トル群とを比較することにより、 可能な結合様 式を推定する方法を開発した (R. L. Desjarlais, R. P. Sheridan, G. L. Seibel,
J. S. Dixon, I. D. Kuntz and R. Venkataraghavan : J. Med. Chem. 31 (1989)
722- /29. Using Shape Complementarity as an Initial Screen in Designing Ligands for a Receptor-Binding Site of Known 3 - Dimensional Structure. ) c 最近の改良法では、 べク トルの一致度を示すスコアの他に、 分子間エネルギーも 計算できるように変更されている。
しかしながら、 この方法の欠点は、 結合様式の網羅だけについても相当の時間 を要することである。 改良法では、 1つの化合物のドッキングについて配座を変 化させることができるように変更されたものもあるが、 すべてのドッキングのプ 口セスを自動的に進むように設計されているのではない。 また、 エネルギー評価 はヒッ 卜した化合物についてはできても、 結果を得るまでの過程では簡略なスコ ァしか計算できないし、 水素結合等も考慮できない。 また、 精度にも問題があり、 結晶として観測された正しい複合体構造が最安定の結果を与えず、 かなり低い順 位に見積もられることもあるなど問題点が多い。 しかし、 致命的な欠陥は基本的 に配座を固定して行う方法であり、 配座の自由度が取り扱えないことである。 特 に、 多数の化合物を自動的に扱う必要がある三次元データベース検索では、 上記 の欠点を人間の手仕事で補うことができないため、 実用性がきわめて低い。
本発明者らは、 生体高分子とリガンド分子間の最安定複合体構造を自動的に、 かつ先入観を入れずに推定する方法として A D A Mを開発し、 上記の問題をすベ て解決することに成功した (PCT/JP93/0365, PCT国際公開 W0 93/20525 ; M. Yaraada and A. Itai, Chem. Pharm. Bull. , 41, . 1200, 1993; M. Yamada and A. I tai, Cheni. Pharm. Bull. , 41, p. 1203, 1993 ; and M. Yamada Mizutani, N. Tomioka and A. Itai, J. Mol. Biol. , 243, pp. 310-326, 1994) 。
結晶解析により複合体構造が知られているいくつかの酵素一阻害剤分子の系に A D A Mを適用してみたところ、 すべての場合にエネルギー最低の複合体モデル が結晶中の複合体構造を非常によく再現しており、 リガンド分子中の結合回転で きる結合のねじれ角や水素結合様式なども極めて良く再現されていた。 A D A M の高い精度は、 全部で 3回行われる構造最適化 (エネルギー最小化) 計算に起因 している。 所要時間はコンピューターの性能やダミー原子数、 ヘテロ原子数、 回 転可能な結合数などに依存するので一概にはいえないが、 広く普及しているヮー クステーション (R 4 4 0 0 ) を用いた場合、 普通の薬物分子の構造で初期複合 体モデルを得るのに数分から 1時間弱程度である。 この解析速度は、 配座固定で なく全部の可能な配座を考慮している方法としては、 現在発表されている最速の もの方法と比べても数十倍速い。
しかしながら、 A D A Mは一つの生体高分子と一つのリガンド分子間との最安 定複合体構造を探索する目的には適しているものの、 三次元構造データベース中 に収められている多種多様な化合物の中から新規なリガンド化合物を探索するの に利用するには適しておらず、 さらなる改良が求められていた。
従って本発明は、 従来技術の問題点を解決し、 多種多様な化合物の中から新規 なリガンド化合物を探索するために適した方法を提供することを目的とする。 発明の開示
本発明者らは鋭意努力した結果、 試行化合物の配座を変化させながら生体高分 子と試行化合物とをドッキングさせて複合体の構造を作成し、 生体高分子と試行 化合物分子の間の相互作用エネルギー (例えば、 水素結合、 静電相互作用、 及び ファンデルワールス力) を評価し、 構造最適化を繰り返すことにより前記複合体 の最安定結合様式を探索し、 得られた最安定複合体における生体高分子と試行化 合物との相互作用エネルギーの値に基づいて試行化合物群の中からリガン ド候補 化合物を選択することにより、 膨大な数の試行化合物から多数の有望なリガン ド 化合物候補を選択する方法を開発することに成功し、 本発明を完成するに至つた。 すなわち、 本発明は、
(i) 2種以上の試行化合物の三次元座標に対し、 水素結合性カテゴリー番号、 分子 力場計算用の情報および配座作成用の情報を用意する第 1工程;
(ii)生体高^?の三次元座標から、 リガンド結合領域の物理化学的情報およびダミ一 原子を用意する第 2工程;
(iii) 第 1工程で用意した試行化合物の三次元座標に対する水素結合性力テゴリー 番号、 分子力場計算用の情報および配座作成用の情報、 並びに、 第 2工程で用意 したリガンド結合領域の物理化学的情報を基にして、 試行化合物の配座を変化さ せながら生体高分子と試行化合物をドッキングさせて複合体の構造を作成し、 生 体高分子と試行化合物分子の間の相互作用を評価することにより前記複合体の最 安定構造を探索する第 3工程;
(iv)第 3工程で探索した最安定複合体構造における生体高分子と試行化合物の相互 作用エネルギーの値に基づいて、 該試行化合物をリガンド候補化合物として選択 するか否かを判定する第 4工程;および
(V) 全ての試行化合物について第 3工程および第 4工程を繰り返す第 5工程; を含む、 三次元構造データベースから生体高分子に対するリガン ド化合物を検索 する方法を提供するものである。
さらに、 本発明の方法は、 生体高分子と形成しうる水素結合の数および/また は生体高分子との相互作用エネルギーの値に基づいて、 第 4工程で選択されたリ ガン ド候補化合物を絞り込む第 6工程を含んでいてもよい。 図面の簡単な説明
第 1図は、 本発明の方法の構成の概念図として示した図である。
第 2図は、 本発明の方法の一態様についてのフローチヤ一トを示す図である。 図中、 Sは各ステップを示す。
第 3図は、 本発明の方法によりリガンド候補化合物として得られたジヒ ドロ葉 酸還元酵素の基質および既知阻害剤アナログの一例を示す図である。
第 4図は、 本発明の方法により得られたジヒ ドロ葉酸還元酵素の新規な構造を もつリガンド候補化合物の一例を示す図である。 発明を実施するための最良の形態
本発明の方法において、 試行化合物は構造が既知の化合物であれば特に限定さ れず、 例えば、 現存するデータベースに収納されている種々の化合物を用いるこ とができる。 水素結合性カテゴリー番号とは、 水素結合を形成しうる原子団につ いての識別用番号であり、 その原子団中で直接水素結合に関与するへテロ原子に 付与される。 その番号により、 その原子団の幾何学的構造及び水素結合の性質、 並びにその相手となる水素結合性原子 (ダミー原子) の位置が即座に作り出され る。 分子力場計算用の情報とは、 分子力場を用いて分子内 ·分子間の相互作用ェ ネルギーを計算するために各原子に与えられる番号や電子の状態のことであり、 原子タイプ番号や原子電荷を含むものとして用いる。 また、 配座作成用の情報と は、 結合回転可能な結合のねじれ角を変化させて異なる配座を系統的に作成する ために用いるそれらのねじれ角の初期値 .終値及び何度ずつ回転させるかの増分 値のことであり、 1個の結合についてねじれ角を構成する 4つの原子の入力順番 号とねじれ角の初期値、 終値、 及び回転角が含まれる。
生体高分子とは、 生体に見出される高分子の他、 生体に見出される高分子を模 擬した分子をも含む概念である。 リガンド結合領域の物理化学的情報とは、 リガ ンドが結合できる生体高分子の凹んだ領域の内部において生体高分子の全原子の 及ぼすポテンシャル的影響をいい、 リガンド結合領域内の三次元格子点の水素結 合性 (水素受容性又は水素供与性) 、 その三次元格子点にプローブ原子を置いた ときに生体高分子とプローブ原子との間に働くファンデルワールス相互作用エネ ルギ一および静電相互作用エネルギーが含まれる。 ドッキングとは、 あるリガン ド化合物の分子とある生体高分子との複合体を形成させること、 および両者の安 定複合体構造を探ることを含む概念として用いる。 ドッキングは、 一般的には、 分子模型を用いる方法、 コンピューターとコンピューター ' グラフィ ックスを用 いたシュミ レーション手法、 又は自動ドッキング法等を用いて行うことができる。 生体高分子と試行化合物との相互作用とは、 生体高分子と試行化合物との間に 働く力、 例えば、 水素結合、 静電相互作用、 ファンデルワールス相互作用等など のことである。 リガンドあるいはリガンド化合物とは、 生体高分子に結合する低 分子量の化合物をいい、 その例としては、 薬物、 酵素の基質 .阻害剤 ·補酵素、 その他の生理活性物質を挙げることができる。
本発明の方法の一態様によれば、 上記の第 3工程は、 以下の工程:
(1) 生体高分子中の水素結合性官能基の水素結合の相手となり得るヘテロ原子の位 置に設定したダミー原子と試行化合物中の水素結合性へテロ原子との対応づけを 組合せ的に網羅することにより、 生体高分子一試行化合物間の有利な結合様式を 網羅する工程 a ;
(2) 試行化合物の配座を系統的に変化させながら、 前記のダミー原子間の距離と前 記の水素結合性へテロ原子間の距雜を比較することにより、 生体高分子一試行化 合物間の可能な水素結合様式及び試行化合物の水素結合性部分の配座を同時に推 定する工程 b ;及び
(3) 工程 bで得られた水素結合様式と配座毎に、 試行化合物中の水素結合性へテロ 原子とダミー原子との対応関係に基づいて、 試行化合物の全原子の座標を生体高 分子の座標系に置き換えることにより、 生体高分子 -試行化合物の複合体構造を 得る工程 c
を含んでいてもよい。
また、 本発明の方法の別の態様に従えば、 上記の第 3工程は、 以下の工程:
(1) 生体高分子中の水素結合性官能基の水素結合の相手となり得るヘテロ原子の位 置に設定したダミー原子と試行化合物の部分構造中の水素結合性へテ口原子との 対応づけを組合せ的に網羅することにより、 生体高分子一試行化合物間の有利な 結合様式を網羅する工程 a ;
(2) 試行化合物の配座を系統的に変化させながら、 前記のダミー原子間の距離と前 記の水素結合性へテロ原子間の距離を比較することにより、 生体高分子一試行化 合物間の水素結合様式及び試行化合物の部分構造の配座を同時に推定する工程 b ;
(3) 工程 bで得られた水素結合様式と配座に基づいて、 前記の試行化合物の部分構 造中で不可能な水素結合様式を与えるダミー原子と水素結合性へテロ原子の組合 せ、 及びダミー原子と水素結合を形成し得ない水素結合性へテロ原子を保存する 工程 c ;
(4) 工程 cで保存された水素結合性へテロ原子を含む組合せ、 及び工程 cで保存さ れたダミー原子と水素結合性へテロ原子の組合せを除いて、 ダミー原子と試行化 合物全体の水素結合性へテロ原子との対応づけを組合せ的に網羅することにより、 生体高分子-試行化合物間の有利な結合様式を網羅する工程 d ;
(5) 試行化合物の配座を系統的に変化させながら、 前記のダミー原子間の距離と前 記の水素結合性へテロ原子間の距雜を比較することにより、 生体高分子-試行化 合物間の可能な水素結合様式及び試行化合物の水素結合性部分の配座を同時に推 定する工程 e ;及び
(6) 工程 eで得られた水素結合様式と配座毎に、 試行化合物中の水素結合性へテロ 原子とダミー原子との対応関係に基づいて、 試行化合物の全原子の座標を生体高 分子の座標系に置き換えることにより、 生体高分子 -試行化合物の複合体構造を 得る工程 f ;
を含んでいてもよい。
第 3工程が上記のようなサブ工程を含むことにより、 生体高分子—試行化合物 の安定複合体構造の探索の高速化が可能になるとともに、 生体高分子及びノ又は 試行化合物が複雑な構造を有する場合においても、 最安定を含む安定な複合体の 構造を短時間に探索することが可能となる。
本発明のさらに別の態様によれば、 上記の第 3工程は、 以下の工程:
(1) 生体高分子中の水素結合性官能基の水素結合の相手となり得るヘテロ原子の位 置に設定したダミー原子と試行化合物中の水素結合性へテロ原子との対応づけを 組合せ的に網羅することにより、 生体高分子一試行化合物間の有利な結合様式を 網羅する工程 a ;
(2) 試行化合物の配座を系統的に変化させながら、 前記のダミー原子間の距離と前 記の水素結合性へテ口原子間の距離を比較することにより、 生体高分子一試行化 合物間の可能な水素結合様式及び試行化合物の水素結合性部分の配座を同時に推 定する工程 b ;
(3) 工程 bで得られた水素結合様式を保持しつつ、 ダミー原子と試行化合物中の水 素結合性へテロ原子の位置が一致するように試行化合物の配座を最適化し、 次い で、 分子内エネルギーの高い試行化合物の配座を除去する工程 c ;
(4) 工程 cで除去されなかった配座毎に、 試行化合物中の水素結合性へテロ原子と ダミー原子との対応関係に基づいて、 試行化合物の全原子の座標を生体高分子の 座標系に置き換えることにより、 生体高分子一試行化合物の複合体構造を得るェ 程 d ;
(5) 工程 dで得られた水素結合性部分の複合体構造から、 試行化合物中の水素結合 性部分の分子内エネルギー及び生体高分子-該試行化合物中の水素結合性部分の 分子間相互作用エネルギーの高い複合体構造を除去し、 次いで、 残った複合体構 造について構造の最適化を行う工程 e ;
(6) 工程 eで得られた複合体構造毎に、 試行化合物の非水素結合性部分の配座を発 生させて新たな試行化合物全体を含む複合体構造を得る工程 f ;及び
(7) 工程 f で得られた複合体構造から試行化合物全体の分子内エネルギー及び生体 高分子 -試行化合物の分子間相互作用エネルギーの高い複合体構造を除去し、 次 いで、 残った複合体構造について構造の最適化を行う工程 g ;
を含んでいてもよい。
第 3工程が上記のようなサブ工程を含むことにより、 生成させる配座の数を減 少させても適切な複合体構造を選択することが可能になり、 精度のよい安定複合 体が得られる。
上記方法において、 水素結合性官能基には、 水素結合に関与することのできる 官能基及び原子が含まれる。 また、 水素結合性へテロ原子とは、 試行化合物中に 存在する水素結合性官能基を構成するへテロ原子をいう。 水素結合性部分とは、 試行化合物の構造のうち、 ダミー原子と対応づけられる水素結合性へテロ原子を 含む構造部分をいい、 非水素結合性部分とは、 水素結合性部分以外の構造部分を いう。
本発明のさらに別の態様によれば、 試行化合物の三次元座標を読み込んで、 必 要な場合には水素原子の三次元座標を付加し、 原子タイプ番号、 水素結合性カテ ゴリー番号、 原子電荷および結合回転の様式を付与することにより、 三次元デ— タベースを作成する方法が提供される。
以下、 第 2図のフローチヤ一トを参照しつつ、 本発明の好ましい態様について 説明する。 第 2図中の Sは各ステップを示しており、 A D A Mとは、 国際公開 TO93 /20525号明細書 (国際公開日 1993年 10月 14日) に開示された生体高分子一リガン ド 分子の安定複合体構造の探索方法のことを示す。 なお、 PCT 国際公開 W0 93/20525 号明細書の開示を本明細書の開示に含める。
最初に、 2種以上の試行化合物の A D A M仕様三次元データベ一スを作成する ( S 1 ) 。 上記のデータベースは、 例えば以下のようにして作成することができ る。 まず、 試行化合物の三次元座標を入力する。 試行化合物の三次元座標として は、 二次元構造データベースから得られる二次元座標を力場計算的に三次元座標 に変換した座標、 単独の結晶の構造解析、 結晶データベースやエネルギー計算を 基にしたモデルビィルディ ングより得られた立体構造等から得た座標などを用い ることができる。 試行化合物の原子座標が表す立体構造については、 原子間の結 合距離、 結合角等の幾何学的な量が正確であれば、 基本的には配座を問題とする 必要はない。 もっとも、 試行化合物を構成する各原子の電荷をできるだけ正確に 算出するためには、 ある程度単独で安定な立体構造を与える原子座標を入力する ことが好ま しい。
上記の試行化合物の三次元座標を入力した後、 必要な場合には水素原子を付加 し、 さらに各原子の原子タイプ番号、 水素結合性へテロ原子の水素結合性カテゴ リー番号、 各原子の原子電荷、 結合回転の様式 (どの結合を回転させるか、 ある いは何度から回転を始めて何度おきに回転させるか等) を自動的に付加すること により、 三次元データベースを作成することができる。
試行化合物を構成する原子の原子タイプ番号は、 例えば Weiner ら (Weiner. S. J. , Kollman, P. A. , Case, D. A., Singh, U. C. , Ghio. C., Alagona, G. , Profeta, S. , Jr. , and Weiner, P. , J. Am. Chem. So , 106, 1984, pp. 765- 784)の行った番号付けを用いることができる。 試行化合物中に存在する水素結合性 ヘテロ原子の水素結合性カテゴリ一番号は、 下記の表 1に従って付加することが できる。 試行化合物を構成する各原子の電荷は、 例えば Gasteiger法、 M0PAC プロ グラム中の MND0法、 AMI 法など用いた分子軌道法計算により算出することができる。 結合回転の様式については、 ねじれ回転可能な単結合を 6 0 ° 〜 1 2 0 ° の一定 の回転角で系統的に回転させる回転様式を指定することが好ましい。 表 1 . 水素結合性官能基を構成する原子の種類と水素結合性カテゴリ一番号
水素結合性カテゴリー番号 水素結合性官能基を構成する原子の種類
1 第一ァミ ンの s p の N
2 第一ァミンの s p 3 の N
3 アンモニゥムイオンの s p 3u の N 4 アミ ドの s ρ ώ の Ν
5 第二ァミ ンの s ρ 3 の Ν
6 芳香族の Ν
7 プロ トン化した芳香族の Ν
8 第三ァミ ンの Ν
9 プロ トン化した第三ァミ ンの Ν
1 0 C一 0結合の回転可能なヒ ドロキシルの 0 1 1 エーテルの 0
1 2 カルボニルの 0
1 3 カルボシキレー トァニオンの 0
1 4 カルボン酸の 0
1 5 ホスフ X— 卜の 0
1 6 水分子の 0
1 7 メルカプトの S
1 8 チォエーテルの S
1 9 水素の位置が固定したヒ ドロキシの 0 つぎに、 生体高分子を構成する原子の番号と原子座標 (但し、 水素原子の原子 座標は除く。 ) を入力する (S 2 ) 。 生体高分子の原子座標は、 X線結晶解析や N M R解析により得られた立体構造の情報、 蛋白質結晶データベース等から入手 可能な情報、 あるいはこれらの情報を基にして構築された生体高分子モデルの原 子座標などを用いることができる。 生体高分子の原子座標は三次元座標系で表さ れることが好ましい。 また、 生体高分子に結合して構造的にも機能的にも重要な 役割を果たす補因子を生体高分子の一部とみなして、 該補因子を結合した状態の 生体高分子の原子座標を入力して以後のステツプを行ってもよい。 このような補 因子としては、 補酵素、 水分子、 又は金属イオン等を挙げることができる。
上記ステップに続いて、 生体高分子中に存在するアミノ酸残基を構成する水素 原子の原子座標を算出する (S 3 ) 。 一般に、 生体高分子の水素原子の位置を X 線結晶解析や N M R解析等の実験的手法で求めることは困難であり、 また、 蛋白 質結晶データベース等からも水素原子に関する情報は入手できない。 従って、 生 体高分子中に存在するアミノ酸残基の構造に基づいて、 該ァミノ酸残基を構成す る水素原子の原子座標を算出する必要がある。 回転可能なァミノ酸残基に結合し ているためにその原子座標を一義的に決定できない水素原子は、 卜ランス位に存 在すると仮定して原子座標を算出することが好ましい。
その後、 生体高分子中に存在するアミ ノ酸残基を構成する原子に電荷を付加し
( S 4 ) 、 生体高分子中に存在する水素結合性官能基を構成するへテロ原子につ いて水素結合性カテゴリ—番号を付加する (S 5 ) 。 電荷の値としては、 各アミ ノ酸について算出されている文献値、 例えば、 Weinerの値 (Weiner, S. J. , Kollman, P. A. Case, D. A. , Singh, U. C. , Ghio, C. , Alagona, G. , Profeta,
S., Jr. and Weiner, P., J. Am. Chem. Soc., 106, 1984, pp. 765 - 784)などを 用いることができる。 水素結合性カテゴリー番号は、 上記の表 1に従って付加す ればよい。
つぎに、 リガン ド結合領域を指定する (S 6 ) 。 リガン ド結合領域としては、 生体高分子の任意の部位を含む領域、 好ましくは直方体の領域を選択することが できる。 目的に応じてリガンド結合ポケッ トやその周辺の生体高分子の部位を選 択してもよく、 必要に応じてェフエクタ一等の他の分子の結合する生体高分子の 部位を含む領域を選択することも可能である。 なお、 リガンド結合ポケッ 卜とは、 生体高分子の凹んだ分子表面にあり、 基質や阻害剤などのリガンド分子が結合す る内孔をいう。 リガンド結合領域の範囲の指定には、 例えばプログラム G R E E N (Tomioka, N. , Itai, A. , and Iitaka, Y. , Journal of Computer Ages Molecular Design, vol. 1 , 1987, pp. 197-210) の機能の一部を利用することができる。
S 6で指定した領域内に三次元格子点を発生させ、 各三次元格子点につき番号 付けと格子点情報の算出を行う (S 7 ) 。 三次元格子点とは、 生体高分子のリガ ンド結合領域内の一定間隔毎に発生させる三次元格子上の点をいい、 格子点情報 とは、 各三次元格子点上にプローブとなる原子があると仮定して算出した生体高 分子とプローブ原子の間に働くファンデルワールス相互作用エネルギー及び静電 相互作用エネルギー、 並びに水素結合性等のリガンド結合領域の局所的な物理化 学的情報を含む概念である。 この三次元格子点の格子点情報を利用することによ り、 以後のステツプで行う生体高分子と試行化合物の分子間相互作用エネルギー の近似計算の高速化が可能となり、 また、 以後のステップで設定するダミー原子 の位置を合理的に決定することが可能となる。 その結果、 生体高分子と試行化合 物のドッキングモデルを短時間に網羅的に探索できるようになる。
三次元格子点は、 0. 3〜2. 0オングス トローム、 好ましくは、 0. 3 -0. 5オング ストロームの一定間隔で S 6で指定した領域内に発生させることができる。 プロ一 ブ原子としては、 リガンドとなる可能性のある化合物に含まれるすべての原子種 を採用することが好ましい。 各三次元格子点に配置した各プローブ原子と生体高 分子との間に働くファンデルワールス相互作用エネルギーは、 経験的なポテンシ ャル関数を用いて常法の原子対計算により算出することができる。 経験的なポテ ンシャル関数としては、 以下の式で表されるような Lennard- Jones type関数を用い ることができる。
Gvdw. i =∑(A/r i j 1 2-B/ri j 6)
j 式中、 iはプローブ原子の位置を示す番号を、 j は生体高分子の原子の番号を 表す。 A及び Bは極小のポテンシャルの位置と大きさを決定するパラメ一ターを 表す。 は、 i番目に配置したプローブ原子と生体高分子の j番目の原子との間 の距雜を表す。 なお、 上記の A及び Bのパラメータ一としては、 例えば Weiner らの値 (Weiner, S. J. , Kollman, P. A. , Case, D. A. , Singh, U. C. , Ghio, C., Alagona, G. , Profeta, S., Jr. , and Weiner, P., J. Am. Chem. Soc. , 106, 1984, pp. 765- 784)を用いることができる。
試行化合物をこの三次元格子点上に配置した際の試行化合物—生体高分子間の ファンデルワールス相互作用エネルギーは、 以下の式 (式中、 mは試行化合物中 の原子の番号であり、 Nは試行化合物中の原子の数であり、 は m番目の原子に 最も近い三次元格子点の番号である) から算出することができる。
Figure imgf000018_0001
各三次元格子点に配置した各プロ一ブ原子と生体高分子との間に働く静電相互 作用エネルギーは、 以下の式 (式中、 i、 j、 及び は前記定義のとおりであり、 q j は生体高分子の j番目の原子の電荷を示し、 Kはエネルギー単位を変換するた めの定数を示し、 εは誘電率を示す) を用いて算出することができる。 上記の誘 電率としては一定の値を用いてもよいが、 Warshel らが提案しているような r i に依存した値 (Warshel, A. , J. Phys. Chem. , 83, 1979, pp. 1640 - 1652)を用いる ことが好ましい。
G elc. i =∑W j I ε I J
j 試行化合物をこの三次元格子点上に配置した際の試行化合物-生体高分子間の 静電相互作用エネルギーは、 以下の式 (式中、 m、 N、 及び は上で定義したと おりである) から算出することができる。
.ei c = ^.q mG e|c< mo
m=l 水素結合性格子点情報とは、 水素供与性の原子又は水素受容性の原子のうちい ずれの原子がその三次元格子点に配置されれば生体高分子の水素結合性官能基と 水素結合を形成し得るか、 あるいはどちらの原子がその三次元格子点に配置され てもその原子が生体高分子の水素結合性官能基と水素結合を形成できる (または 水素結合を形成できない) ことを示す情報のことである。 例えば、 水素受容性で ある三次元格子点に 1、 水素供与性である三次元格子点に 2、 両方の性質をもつ 三次元格子点に 3、 水素結合性のない三次元格子点に 0の番号を付加することに より、 三次元格子点の水素結合性を表すことができる。
三次元格子点の水素結合性は以下のようにして求めることができる。 ある三次 元格子点 Pと生体高分子中に存在するある水素供与性原子 Dとの間の距離 D Pが 水素結合を形成し得る距離 (例えば、 2· 5〜3. 1オングストローム) であり、 かつ、 三次元格子点 P、 水素 H、 及び水素供与性原子 Dがなす角度 D H Pが水素結合 を形成し得る角度 (例えば、 3 0 ° 以上) であれば、 この三次元格子点は水素受 容性であると判定される。 同様に、 ある三次元格子点 Pと生体高分子中に存在す るある水素受容性原子 Aとの間の距離 P Aが水素結合を形成し得る距離であり、 かつ、 三次元格子点 P、 孤立電子対 L、 及び水素受容性原子 Aがなす角度 Z A L P が水素結合を形成し得る角度であれば、 この三次元格子点は水素供与性であると 判定できる。 なお、 ある三次元格子点が水素受容性でも水素供与性でもない場合 には、 水素結合性なしとして取り扱う。
つぎに、 生体高分子中に存在する水素結合性官能基のうち S 6で指定した領域 内に存在する水素結合性官能基の中から、 試行化合物と水素結合を形成すると予 想される水素結合性官能基を選択する (S 8 ) 。 多数の水素結合性官能基が存在 する場合には、 その重要度に応じて選択することができる。 さらに、 S 7で算出 した三次元格子点の格子点情報に基づいて、 S 8で選択した各水素結合性官能基 に対してダミー原子を設定する (S 9 ) 。
このステップでは、 S 7で算出した三次元格子点の水素結合性に基づいて、 S 8 で選択した各水素結合性官能基と水素結合を形成し得る領域 (水素結合性領域) を決定した後、 適当な数 (例えば 5〜2 0個) の三次元格子点を含む水素結合性 領域を構成する三次元格子点の中心にダミー原子を配置する。 ダミー原子は、 該 水素結合性領域内で他の原子のファンデルワールス半径外に配置される。 水素結 合性領域は、 同じ水素結合性を有しており、 かつ互いに隣接する一群の三次元格 子点から構成される領域である。 1個の水素結合性官能基から 2個以上のダミ一 原子が設定される場合があり、 逆に、 1個のダミー原子も設定されない場合があ ることに留意すべきである。 設定されたダミー原子の数が多い場合には、 リガン ド結合領域の内孔の奥深くにあつて重要と思われるダミ一原子のみを残すように して、 1 0個以下、 好ましくは 5〜 1 0個に絞り込むことが好ましい。 なお、 ダ ミ一原子には、 その中心に該ダミ一原子を配置した三次元格子点と同じ水素結合 性を与えておく。
つぎに、 試行化合物の一つを選択し (S 1 0 ) 、 選択した試行化合物の三次元 座標、 水素結合性カテゴリー番号、 分子力場計算用の情報および配座作成用の情 報を S 1で作成した A D A M仕様データベースから読み込む (S 1 1 ) 。 その後 に、 ダミー原子と試行化合物中の水素結合性へテ口原子との間に水素結合対応関 係を付与する (S 1 2 ) 。 ダミー原子の数を m個、 試行化合物中に存在する水素 結合性へテロ原子の数を n個とすると、 i個の水素結合を形成する対応関係 (組 合せ) の数 N ( i ) は、 X n C i (式中、 Pは順列、 Cは組合せを表す) 個 となる。 ダミ ー原子と、 試行化合物中の水素結合性へテロ原子の可能な組合せを すべて選択することが好ましい。
その後、 I min - i ≤ l max の関係を満たすすべての iについて、 S 1 2〜S 2 9 のステップを繰り返す。 その結果、 ダミー原子と試行化合物中に存在する水素結 合性へテロ原子との間で、
1max
Figure imgf000020_0001
個の組合せがすべて選択されることとなる。 この操作によって、 生体高分子と試 行化合物とにより形成される水素結合の全組合せが選択されることになり、 生体 高分子と試行化合物との結合様式を系統的かつ効率的に探索できるようになる。
1 min としてはダミー原子と水素結合性へテロ原子の数のうち小さい方、 i max としてはダミ一原子と水素結合性へテロ原子の数のうち大きい方の数を採用する ことが好ましい。
より具体的に説明すると、 S 1 2で対応関係をつけた、 ダミー原子と試行化合 物中の水素結合性へテロ原子との組合せの一つを選択する (S 1 3 ) 。 この際、 ダミー原子の水素結合性と試行化合物中の水素結合性へテ口原子の水素結合性と がー致しない組合せは選択しない。 つぎに、 S 1 3で選択した組合せに含まれる ダミー原子について、 各ダミー原子間の距雜を算出する (S 1 4 ) 。 なお、 ダミー 原子の数及び試行化合物中の水素結合性へテロ原子の数の両方が 1個の場合は、 S 1 4〜S 2 1のステップを行わずに S 2 2のステップへ飛び、 次いで、 S 2 3 〜S 2 5のステップを行わずに S 2 6のステップへ飛ぶ。 また、 ダミー原子の数 又は試行化合物中に存在する水素結合性へテ口原子の数のどちらか一方が 1個の 場合は、 S 1 4〜S 2 1のステツプを行わずに S 2 2のステツプへ飛ぶ。
試行化合物を水素結合性部分と非水素結合性部分とに分割し (S 1 5 ) 、 S 1 5 で分割した試行化合物の水素結合性部分についてねじれ回転が可能な結合とその 回転の様式を選択する (S 1 6 ) 。 その後、 S 1 6で選択した結合を、 S 1で作 成した A D A M仕様三次元データベースに入力されている結合回転様式に従って 回転させ、 試行化合物の配座を順次生成させる (S 1 7 ) 。 そして、 生成した配 座毎に以後の S 1 8〜S 2 9のステップを繰り返す。
これらのステップの詳細は以下のとおりである。 S 1 7で生成した配座につい て、 S 1 3で選択した組合せに含まれる試行化合物中の各水素結合性へテロ原子 の原子間距離を算出する (S 1 8 ) 。 S 1 4で得られたダミー原子の原子間距離 と S 1 8で得られた対応する試行化合物中の水素結合性へテロ原子の原子間距離 との差の 2乗の和である Fの値が一定の範囲以上となる水素結合組合わせと配座 を除去する (S 1 9 ) 。 すなわち、
n(n-1)
F =∑2 (r|rdi )2
J とした場合、 k a ≤F≤k a ' (式中、 nは水素結合の数を示し、 r d i i番目の ダミ一原子間距雜を示し、 r uは試行化合物中の水素結合性へテ口原子の i番目の 原子間距離を示し、 は Fの下限値を示し、 ' は Fの上限値を示す) である 水素結合組合せ以外のものを除去する。 上記 k。 としては、 0. 6〜0. 8、 k ' と しては、 1. 2〜1. 4が好ましい。 このステップにより、 生体高分子と試行化合物の 水素結合様式及びリガンド分子の配座の可能性を効率的に網羅することができる。 その後、 S 1 9で除去されなかった水素結合組合わせと配座について、 前記の Fの値が最小になるように試行化合物の水素結合性部分の配座を最適化する ( S 2 0 ) 。 このステップにより、 生体高分子と試行化合物が安定な水素結合を 形成するように、 試行化合物の配座が修正される。 試行化合物の水素結合性部分 に存在するねじれ回転可能な結合のねじれ角を変数として、 前記の関数 Fの値を Fletcher-Powell 法(Fletcher, R. , Powell, M. J. D. , Computer J. , 6, 1968, p. 163) を用いて最小化することにより、 試行化合物の水素結合性部分の配座を最適 化することができる。
ついで、 S 2 0のステップで最適化した試行化合物の水素結合性部分の分子内 エネルギーを算出して、 該分子内エネルギーの値が一定値以上の配座を除去する
( S 2 1 ) 。 例えば、 AMBER 4. 0 の分子力場を用いて試行化合物の水素結合性部分 の分子内エネルギーを算出した場合、 該分子内エネルギーが 1 0 O KcalZmol 以上 となった配座を除去することが好ましい。 その後、 上記の S 2 1までのステップ で得られた配座を有する試行化合物の水素結合性へテロ原子の座標と対応するダ ミ一原子の座標とがー致するように、 試行化合物の原子座標を生体高分子の座標 系に置き換える (S 2 2 ) 。 このステップには、 Kabsh の最小二乗法 (Kabsh, W. , Acta Cryst. , Α32, 1976, p. 922 ; Kabsh, I. , Acta Cryst. , A34, 1978, p. 827) を用いることができる。 この操作により、 可能な水素結合様式と試行化合物の水 素結合性部分の配座とを同時に粗く推定することが可能になる。
上記ステップに続いて、 生体高分子と試行化合物の水素結合性部分との分子間 相互作用エネルギー (ファンデルワールス相互作用エネルギー及び静電相互作用 エネルギーの和) 、 及び試行化合物の水素結合性部分についての分子内エネルギー を算出する (S 2 3 ) 。 生体高分子と試行化合物の水素結合性部分との分子間相 互作用エネルギー E inter_ は、 試行化合物中の各原子 kに最も近い三次元格子点の 格子点情報のファンデルワールス相互作用エネルギー Gvdw (k) 及び静電相互作用 エネルギー Gel„ (k) を用いて、 以下の式 (式中、 q , は原子 kの電荷を表す) か ら算出することができる。
: mter -∑ {Gvdw(k) + Geic(k) . qK } また、 試行化合物の水素結合性部分の分子内エネルギー E intr_a は、 既知の方 法に従って算出することができる。 例えば、 Eint は AMBER4.0等の公開された力 場を用いて、 以下の式 〔式中、 Vn はねじれ角を構成する 4つの原子の原子タイプ の並びに対して与えられている定数を示し、 nはねじれ角回転に対するポテンシ ャルの対称性を表す定数を示し、 Φはねじれ角を示し、 7はねじれ角回転に対す るポテンシャルの位相 (ねじれ角を構成する 4つの原子の原子タィプの並びに対 して与えられている) を示し、 Ai;jと B は試行化合物分子中の i番目と j番目の 原子の原子タイプの対に対して設定された定数を示し、 は i番目と j番目の原 子間の距雜を示し、 qi は試行化合物中の i番目の原子の電荷を示し、 は試行 化合物中の j番目の原子の電荷を示し、 εは誘電率を示す〕 により算出できる。 ヒ mtrs = ∑ ∑Vn / 2 {1 + cos(n<D -丫) }
Dihedrals π
+∑ (Aij/Rij12-Bij/Rij6)+ ∑(qi qj/eRij)
i<J i<j
S 23で算出された分子間相互作用エネルギーと分子内エネルギーとの和が一 定値以上となった試行化合物の配座を除去する (S 24) 。 例えば、 上記のエネ ルギ一の和が分子量 100当たり 10kcal/mol以上となった配座を除去することが好 ましい。 その後、 S 24で除去されなかった配座を有する試行化合物の水素結合 性部分の構造を最適化する (S 25) 。 構造最適化計算を行い試行化合物の水素 結合性部分のねじれ角、 並びに試行化合物の位置及び方向を最適化することによ り、 試行化合物の水素結合性部分の構造を最適化することができる。
例えば、 以下の式:
E total = E inter + E intra +Whb · Nhb - Chb
〔式中、 Einter及び E inl a は前記のとおりであり、 Whb は重み、 Nhb は水素結 合の数、 及び Chb は 1個の水素結合による安定化エネルギー (例えば、 2.5 kcal /mol) を示す〕 から算出される全エネルギー EtQtal が最小となるように、 Powell 法 (Press, f. H. , Flannery, Β. P. , Teukolsky, S. A. , Vitterling, W. T. , 、 Numerical Recipes in C, ' Cambridge University Press, Cambridge, 1989)等を 用いて試行化合物の水素結合性部分の構造を最適化することができる。
ついで、 試行化合物の非水素結合性部分の結合回転が可能な結合を S 1で作成 した A D A M仕様三次元データベースに入力されている結合回転様式に従って回 転させて試行化合物の配座を順次生成させ (S 2 6 ) 、 生成した配座毎に以後の
S 2 7〜S 2 9のステップを繰り返す。 具体的には、 生体高分子と試行化合物と の分子間相互作用エネルギー、 及び試行化合物の分子内エネルギーを算出し ( S 2 7 ) 、 S 2 7で算出された分子間相互作用エネルギーと分子内エネルギー との和が一定値以上となった試行化合物の配座を除去する (S 2 8 ) 。 その後、
S 2 8で除去されなかった配座を有する試行化合物分子全体の構造を最適化し ( S 2 9 ) 、 S 2 9までのステップで得られた生体高分子—試行化合物の複合体 構造のエネルギーを算出して該エネルギーが最小である最安定の複合体構造を選 択する (S 3 0 ) 。
分子間相互作用エネルギー及び分子内エネルギーは S 2 3と同様の方法で算出 できる (ただし、 S 2 3では試行化合物分子の水素結合性部分についてのみ計算 を行うが、 S 2 7では試行化合物分子全体について計算を行う必要がある) 。 ま た、 上記のエネルギーの和の上限値としては、 分子量 100あたり lOkcalZmol が好 ましい。 このステップにより、 生体高分子と試行化合物の安定な複合体、 及び試 行化合物の活性配座が得られる。 試行化合物分子の構造の最適化は S 2 5のステ ップと同様の方法で行うことができる (ただし、 S 2 5では試行化合物分子の水 素結合性部分の構造のみ最適化を行うが、 S 2 9では試行化合物分子分子全体に ついて構造の最適化を行う必要がある) 。
上記のような生体高分子と試行化合物のドッキング操作は、 自動ドッキングプ ログラム A D A M (PCT 国際公開 WO93/20525 ; Yamada, M. and I tai, に Chem.
Pharm. Bull. , 41, 1993, p. 1200 ; Yamada, M. and 〗tai, A. , Chem. Pharm. Bull. , 41, 1993, p. 1203 ; Yamada Mizutani, M. , Tomioka, N., and I tai,
J. Mol. Biol. , 243, 1994, pp. 310- 326)を用いて行うことができる。
S 3 0で得られた最安定の複合体構造における生体高分子と試行化合物との分 子間相互作用エネルギー、 試行化合物の分子内エネルギーの値、 水素結合数、 及 び環の数などの基準のすべてあるいはいくつかに基づき、 該試行化合物をリガン ド候補化合物として選択するか否かを判定する (S 3 1 ) 。 分子間相互作用エネ ルギ一としては、 静電相互作用エネルギー、 ファンデルワールス相互作用、 水素 結合エネルギー、 及びそれらの和を挙げることができる。 例えば、 静電相互作用 エネルギーとファンデルワールス相互作用との和が分子量 1 0 0あたり一 2 kcal Zmol 以下の試行化合物分子をリガンド候補化合物として選択することが好ましい。 その後、 すべての試行化合物を選択したか否かを判定し (S 3 2 ) 、 すべての試 行化合物を選択していない場合には S 1 0のステップに戻って S 1 0〜S 3 1の ステップを繰り返し、 選択した場合には S 3 3のステップに進む。
S 3 1で選択されたリガンド候補化合物の中からより有望なリガンド候補化合 物への絞り込みを行う (S 3 3 ) 。 この絞り込みに先立って、 リガン ド候補化合 物の情報 (例えば、 生体高分子と試行化合物の分子間相互作用エネルギー、 試行 化合物の分子内エネルギーの値、 水素結合数、 及び環の数等) のリストを出力し て、 絞り込みの基準を決定すると便利である。 例えば、 生体高分子とリガンド候 補化合物との間で形成されうる水素結合の数、 生体高分子とリガン ド候補化合物 の分子間相互作用エネルギーの値、 及び原子数等を基準として上記の絞り込みを 行うことが好ましい。
分子間相互作用エネルギーとしては、 静電相互作用エネルギー、 ファンデルヮー ルス相互作用、 及びそれらの和を挙げることができる。 例えば、 静電相互作用ェ ネルギ一とファンデルワールス相互作用の和が分子量 1 0 0あたり— 8 kcalZmol 以下の試行化合物分子を有望なリガンド候補化合物として絞り込むことが好まし い。 水素結合の数は生体高分子の種類により任意の数を設定できるが、 例えば 2 以上、 好ましくは 3以上を設定することが望ましい。 原子数も任意の数を設定で きるが、 例えば 2 0個以上、 好ましくは 2 0〜4 0個の範囲を設定することがで きる。
生体高分子から非常に多くのダミ一原子が作成される場合、 あるいは試行化合 物がかなり大きな配座の自由度を有するか又は多くのへテロ原子を有する場合に は、 本発明のより好ましい実施態様に従って、 S 9のステップで試行化合物に関 する情報を入力した後、 試行化合物の部分構造について S 1 3〜S 2 5までのス テツプを行い、 その部分構造中で不可能な水素結合様式を与えるダミ一原子と試 行化合物中の水素結合性へテロ原子との組合せ、 及びダミー原子と水素結合を形 成し得ない試行化合物中の水素結合性へテロ原子についての情報を保存する。 試 行化合物の部分構造はいかなる構造的な制約を受けることなく任意に決めること ができるが、 3個以上の水素結合性官能基を含む構造部分が好ましい。 なお、 そ の構造部分の配座の自由度の有無は無視してもよい。
上記ステップに続いて試行化合物の全体構造について S 1 3〜S 33のステツ プを行うが、 前記ステップで保存された水素結合性へテロ原子を含む組合せ及び ダミー原子と水素結合性へテロ原子との組合せを S 1 2のステップで作成される 対応関係の組合せから除く。 この結果、 試行する組合せ及び配座の数を減じるこ とができ、 生体高分子 -試行化合物の安定複合体の構造探索に要する時間が大幅 に短縮される (上記方法を Pre-Pruning法: PP法と呼ぶ場合がある) 。 PP法は、 試行化合物の部分構造において不可能な水素結合様式ゃリガンド配座は試行化合 物の全体構造においても不可能であるという仮説に基づいている。 この P P法を 採用することにより、 得られる生体高分子一試行化合物の複合体構造の精度や信 頼性に全く影響を与えることなく探索時間を大幅に短縮することが可能である。 実施例
本発明の方法の有効性を検証するために、 ジヒ ドロ葉酸還元酵素を標的生体高 分子として、 基質や既知阻害剤、 あるいはそれらのアナログがリガン ド候補化合 物として選択されるか否かをテストした。
ジヒ ドロ葉酸還元酵素 (以下、 「DHFR」 と記す。 ) の原子座標として、 プ 口ティンデータバンクエン ト リー 40 1¾から入手できる大腸菌の01^?1?—メ ト トレキセー卜の二元複合体の原子座標から得られる値を用いた。 DHFR—葉 酸一 NAD P+の三元複合体の結晶構造に基づき、 補因子 NAD P+分子の原子座 標を前記の二元複合体の原子座標に付加した。 この際、 非常に強く DHFRに結 合して化学的に除去できない 2個の水分子以外の全ての水分子は、 前記のニ元複 合体の原子座標から除去した。 除去しなかった 2個の水分子のうちの一つは、 DH FRの 2 1位のトリプ卜ファン及び 26位のァスパラギン酸に、 他の一つは 1 14位のロイシン及び 1 1 6位のトレオニンに水素結合している。
試行化合物のデータベースとして、 約 110, 000個の分子のデータを含む The Available Chemicals Directory (ACD-3D、 MDL社) を用い、 上記データベースに 収納された分子の中から、 原子数が 5個以下の分子、 H、 C、 S iおよびハロゲ ンだけで構成されている分子、 H、 C、 N、 0、 S、 Pおよびハロゲン以外の元 素を含む分子、 6本以上の回転可能な結合を持つ分子、 および環を持たない分子 を除いた 10, 017個の分子を解析対象とし、 水素原子の付加と、 原子タイプ番号、 水 素結合性カテゴリー番号、 原子電荷、 及び結合回転の様式 (1 2 0 ° の回転角で 回転) の付与とを行った。 リガンド候補化合物として選択する判定基準は、 標的 生体高分子 (酵素) との相互作用エネルギーの値が分子量 1 0 0あたり— 7 Kcal /mol 以下で分子間水素結合数が 3本以上であり、 かつ原子数が 2 5個以上とした。 本発明の方法によって、 最終的に約 1400個の試行化合物がリガンド候補化合物と して選択され、 生体高分子の三次元座標入力からリガンド候補化合物の選択まで の所要時間は約 80時間であった。 それらのリガンド候補化合物には、 第 3図に示し た化合物をはじめ、 多数の基質及び既知阻害剤アナログが含まれていた。 阻害剤 メ ト トレキセ一トと基質ジヒ ドロ葉酸とは、 回転できる結合数の制限により今回 の探索からは除外されていたが、 トリメ トプリムはリガンド候補化合物として選 択されていた。 また、 本発明の方法により提示されたリガンド候補化合物の結合 様式および配座は、 基質や阻害剤アナ口グと酵素との複合体結晶構造から推測さ れる結合様式および配座とよく合致していた。
また、 本発明の方法により、 基質や既知阻害剤の構造と類似性の少ない新規構 造をもつリガンド候補化合物も多数選択された。 その例をその ドッキングモデル とともに第 4図に示す。 図中、 太線はリガンド分子の骨格、 点線は水素結合、 細 い実線は生体高分子の一部、 破線で書いた鳥カゴはリガン ドの原子の中心に許さ れる領域を示す。 これらのドッキングモデルを見ると、 水素結合が何本か形成さ れており、 酵素のキヤビティとの形状の相補性もかなり良いことがわかる。 従つ て、 これらのリガンド候補化合物は、 ジヒ ドロ葉酸還元酵素の阻害剤のリ―ド化 合物として期待される化合物である。 産業上の利用可能性
本発明の方法によれば、 三次元構造データベースから構造既知の標的生体高分 子に対するリガンド化合物を配座の自由度を考慮しながら短時間で検索すること ができるうえ、 極めて信頼性の高い検索結果を容易に入手できる。 従って、 本発 明の方法は、 医学及び薬学などの分野において生体高分子に対して阻害剤ゃァゴ ニスト又はアンタゴニストとして作用するリ一ド化合物創製などに有用である。

Claims

請 求 の 範 囲 1 . 三次元構造データベースから生体高分子に対するリガンド化合物を検索する 方法であって、 以下の工程: (i) 2種以上の試行化合物の三次元座標に対し、 水素結合性カテゴリー番号、 分子 力場計算用の情報および配座作成用の情報を用意する第 1工程; (ii)生体高分子の三次元座標から、 リガンド結合領域の物理化学的情報およびダミ一 原子を用意する第 2工程; (iii) 第 1工程で用意した試行化合物の三次元座標に対する水素結合性力テゴリー 番号、 分子力場計算用の情報および配座作成用の情報、 並びに、 第 2工程で用意 したリガンド結合領域の物理化学的情報を基にして、 試行化合物の配座を変化さ せながら生体高分子と試行化合物をドッキングさせて複合体の構造を作成し、 生 体高分子と試行化合物との間の相互作用を評価し、 構造最適化することにより前 記複合体の最安定構造を探索する第 3工程; (iv)第 3工程で探索した最安定複合体構造における生体高分子と試行化合物との相 互作用エネルギーの値に基づいて、 該試行化合物をリガン ド候補化合物として選 択するか否かを判定する第 4工程;および (V) すべての試行化合物について第 3工程および第 4工程を繰り返す第 5工程 を含む方法。 2 . 上記第 3工程が以下の工程: (1) 生体高分子中の水素結合性官能基の水素結合の相手となり得るヘテロ原子の位 置に設定したダミー原子と試行化合物中の水素結合性へテロ原子との対応づけを 組合せ的に網羅することにより、 生体高分子一試行化合物間の有利な結合様式を 網羅する工程 a ; (2) 試行化合物の配座を系統的に変化させながら、 前記のダミー原子間の距離と前 記の水素結合性へテ口原子間の距離を比較することにより、 生体高分子 -試行化 合物間の可能な水素結合様式及び試行化合物の水素結合性部分の配座を同時に推 定する工程 b ;及び (3) 工程 bで得られた水素結合様式と配座毎に、 試行化合物中の水素結合性へテロ 原子とダミー原子との対応関係に基づいて、 試行化合物の全原子の座標を生体高 分子の座標系に置き換えることにより、 生体高分子 -試行化合物の複合体構造を 得る工程 C を含む、 請求の範囲第 1項に記載の方法。 3 . 上記第 3工程が以下の工程: (1) 生体高分子中の水素結合性官能基の水素結合の相手となり得るヘテロ原子の位 置に設定したダミー原子と試行化合物の部分構造中の水素結合性へテロ原子との 対応づけを組合せ的に網羅することにより、 生体高分子一試行化合物間の有利な 結合様式を網羅する工程 a ; (2) 試行化合物の配座を系統的に変化させながら、 前記のダミー原子間の距離と前 記の水素結合性へテロ原子間の距離を比較することにより、 生体高分子-試行化 合物間の水素結合様式及び試行化合物の部分構造の配座を同時に推定する工程 b ;(3) 工程 bで得られた水素結合様式と配座に基づいて、 前記の試行化合物の部分構 造中で不可能な水素結合様式を与えるダミー原子と水素結合性へテロ原子の組合 せ、 及びダミー原子と水素結合を形成し得ない水素結合性へテロ原子を保存する 工程 c ; (4) 工程 cで保存された水素結合性へテロ原子を含む組合せ、 及び工程 cで保存さ れたダミー原子と水素結合性へテロ原子の組合せを除いて、 ダミー原子と試行化 合物全体の水素結合性へテ口原子との対応づけを組合せ的に網羅することにより、 生体高分子 -試行化合物間の有利な結合様式を網羅する工程 d ; (5) 試行化合物の配座を系統的に変化させながら、 前記のダミー原子間の距離と前 記の水素結合性へテロ原子間の距離を比較することにより、 生体高分子一試行化 合物間の可能な水素結合様式及び試行化合物の水素結合性部分の配座を同時に推 定する工程 e ;及び (6) 工程 eで得られた水素結合様式と配座毎に、 試行化合物中の水素結合性へテロ 原子とダミー原子との対応関係に基づいて、 試行化合物の全原子の座標を生体高 分子の座標系に置き換えることにより、 生体高分子-リガン ド分子の複合体構造 を得る工程 f を含む、 請求の範囲第 1項に記載の方法。 4 . 上記第 3工程が以下の工程:
(1) 生体高分子中の水素結合性官能基の水素結合の相手となり得るヘテロ原子の位 置に設定したダミー原子と試行化合物中の水素結合性ヘテロ原子との対応づけを 組合せ的に網羅することにより、 生体高分子一試行化合物間の有利な結合様式を 網羅する工程 a ;
(2) 試行化合物の配座を系統的に変化させながら、 前記のダミー原子間の距離と前 記の水素結合性へテロ原子間の距離を比較することにより、 生体高分子一試行化 合物間の可能な水素結合様式及び試行化合物の水素結合性部分の配座を同時に推 定する工程 b ;
(3) 工程 bで得られた水素結合様式を保持しつつ、 ダミー原子と試行化合物中の水 素結合性へテロ原子の位置が一致するように試行化合物の配座を最適化し、 次い で、 分子內エネルギーの高い試行化合物の配座を除去する工程 c ;
(4) 工程 cで除去されなかった配座毎に、 試行化合物中の水素結合性へテロ原子と ダミー原子との対応関係に基づいて、 試行化合物の全原子の座標を生体高分子の 座標系に置き換えることにより、 生体高分子一リガンド分子の複合体構造を得る 工程 d ;
(5) 工程 dで得られた複合体構造から、 試行化合物中の水素結合性部分の分子內ェ ネルギー及び生体高分子 -該試行化合物中の水素結合性部分の分子間相互作用ェ ネルギ一の高い複合体構造を除去し、 次いで、 残った複合体構造について構造の 最適化を行う工程 e ;
(6) 工程 eで得られた複合体構造毎に、 試行化合物の非水素結合性部分の配座を発 生させて新たな複合体構造を得る工程 f ;及び
(7) 工程 f で得られた複合体構造から、 試行化合物全体の分子内エネルギー及び生 体高分子 -試行化合物の分子間相互作用エネルギーの高い複合体構造を除去し、 次いで、 残った複合体構造について構造の最適化を行う工程 g
を含む請求の範囲第 1項に記載の方法。
5 . 請求の範囲第 1項ないし第 4項のいずれか 1項の方法を用いて検索された生 体高分子に対するリガンド化合物。
6 . 試行化合物の三次元座標の情報を含むデータベースであって、 試行化合物の 三次元座標に対して付与される情報であって、 原子タイプ番号、 水素結合性カテ ゴリー番号、 原子電荷、 及び結合回転の様式からなる群から選ばれる情報を含ん でおり、 必要に応じて水素原子の三次元座標の情報がさらに付加された三次元デー タベース。
7 . 生体高分子に対するリガンド化合物検索用に用いる請求の範囲第 6項に記載 のデータベース。
PCT/JP1995/002219 1994-10-31 1995-10-30 Procede pour extraire de nouveaux composes ligands contenus dans une base de donnees a structure tridimensionelle WO1996013785A1 (fr)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1019970702847A KR970707500A (ko) 1994-10-31 1995-10-30 3차원구조 데이타베이스로 부터 신규한 리간드화합물을 검색하는방법
US08/817,646 US6389378B2 (en) 1994-10-31 1995-10-30 Method of searching novel ligand compounds from three-dimensional structure database
EP95935587A EP0790567A1 (en) 1994-10-31 1995-10-30 Method of retrieving novel ligand compounds from three-dimensional structure database
JP51445296A JP3669704B2 (ja) 1994-10-31 1995-10-30 三次元構造データベースから新規リガンド化合物を検索する方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP6/267688 1994-10-31
JP26768894 1994-10-31

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US08/817,646 A-371-Of-International US6389378B2 (en) 1994-10-31 1995-10-30 Method of searching novel ligand compounds from three-dimensional structure database
US10/022,275 Continuation US6490588B2 (en) 1994-10-31 2001-12-20 Method of searching novel ligand compounds from three-dimensional structure database

Publications (1)

Publication Number Publication Date
WO1996013785A1 true WO1996013785A1 (fr) 1996-05-09

Family

ID=17448156

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1995/002219 WO1996013785A1 (fr) 1994-10-31 1995-10-30 Procede pour extraire de nouveaux composes ligands contenus dans une base de donnees a structure tridimensionelle

Country Status (6)

Country Link
US (3) US6389378B2 (ja)
EP (2) EP0790567A1 (ja)
JP (1) JP3669704B2 (ja)
KR (1) KR970707500A (ja)
CN (1) CN1150478C (ja)
WO (1) WO1996013785A1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0818744A3 (en) * 1996-07-08 1998-07-08 Proteus Molecular Design Limited Process for selecting candidate drug compounds
WO1999001409A1 (fr) * 1997-07-03 1999-01-14 Akiko Itai Procede de deduction des fonctions proteiques au moyen d'une base de donnees de ligands
WO2002057954A1 (fr) * 2001-01-19 2002-07-25 Mitsubishi Chemical Corporation Procede pour realiser une structure tridimensionnelle de proteine avec ajustement induit et son utilisation
US6549900B2 (en) 1995-12-28 2003-04-15 Akiko Itai Method for creating physiologically active compounds
JPWO2002062829A1 (ja) * 2001-02-02 2004-06-10 中外製薬株式会社 ペプチド誘導体
WO2005083616A1 (ja) * 2004-02-24 2005-09-09 In-Silico Sciences, Inc. リガンド探索装置、リガンド探索方法、プログラム、および記録媒体
JP2005250721A (ja) * 2004-03-03 2005-09-15 Hitachi High-Technologies Corp 蛋白質または高分子複合体の検索・照合方法及び装置
JP2006113878A (ja) * 2004-10-15 2006-04-27 Ryoka Systems Inc 受容体−リガンド安定複合体構造探索方法
JP2008518369A (ja) * 2005-03-11 2008-05-29 シュレディンガー エルエルシー 結合親和性を推定するための予測的スコア関数

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996013785A1 (fr) * 1994-10-31 1996-05-09 Akiko Itai Procede pour extraire de nouveaux composes ligands contenus dans une base de donnees a structure tridimensionelle
EP0918296A1 (en) * 1997-11-04 1999-05-26 Cerep Method of virtual retrieval of analogs of lead compounds by constituting potential libraries
WO2001018627A2 (en) * 1999-09-06 2001-03-15 National University Of Singapore Method and apparatus for computer automated detection of protein and nucleic acid targets of a chemical compound
US6727100B1 (en) 1999-10-21 2004-04-27 4Sc Ag Method of identifying candidate molecules
AU2002214286A1 (en) * 2000-11-15 2002-05-27 Akiko Itai Method of profiling protein
WO2002044112A1 (fr) * 2000-11-30 2002-06-06 Toyo Suisan Kaisha, Ltd Procede de conception de la structure moleculaire d'un inhibiteur d'enzyme
US20040015299A1 (en) * 2002-02-27 2004-01-22 Protein Mechanics, Inc. Clustering conformational variants of molecules and methods of use thereof
US6671628B2 (en) 2002-03-04 2003-12-30 Chemnavigator, Inc. Methods for identifying a molecule that may bind to a target molecule
AU2003221884A1 (en) * 2002-04-10 2003-10-27 Transtech Pharma, Inc. System and method for data analysis, manipulation, and visualization
US20040034481A1 (en) * 2002-08-16 2004-02-19 Hurst John R. Methods for identifying a prospective binding site on a target molecule and for characterizing a site on a target molecule
EP1553177A4 (en) * 2002-09-03 2008-08-20 Tanuma Sei Ichi METHOD FOR DEVELOPING A PHYSIOLOGICALLY ACTIVE PEPTIDE AND ITS APPLICATIONS
KR100456627B1 (ko) * 2002-12-10 2004-11-10 한국전자통신연구원 3차원 구조기반의 거대분자의 기능 예측 시스템 및 그 방법
WO2004075021A2 (en) * 2003-02-14 2004-09-02 Vertex Pharmaceuticals, Inc. Molecular modeling methods
US20060052943A1 (en) * 2004-07-28 2006-03-09 Karthik Ramani Architectures, queries, data stores, and interfaces for proteins and drug molecules
JP2008538102A (ja) * 2005-03-03 2008-10-09 ザ バーナム インスティテュート フォー メディカル リサーチ バーチャルドッキングアプローチを適用したプロテインキナーゼb阻害剤のスクリーニング方法並びにそれにより見出された化合物及び組成物
KR100839600B1 (ko) * 2006-12-04 2008-06-19 한국전자통신연구원 특이 결합부위 자동추출을 이용한 리간드 검색 장치 및 그방법
US20100261155A1 (en) * 2007-06-06 2010-10-14 Nationwide Children's Hospital, Inc. Methods and compositions relating to viral fusion proteins
JP5052985B2 (ja) * 2007-07-31 2012-10-17 住友重機械工業株式会社 分子シミュレーション方法、分子シミュレーション装置、分子シミュレーションプログラム、及び該プログラムを記録した記録媒体
US20090124579A1 (en) * 2007-11-09 2009-05-14 University Of South Carolina Systems and Methods For Determination of Compounds for Stimulation or Inhibition of Neocalcification
US10191033B2 (en) 2013-12-05 2019-01-29 The Broad Institute, Inc. Biomarkers for detecting pre-cachexia or cachexia and methods of treatment thereof
CN104750761B (zh) * 2013-12-31 2018-06-22 上海致化化学科技有限公司 分子结构数据库的建立方法及搜索方法
US11111296B2 (en) 2015-12-14 2021-09-07 The Broad Institute, Inc. Compositions and methods for treating cardiac dysfunction
JP7139805B2 (ja) * 2018-09-11 2022-09-21 富士通株式会社 化合物探索装置、化合物探索方法、及び化合物探索プログラム
WO2020168507A1 (zh) * 2019-02-21 2020-08-27 深圳晶泰科技有限公司 分子对接云计算流程控制方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993020525A1 (en) * 1992-03-27 1993-10-14 Akiko Itai Method of searching the structure of stable biopolymer-ligand molecule composite

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5331573A (en) * 1990-12-14 1994-07-19 Balaji Vitukudi N Method of design of compounds that mimic conformational features of selected peptides
JP3256307B2 (ja) 1993-01-07 2002-02-12 昭子 板井 生理活性を有するリガンドの分子構造を構築する方法
US6081766A (en) * 1993-05-21 2000-06-27 Axys Pharmaceuticals, Inc. Machine-learning approach to modeling biological activity for molecular design and to modeling other characteristics
JP3785195B2 (ja) 1993-11-11 2006-06-14 昭子 板井 生理活性を有するリガンドの分子構造を構築する方法
WO1996013785A1 (fr) * 1994-10-31 1996-05-09 Akiko Itai Procede pour extraire de nouveaux composes ligands contenus dans une base de donnees a structure tridimensionelle
JP3928000B2 (ja) 1995-11-13 2007-06-13 昭子 板井 生理活性化合物の設計方法
WO1997024301A1 (fr) 1995-12-28 1997-07-10 Akiko Itai Procede de preparation d'un compose physiologiquement actif
US6389978B1 (en) * 1999-11-12 2002-05-21 Manuel B. Hooper Gun barrel cleaning shell

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993020525A1 (en) * 1992-03-27 1993-10-14 Akiko Itai Method of searching the structure of stable biopolymer-ligand molecule composite

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6549900B2 (en) 1995-12-28 2003-04-15 Akiko Itai Method for creating physiologically active compounds
EP0818744A3 (en) * 1996-07-08 1998-07-08 Proteus Molecular Design Limited Process for selecting candidate drug compounds
US7286940B2 (en) 1997-07-03 2007-10-23 Akiko Itai Method of predicting functions of proteins using ligand database
WO1999001409A1 (fr) * 1997-07-03 1999-01-14 Akiko Itai Procede de deduction des fonctions proteiques au moyen d'une base de donnees de ligands
WO2002057954A1 (fr) * 2001-01-19 2002-07-25 Mitsubishi Chemical Corporation Procede pour realiser une structure tridimensionnelle de proteine avec ajustement induit et son utilisation
JPWO2002062829A1 (ja) * 2001-02-02 2004-06-10 中外製薬株式会社 ペプチド誘導体
WO2005083616A1 (ja) * 2004-02-24 2005-09-09 In-Silico Sciences, Inc. リガンド探索装置、リガンド探索方法、プログラム、および記録媒体
US8036831B2 (en) 2004-02-24 2011-10-11 In-Silico Sciences, Inc. Ligand searching device, ligand searching method, program, and recording medium
JP2005250721A (ja) * 2004-03-03 2005-09-15 Hitachi High-Technologies Corp 蛋白質または高分子複合体の検索・照合方法及び装置
JP4688467B2 (ja) * 2004-10-15 2011-05-25 株式会社菱化システム 受容体−リガンド安定複合体構造探索方法
JP2006113878A (ja) * 2004-10-15 2006-04-27 Ryoka Systems Inc 受容体−リガンド安定複合体構造探索方法
JP2008518369A (ja) * 2005-03-11 2008-05-29 シュレディンガー エルエルシー 結合親和性を推定するための予測的スコア関数
JP4719223B2 (ja) * 2005-03-11 2011-07-06 シュレディンガー エルエルシー 結合親和性を推定するための予測的スコア関数
US8145430B2 (en) 2005-03-11 2012-03-27 Schrodinger, Llc Predictive scoring function for estimating binding affinity

Also Published As

Publication number Publication date
CN1171160A (zh) 1998-01-21
EP0790567A4 (ja) 1997-09-03
US20030061198A1 (en) 2003-03-27
US20020111938A1 (en) 2002-08-15
US6389378B2 (en) 2002-05-14
KR970707500A (ko) 1997-12-01
EP0790567A1 (en) 1997-08-20
US20010018682A1 (en) 2001-08-30
EP1944708A1 (en) 2008-07-16
JP3669704B2 (ja) 2005-07-13
US6490588B2 (en) 2002-12-03
CN1150478C (zh) 2004-05-19

Similar Documents

Publication Publication Date Title
WO1996013785A1 (fr) Procede pour extraire de nouveaux composes ligands contenus dans une base de donnees a structure tridimensionelle
Meyer et al. Libraries of extremely localized molecular orbitals. 3. Construction and preliminary assessment of the new databanks
US5642292A (en) Methods for searching stable docking models of biopolymer-ligand molecule complex
Freddolino et al. Force field bias in protein folding simulations
Shatsky et al. FlexProt: alignment of flexible protein structures without a predefinition of hinge regions
Micheletti et al. Accurate and efficient description of protein vibrational dynamics: comparing molecular dynamics and Gaussian models
De Bakker et al. Ab initio construction of polypeptide fragments: Accuracy of loop decoy discrimination by an all‐atom statistical potential and the AMBER force field with the Generalized Born solvation model
Merz Jr Limits of free energy computation for protein− ligand interactions
Zanette et al. Toward learned chemical perception of force field typing rules
Liu et al. Pair–pair approximation to the generalized many-body expansion: an alternative to the four-body expansion for ab initio prediction of protein energetics via molecular fragmentation
Lewis et al. Current methods for site-directed structure generation
JP2002523057A (ja) タンパク質の機能を予測するための方法およびシステム
Gao et al. Accounting for ligand conformational restriction in calculations of protein-ligand binding affinities
Lim et al. Fragment pose prediction using non-equilibrium candidate Monte Carlo and molecular dynamics simulations
AU1546901A (en) System and method for searching a combinatorial space
Pissurlenkar et al. Molecular mechanics force fields and their applications in drug design
Liu et al. A self-organizing algorithm for modeling protein loops
EP1010681A1 (en) Preparation method of physiologically active compound
JP3747048B2 (ja) 三次元構造データベースから新規リガンド化合物を検索するためのデータベースの作成方法
Won et al. GalaxyGPCRloop: Template-based and Ab initio structure sampling of the extracellular loops of G-Protein-Coupled receptors
Hansen et al. Ball-and-stick local elevation umbrella sampling: Molecular simulations involving enhanced sampling within conformational or alchemical subspaces of low internal dimensionalities, minimal irrelevant volumes, and problem-adapted geometries
US6549900B2 (en) Method for creating physiologically active compounds
WO2002057954A1 (fr) Procede pour realiser une structure tridimensionnelle de proteine avec ajustement induit et son utilisation
Muthumanickam et al. An insight of protein structure predictions using homology modeling
Blaszczyk et al. Protein structure prediction using coarse-grained models

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 95196968.4

Country of ref document: CN

AK Designated states

Kind code of ref document: A1

Designated state(s): CN JP KR US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH DE DK ES FR GB GR IE IT LU MC NL PT SE

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 1019970702847

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 1995935587

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 08817646

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 1995935587

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1019970702847

Country of ref document: KR

WWW Wipo information: withdrawn in national office

Ref document number: 1019970702847

Country of ref document: KR

WWR Wipo information: refused in national office

Ref document number: 1995935587

Country of ref document: EP

WWW Wipo information: withdrawn in national office

Ref document number: 1995935587

Country of ref document: EP

点击 这是indexloc提供的php浏览器服务,不要输入任何密码和下载