WO2007066787A1 - ハイブリッドgaによる複数パラメータの最適化方法、パターンマッチングによるデータ解析方法、放射線回折データに基づく物質構造の推定方法、ならびに関連するプログラム、記録媒体および各種装置 - Google Patents
ハイブリッドgaによる複数パラメータの最適化方法、パターンマッチングによるデータ解析方法、放射線回折データに基づく物質構造の推定方法、ならびに関連するプログラム、記録媒体および各種装置 Download PDFInfo
- Publication number
- WO2007066787A1 WO2007066787A1 PCT/JP2006/324614 JP2006324614W WO2007066787A1 WO 2007066787 A1 WO2007066787 A1 WO 2007066787A1 JP 2006324614 W JP2006324614 W JP 2006324614W WO 2007066787 A1 WO2007066787 A1 WO 2007066787A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- individuals
- generation
- population
- generations
- individual
- Prior art date
Links
- 239000000126 substance Substances 0.000 title claims abstract description 91
- 238000000034 method Methods 0.000 title claims description 625
- 230000005855 radiation Effects 0.000 title claims description 80
- 238000005457 optimization Methods 0.000 claims abstract description 267
- 239000013078 crystal Substances 0.000 claims abstract description 136
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 56
- 230000002068 genetic effect Effects 0.000 claims abstract description 41
- 230000008569 process Effects 0.000 claims description 273
- 239000000463 material Substances 0.000 claims description 184
- 239000000523 sample Substances 0.000 claims description 159
- 239000000843 powder Substances 0.000 claims description 88
- 238000004364 calculation method Methods 0.000 claims description 76
- 238000002447 crystallographic data Methods 0.000 claims description 66
- 238000009826 distribution Methods 0.000 claims description 58
- 238000004458 analytical method Methods 0.000 claims description 56
- 230000008859 change Effects 0.000 claims description 50
- 230000035772 mutation Effects 0.000 claims description 48
- 238000005259 measurement Methods 0.000 claims description 35
- 238000011156 evaluation Methods 0.000 claims description 23
- 238000007405 data analysis Methods 0.000 claims description 22
- 230000018109 developmental process Effects 0.000 claims description 20
- 238000012854 evaluation process Methods 0.000 claims description 14
- 230000001678 irradiating effect Effects 0.000 claims description 11
- 238000010187 selection method Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 238000004321 preservation Methods 0.000 claims description 4
- 230000000717 retained effect Effects 0.000 claims 1
- 238000002441 X-ray diffraction Methods 0.000 abstract description 59
- 239000003814 drug Substances 0.000 abstract description 21
- 238000011161 development Methods 0.000 abstract description 15
- 229940079593 drug Drugs 0.000 abstract description 10
- 230000001747 exhibiting effect Effects 0.000 abstract 1
- 239000002994 raw material Substances 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 75
- 230000000694 effects Effects 0.000 description 53
- 238000013461 design Methods 0.000 description 28
- 125000004429 atom Chemical group 0.000 description 26
- 238000011160 research Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 18
- XOAAWQZATWQOTB-UHFFFAOYSA-N taurine Chemical compound NCCS(O)(=O)=O XOAAWQZATWQOTB-UHFFFAOYSA-N 0.000 description 18
- 238000007796 conventional method Methods 0.000 description 17
- 230000000052 comparative effect Effects 0.000 description 15
- KDLHZDBZIXYQEI-UHFFFAOYSA-N palladium Substances [Pd] KDLHZDBZIXYQEI-UHFFFAOYSA-N 0.000 description 13
- 238000012545 processing Methods 0.000 description 9
- 230000004083 survival effect Effects 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 239000011521 glass Substances 0.000 description 7
- 108090000623 proteins and genes Proteins 0.000 description 7
- 238000012827 research and development Methods 0.000 description 7
- 238000004904 shortening Methods 0.000 description 7
- 229960003080 taurine Drugs 0.000 description 7
- 238000009509 drug development Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- DQTKCIVHDDGAFK-UHFFFAOYSA-N 2-(5,6-dihydro-4H-cyclopenta[d][1,3]dithiol-2-ylidene)-1,3-dithiole-4,5-dithiol Chemical compound S1C(S)=C(S)SC1=C1SC(CCC2)=C2S1 DQTKCIVHDDGAFK-UHFFFAOYSA-N 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 5
- 230000005469 synchrotron radiation Effects 0.000 description 5
- XMWRBQBLMFGWIX-UHFFFAOYSA-N C60 fullerene Chemical compound C12=C3C(C4=C56)=C7C8=C5C5=C9C%10=C6C6=C4C1=C1C4=C6C6=C%10C%10=C9C9=C%11C5=C8C5=C8C7=C3C3=C7C2=C1C1=C2C4=C6C4=C%10C6=C9C9=C%11C5=C5C8=C3C3=C7C1=C1C2=C4C6=C2C9=C5C3=C12 XMWRBQBLMFGWIX-UHFFFAOYSA-N 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 4
- 229910003472 fullerene Inorganic materials 0.000 description 4
- 125000005843 halogen group Chemical group 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 229910052763 palladium Inorganic materials 0.000 description 4
- 238000000634 powder X-ray diffraction Methods 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 3
- UHOVQNZJYSORNB-UHFFFAOYSA-N Benzene Chemical compound C1=CC=CC=C1 UHOVQNZJYSORNB-UHFFFAOYSA-N 0.000 description 3
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 3
- 238000003991 Rietveld refinement Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- APGDTXUMTIZLCJ-CGVGKPPMSA-N prednisolone succinate Chemical compound O=C1C=C[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@@](CC4)(O)C(=O)COC(=O)CCC(O)=O)[C@@H]4[C@@H]3CCC2=C1 APGDTXUMTIZLCJ-CGVGKPPMSA-N 0.000 description 3
- 229950004597 prednisolone succinate Drugs 0.000 description 3
- 238000004467 single crystal X-ray diffraction Methods 0.000 description 3
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- PYKYMHQGRFAEBM-UHFFFAOYSA-N anthraquinone Natural products CCC(=O)c1c(O)c2C(=O)C3C(C=CC=C3O)C(=O)c2cc1CC(=O)OC PYKYMHQGRFAEBM-UHFFFAOYSA-N 0.000 description 2
- 150000004056 anthraquinones Chemical class 0.000 description 2
- 230000008033 biological extinction Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- RKTYLMNFRDHKIL-UHFFFAOYSA-N copper;5,10,15,20-tetraphenylporphyrin-22,24-diide Chemical compound [Cu+2].C1=CC(C(=C2C=CC([N-]2)=C(C=2C=CC=CC=2)C=2C=CC(N=2)=C(C=2C=CC=CC=2)C2=CC=C3[N-]2)C=2C=CC=CC=2)=NC1=C3C1=CC=CC=C1 RKTYLMNFRDHKIL-UHFFFAOYSA-N 0.000 description 2
- 238000002425 crystallisation Methods 0.000 description 2
- 230000008025 crystallization Effects 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000002050 diffraction method Methods 0.000 description 2
- 238000010894 electron beam technology Methods 0.000 description 2
- 238000001493 electron microscopy Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 229910010272 inorganic material Inorganic materials 0.000 description 2
- 239000011147 inorganic material Substances 0.000 description 2
- 239000008204 material by function Substances 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 150000002739 metals Chemical class 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012856 packing Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000001144 powder X-ray diffraction data Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 229910052710 silicon Inorganic materials 0.000 description 2
- 239000010703 silicon Substances 0.000 description 2
- 230000007480 spreading Effects 0.000 description 2
- 238000003892 spreading Methods 0.000 description 2
- 238000003696 structure analysis method Methods 0.000 description 2
- 241000554155 Andes Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 206010017577 Gait disturbance Diseases 0.000 description 1
- 235000015842 Hesperis Nutrition 0.000 description 1
- 235000012633 Iberis amara Nutrition 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 208000035480 Ring chromosome 8 syndrome Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000003470 adrenal cortex hormone Substances 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000011365 complex material Substances 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- WXIFAXQBQNGURP-UHFFFAOYSA-N cyclopenta-1,3-diene 1-(2-cyclopenta-2,4-dien-1-ylethynyl)anthracene-9,10-dione iron(2+) Chemical compound [Fe++].c1cc[cH-]c1.O=C1c2ccccc2C(=O)c2c(cccc12)C#C[c-]1cccc1 WXIFAXQBQNGURP-UHFFFAOYSA-N 0.000 description 1
- 238000013498 data listing Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 230000010429 evolutionary process Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 239000000696 magnetic material Substances 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 239000012907 medicinal substance Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 238000011170 pharmaceutical development Methods 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 229940127557 pharmaceutical product Drugs 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 239000002718 pyrimidine nucleoside Substances 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000012144 step-by-step procedure Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000002887 superconductor Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 210000002105 tongue Anatomy 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000009333 weeding Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N23/00—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
- G01N23/20—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by using diffraction of the radiation by the materials, e.g. for investigating crystal structure; by using scattering of the radiation by the materials, e.g. for investigating non-crystalline materials; by using reflection of the radiation by the materials
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
Definitions
- the present application was made by discovering the structure of the substance that forms this material, based on the diffraction intensity obtained by irradiating a powder sample with X-rays. We request a patent for a series of statements.
- the radiation identifies the structure.
- Futo is a leaf that refers to at least the difference between the structure of its quality and the lattice and child structures contained in it. Furthermore, the term “substance” is a term that includes both a child structure (crystal constant of a crystal) and a child structure (of a molecule in). However,
- G has already been optimized for local optimization, and there are already a few of them, which will be explained in a public manner in the following section. And in English-speaking countries, such an am is often referred to as the Lakian G A, bearing the name of the ancestors who uttered it. On the other hand, in Japan, the same thing is often referred to as the id G, so the terms Eve and G A are used in this specification. It may also be called G if necessary.
- the most important and fundamental information for research and development of foods and pharmaceuticals is information on the child sequence of the foods. In other words, it is possible to know what the three-dimensional atomic arrangement is within the quality child and to predict the performance of that quality to some extent. Regardless of the field, the situation is almost the same in molecular research and development.
- the newly designed, first-designed molecule is the atomic configuration that discriminates when the objective was created.
- the atomic arrangement is determined, it is only possible to confirm that the desired molecule has been created, and other important information can be obtained. For example, from the atomic distance that separates the atoms from each other, we can obtain a large amount of information on the molecular weight, such as the number of children (original state is 2) and the number of ions of the child.
- the structuring method based on the X-fold of the crystal material is a method to directly determine the crystal structure developed by J. a.H. It is called.
- the most unavoidable relationship is to obtain a single crystal material by carrying out such an atomic sequencing method by crystal X-folding. This is because the crystals are not so easy that they can be used as a single crystal material.
- the powder sample may be compressed or heat-treated, so that the process may change depending on the process of the molecule. There is. Although it is necessary to determine the final sample in order to trace the changes in the structure in these processes, there is currently no method for determining the final sample.
- Molecules such as conductors and luminescent materials are expected as the quality of technology in the future about 10 years from now, and research is being conducted by a large number of researchers inside and outside Japan. Therefore, even in these studies, it is the most important in the structure and material development stage by X-folding.
- the structure of carbon saccharor which is now used in bogs, tesque rackets, frubs, cosmetics, and other products that exceed the eye, is the most important structure in the initial discovery. It was te. In other words, after the structure was determined, the process characteristics of functional materials such as conductors and materials were clarified based on the structure, and application was promoted. At present, a plant with annual production capacity is already in place, and many products are beginning to be used.
- the amount of information contained in X obtained from a powder sample is extremely small, and will be clarified.
- a certain amount of quality (same degree of symmetry) could be generated and the sample was placed in the X position. Then, as shown in (a), the X-rays are diffracted, resulting in a diffractor having a diffraction-like distribution.
- the quality of the sample cannot be made large enough for the diffraction test, and the sample of quality is placed in the X position without help.
- the X-rays that enter the end sample fold around into a conical pyramidal shape, producing diffraction tans () in which the diffraction degrees are concentrically distributed.
- the diffraction ring has a one-dimensional distribution of intensity distributions along the direction of diffraction. I can not understand. Therefore, the amount of information provided by the diffraction ring, which is the X-fold of a powder sample, is as small as that of a two-dimensional diffraction pattern obtained from a single crystal material.
- the diffraction from the powder sample shows that many fine crystals contained in the powder sample are present. Often, the resulting diffraction pics overlap one another. Then it is not possible to separate the overlying bigs, and the information contained in the diffraction is better. And, in the distribution of the powder sample, since a small number of pics are scattered in such a wide angle range, in many cases, the diffraction data is eventually dropped into the data showing the picopic degree and the pair. .
- the accuracy that can be obtained from the current X device without the X position is about 0 to 0.
- each of the lattice constants is determined.
- the problem is that the required accuracy is very high.
- the value of ab C which is the sample quality for determining the lattice constant, is ⁇ 3 A, whereas the accuracy required for these parameters is 0,01 ⁇ 0,0 A. . Therefore, between lamellas (a, b C), (resolved to the width of) is required in 5 to 6 degree digits of lamellas.
- the determination parameter is a child constant, and its degree is expressed by, ab and C become the 5th to 6th digits respectively, and pv becomes the 4th to 5th digits respectively. Even if it is off, it will always be large. In addition to that, the lamella regarding the deviation of the origin must be determined by the digit of 2-3 degrees.
- the number of interrogated lamellas is extremely large at 29 to 3 degrees, but as described above, it is possible to reduce the amount of information due to the undue amount of diffraction. You have to decide. Even if the number of determined lamellas is 6 in the determination of the child constant, it is really here that it is determined based on the diffraction. (4) If you decide to create a child
- the species of a tac crystal belonging to a given group was grown to a given size by vapor diffusion, and three-dimensional determination was performed using the complex isotope conversion method by X-folding of a single crystal material. The effect is described (00 to 00).
- the single crystal material is grown to the extent that it can be subjected to the X test, and the substance is not analyzed by diffraction data analysis. ⁇ 2
- This report discloses techniques such as single crystal analysis and analysis by irradiating a sample with X-rays.
- the local (equivalent to the tall body) is locally searched. It has been optimized (in the literature). Note that the G G used in this technique has a high degree of adaptation.
- This report discloses an X-axis device that reduces the effects of scattered X-rays by modifying the sample holder and its design.
- the detection is refined beyond its habit to increase spatial resolution in X and synchrotron radiation for end-diffraction data.
- the technique of measuring the data which interpolates is disclosed. This is also applicable to two-dimensional as well as two-dimensional.
- This sample is designed to facilitate the work of mounting a small sample in the X position, even if the powder containing powder sample is thin or the sample body is thin. Hoda is disclosed.
- This report discloses a method and the result of crystallizing a natural mutant of puteinase and determining its structure.
- the purpose is not merely to find an adaptive solution, the purpose is to apply it to the analysis in which there is a single solution such as the material determination by the X-fold. In some cases, it is questionable whether it is practical or not.
- This report discloses a technique that uses a genetic gene to search for the optimal and non-optimized lamella, and incorporates a device that takes into account the continuity of the lamella in the genetic gene.
- the midpoint between the two bodies selected for the two bodies selected as parents at that time is first found, and then the point is found.
- the two fields are generated according to successive probabilities such as the regular cloth as the center. As described in 044 of this document, it is set in proportion to the distance between the two parents of the regular cloth and the distance between the straight line connecting the parents and the third 3 as described in 044. To be done.
- the search is performed in a comparative range, and in the panel, the parents are often close to each other, and the search is performed.
- mutation is a work of adding a normal number to the gene of the body, and that it is possible to move the board by taking charge of the local search for the mutation.
- the method such as the descent method may be combined in order to efficiently reach the peak on the board.
- the id method is a combination of the above G and not the incorporation of the local optimization into the GA.
- Rachia G that is, id G
- the operation that is structured during a certain generational change is also presented.
- local optimization is performed on the new body caused by the mutation and the new body caused by the mutation, so that the number of generational changes is small, but the number of generational changes is enormous. It will be nothing. As a result, even if the technique of the literature is used, the calculation period required for substance determination must be limited.
- I referred to this as a material to explain the B X method in G.
- the problem to be solved is to provide a means for making it possible to determine the structure of the material at a high level by realistically packing the diffraction data obtained by irradiating the material with radiation. And That is, even if it is a substance that is difficult to form a crystal with a certain degree of quality such as many new materials, even if it is the final sample, the degree distribution data of X, the structure and the arrangement of the crystals, etc. Is to be able to decide.
- this technique provides a means to accelerate G degrees to shorten the convergence time, and to perform fine optimization or specific determination of a larger number of lamellas in a realistic range. Doing this is also a problem to be solved. It is also possible to provide a means to perform higher-speed targeting and to determine a large number of lamellas more closely than before, while optimizing them, based on measured data with a small amount of information. This is the task to be decided.
- the central part of the clarification is the id G itself, which has been optimized in a specific formula (G am), as mentioned in the technical section.
- the present application provides a method and a program for optimizing multiple lamellas by executing this id G, and using this method, the structural lamellas are sufficiently optimized in a wide area among the lamellas. It also provides a technique for estimating (ie) the material structure with sufficient accuracy from radiation data such as diffraction rings.
- this means is that some of the symbols that make up each individual are a number of lamellas that correspond to a predetermined number, and G is used to search for a correct combination of these lamellas. It is a kind of method to optimize lamella in a wide area.
- each of these lamellas is used to search for a positive combination of these lamellas.
- the number of fields distributed over the population is used as the early generation Popo, and in each generation, the evaluations for evaluating the generation of the Population of the generation as well as the newly generated neoplasm, and this Popo After repeating the process of generating a new body between these bodies with the number of bodies as the parent, and selecting the number of bodies to be left in the next generation and performing other precursors, these are repeated.
- the multi-parameter optimization method by In addition, local optimization is performed on a specific body, which is a part of the generation's population, and the population of the generation is It is characterized by having at least one local optimization process in which local optimization is performed on a specific body that is a part of the show. This is an optimization method for multiple lamellas by the Idd G.
- the means is to have G in a nutshell.
- this means uses, for example, the number of fields in which these lamellas are distributed each time as the early generation Popio, and in each generation, the new generation that is the newly generated body of the alternative Popio.
- the evaluation process for evaluating the body, the generation of new population by parenting this population and the generation of new bodies between these bodies, and the number of bodies to be retained in the next generation are selected. After repeating the steps of the anterior body, while adapting the mutations that change some of these bodies, the generations are repeated and the awaiting of the better body is carried out. It is assumed that the method is an optimization method of multiple lamellas by G that searches for an appropriate union of.
- the evaluation is the process of evaluating the generations of neonatal body, which is the newly generated anterior population. Also, this is a process in which a new body is created by a line between these bodies with the number of bodies of Popo as parents. In addition, it is the process of selecting the number of bodies to be left for the next generation and making other precursors.
- Mutation is the process of making changes to some of these bodies.
- the means is a method of optimizing the lamellas for the purpose of searching for an appropriate combination of the lamellas of the above number by G which repeats the generational change.
- it is the best meaning of the newly born individuals as a result of the adaptation or no mutation that the above-mentioned alternations wait for the better generation of the body.
- the term “taste” means that it meets the requirements already described, and that it means that the individual survives from the previous generation.
- the part that describes the above-mentioned processing steps is, for example, in the generation, the evaluation step that evaluates the body as the body of the generation and the body of this part. After repeating the process of selecting multiple bodies from among these bodies to form a body, and the process of interacting between these bodies to generate a new body, there is no trap.
- local optimization is performed on a specific body that is a part of a generation's population in a plurality of generations, which is a part of all generations, and that In multiple generations that are part of all generations, local optimization is performed on a specific body that is part of the progeny of Popo, and at least the local optimization process is performed. It is a method of optimizing multiple lamellas according to the Id G.
- the number of specific bodies selected in a generation may be constant during all generations, or may change during a generational change.
- the specific body is a population part
- the number of the specific bodies may be determined by an absolute number, and the population is determined by the predetermined
- the popition is constant and equivalent, there is a difference between the two when the popi- tion changes due to generational changes.
- the number of specific bodies may be set to occupy a predetermined set with respect to the number of neoplasms caused by mutation. Of course, it is not necessary for these sentiments to be constant, and it is okay if they change from generation to generation.
- one generation of each generation of population change is selected as a specific body and subjected to local optimization. And this is rarely the preferred implementation.
- the local optimization is performed once, for example, on each individual who forms the poppies of the present age.
- the individual may be marked with a mark indicating local optimization (such as a tag).
- a mark indicating local optimization such as a tag
- X-rays are the most representative radiation, neutrons and electron beams are also included. Of course, some X-rays include radiant light (cut), X, and light in the X region. Next, diffraction is the mainstream of transmission, but it also includes the case of reflection. And, being continuous within the range of each individual is a condition for subjecting the individual to local optimization of adaptation.
- the target of the optimization by this means is the distributed, which is a part of all generations.
- this measure gives direction to the optimization during the generational change, so that the number of generational changes is small, but it is also the final optimization to reach the global optimization. Is the most.
- the direction of evolution is moderately given during the generational change, the generational change does not often occur even if a simple G is used to search a wide area. No need to increase.
- the direction of evolution is moderately given during the generational change, but since the number of alternatives until reaching the global optimum is greater than that of simple G, the number of alternatives until reaching the global optimum is It will be reduced compared to the past.
- the solution will be reached at once. Therefore, with this method, it is possible to shorten the time required to reach the optimum in a wide area, compared with the conventional two.
- this method dramatically improves the wide-area power compared with the conventional method and the deviation of 2, and can significantly reduce the calculation time for optimizing a large number of lamellas. There is. As a result, even if the exploration gaps in the wide area search are too complicated, and even in the case of both the conventional and the unrealistic lamella optimization problems that could not be solved until now, this problem can be solved by this method. There is a possibility that you will be able to.
- the second point is how to adopt the selection criteria when selecting a predetermined number of bodies from a particular generation of poppies.
- the GA statistics such as selecting surviving bodies in a certain amount, determining the number of bodies to be intersected in a certain amount, and the type of body to be intersected. You should do it.
- ID G As before, there are roughly two types of ID G, which is a combination of G and local optimization. As mentioned above, this street means that the generational change is repeated in G to search a wide area, and only the last one is optimized, and all the alternations of G are optimized. is there.
- the local optimization in the generation of the number that is a part of the generation, It is characterized in that the local optimization process is performed on the body corresponding to a part. In other words, in this method, it is a body of local optimization in a part of all generations.
- the degree of specific generation and the number of specific fields are specifically exemplified.
- the number of specific bodies in a particular generation is several times, and the number of specific bodies in that generation is only.
- the number of specific bodies in a particular generation is 10 or several tens of generations, and the number of specific bodies in that generation may be a certain number.
- the local optimization degree belongs to a relatively low level, and in the setting, the degree of local optimization degree can be greatly reduced while the evolution direction is moderately given.
- G a wide area search can be performed stochastically, while individuals that happen to be on the optimum side of the area can be optimized, and the optimum value can be reached all at once. Therefore, according to this method, the effect of reducing the optimum to a wide range is large among the above-mentioned steps, and the result of the calculation is remarkable especially when the number of optimized parameters is large.
- the optimization is carried out only on one body of the population belonging to the particular (all generations good) on which the local adaptation is carried out.
- the rate is particularly low. Therefore, according to this method, there are some cases where the result between calculations becomes large, and this result becomes remarkable especially when the number of optimized parameters is large.
- the means do not require that all the generations to be locally optimized are scattered all over the generation, and it is possible that all the optimizations are not carried out in the subsections of all generations. For example, some generations may not undergo local optimization after generation change, and some generations may not undergo local optimization.
- the frequency of occurrence of the aforesaid generations after each progeny is set higher when the generations are lower than the previous generations.
- the body to which the local optimization is to be performed is specified in any of the populations of the generation, and the degree of change is changed during the generational change, and the setting is made to increase.
- the number of occurrences of a particular alternation is not limited, it may be possible that the number of occurrences increases stepwise only once during the generational alternation, or even if the number of occurrences gradually increases in some or all sections of the alternation. Good.
- the bundle of id GAs may be expanded, and the result may be exhibited if the calculation time is further shortened. (6)
- MAKING 6 In the optimization of multiple lamellas by the above-mentioned id G, it is characterized by appearing at a predetermined cycle in the latter half of the above generations.
- the action described above can be obtained.
- the bundle of correct answers is faster and the results are more effective than when the optimization target is selected from the individuals with high adaptation. To be done.
- the limitation is narrower than the above-mentioned 7, so the above-mentioned use is applicable.
- this method may increase the possibility that the id G will converge to the correct solution, which will further shorten the calculation period.
- the group in the optimization of multiple lamellas by the eight-stage id G described above, includes a plurality of groups that belong to one of a predetermined number and a combination of which the population of the population is lower. It is characterized by being a group consisting of the body.
- the above-mentioned use is more applicable.
- the search by the id G can be reduced, and the time until the correct answer can be further improved.
- the local optimization In the optimization of multiple lamellas by the above-mentioned ibid GA, the local optimization, the part of the popo of the generation is selected as the body, and the local optimization is performed. In the determination of the body, it is characterized in that if the body is lower, the body is selected at a higher rate.
- the optimization of multiple lamellas with the above-mentioned id G allows the next generation to survive in the next generation even if the genital population is relatively low. It is characterized by being selected.
- this means does not adopt the strategy that only the adapted individuals survive, but the option that even the relatively poorly adapted individuals may survive in the next generation.
- individuals who reach the correct answer if they are locally optimized may survive in the next generation even if they are left without local optimization in their generations.
- this method there is a possibility that the ibid G will converge to the correct answer quickly and the time may be shortened. Increased fruit is obtained.
- the optimization of multiple lamellas by the 2- or 3-stage id GA described above is called the top body, which has the highest said population.
- the feature is that it will be used if it always remains when changing generations.
- the existence of the top body is guaranteed, so if the search reaches the correct answer, the inconvenience will be prevented if the individual who reaches the solution is changed at the time of generation change. As a result, once the solution converges, it will not fall out of place, and if the generational changes do not occur and the caps will not change, the convergence will be easy.
- Ming 5 is the optimization of multiple lamellas by the above-mentioned steps and generally the same id G.
- each individual forming the population of each generation consists of a row containing a number of lamellas corresponding to a given
- the number of lamellas is optimized by G, which means that the generation of higher lamellas is generated by overlapping the generational alternations from the early eras with a certain degree of distribution. It is assumed that this is a data optimization method.
- G which means that the generation of higher lamellas is generated by overlapping the generational alternations from the early eras with a certain degree of distribution. It is assumed that this is a data optimization method.
- Means, local optimization is performed on a specific body that is part of all generations, and that is part of all generations, and that multiple generations are part of all generations. In this regard, local optimization is performed on a specific body that is a part of the generation population, and at the same time, at least.
- the means are roughly the same as the steps.
- the anterior body corresponds to the number of lamellas contained in the body. It is an index that shows how closely the data pattern determined by the numerical calculation that is assumed to be the same as the measured data pattern is generated, and by generating a high-dimensional field, the data pattern of the field is calculated. It is the data by means of the above-mentioned data for the purpose of performing the touch-up with the data and estimating the above-mentioned data.
- a target indicating the degree of non-touching and non-touching may be used, on the other hand, a target indicating the difference (squareness) of the touching foot such as the square difference may be used.
- the core iBD GA is Since it has the characteristics described in each step, it is possible to obtain unique results. As a result, according to this method, the id G can be converged more gradually with respect to the touching solution, and the calculation time required for the data method can be shortened. 3 ⁇ Method of determining barrel material
- Ming 7 has the following characteristics based on the ray data.
- the core ibid G is a deviation of the above-mentioned 5 steps and has the characteristics described in the section, so that it is peculiar to each due to the characteristic. The fruit is obtained. In other words, when the radiation pattern is touched, the convergence of the structural lam
- the method of determining the structure based on the radiation data in the light stage is as described in the previous stage, in which the lamella is the lattice constant that defines the structure of the substance and the three-dimensional structure in the molecule that constitutes the substance. It has at least one of the molecular structure lamella that defines the atomic arrangement, the electron intensity distribution lam that defines the rational electron distribution within this molecule, and the crystal lamella that defines the dimensional atomic arrangement of this quality. It is characterized by
- the crystal lamella that defines the dimensional atomic arrangement in terms of quality is (z) that is graded in units of a and b C in the crystal orientation. It also includes the angular lamella that defines the () of the body in the crystal.
- ,, and Z are usually represented by values in the range 0 to the range.
- the data is characterized by diffraction that is distributed concentrically each time.
- the means even if the radiation component formed by the sample quality is diffraction, it is possible to determine the structural parameter that determines the structure of the quality.
- the means is a more specific version of that policy in the above 9th paragraph.
- the means can use a number such as the sum of the differences between the data and the hypothetical data as the adaptation, which facilitates the adaptation.
- the local optimization can be selected from various local minimization methods by least squares.
- Ming 2 is a method of construction based on ray data similar to the above 7 steps.
- the method was used to determine the structure of the powder samples containing multiple, the composite material, the amorphous (amorphous), and the material that was the material, by means of the breaking of the rays that were exposed to this material. Analyze the data that shows the diffraction intensity distribution. That is, based on this data, the displacement lamella that shows that the substance is also a substance is determined by the data.
- Id G which is a genetic am (G) with a local optimization incorporated, is used, and this G has some features.
- the presupposed G is the generation process in which early generation Popo is generated, and the generation change process in which mutation is repeated by repeating replication and selection. That is, in G, first of all, the individuals with the aforementioned lamellae are spawned with a certain degree of characteristic, and used as the early generation population. To this extent, a substitution process is carried out in which the selection of these bodies by evaluating the degree of the above-mentioned and the degree of the above-mentioned detec- tion and selection of these bodies is repeated.
- the GA performs local optimization on the body of the population in multiple generations during the generational change process. is there.
- the population of this adaptation may have a relatively low population of Poppies.
- this method uses the diffraction distribution data obtained by irradiating the sample material with radiation to identify the structure that conforms to this distribution data.
- Number decision process Background process Spatial inclusion process Basic process Densification process, at least lattice parameter determination process Spatial inclusion process Basic process.
- this method is characterized in that the material determination is carried out using the Aid, which is a combination of the lattice optimization process and the local optimization process, in one of the lattice constant determination process and the process.
- the lattice constant determination process is a process for determining the crystal constants of crystals contained in this material. That is, in this process, the lattice constants that define the crystallites, such as the lattice constants (ab C p), are determined.
- the background process is a process that reduces the background noise contained in the frequency distribution data.
- the deviation also acts as a noise that obscures the useful information-less signal, so it is necessary to reduce the effect as much as possible.
- the space inclusion process is a process that narrows the supplement of this space.
- the high probability is narrowed down to a few degrees, except for the properties of the crystals that are of class 2 and 3. .
- the basic process is the process that initially determines the crystal structure and identifies it.
- the most probable space is determined from the supplements of the space embedded in the above-mentioned integration process, and the position and force of the child within the unit cell and the three-dimensional atomic arrangement are determined.
- the rows and columns are decided a little bit.
- the structural densification process is a process that densifies this structure and more closely determines the constituent material. Furthermore, in this densification process, the degree of distribution in the molecule can also be estimated. Targets specific bodies that are part of the Popi When the local optimization is carried out in this way, this body shows that it is actually measured data in the alternative population, but there is a possibility that a relatively low group may be selected. .
- the procedure is clarified by making a hierarchical estimation of the material structure based on the radiation data, and in addition, in any of the steps, any process using the id GA is performed. It has been revealed. However, its id G is also limited, which allows the structural lamella to converge to the correct solution quickly and greatly, which greatly reduces the calculation time.
- a lamella program that can be executed on a computer, and that has the function of searching for a positive combination of a number of lamellas corresponding to a given pie. It is assumed that In order to carry out the optimization of multiple lamellas by means of ibid GA, which is described in every four steps, the steps of carrying out one of the steps of popping and substituting the steps, the steps, the steps, The above is to have a step (that is, an evaluation step, a step, a step, a mutation step and an optimization step) corresponding to each of the natural mutation and the local optimization step.
- the program of this means should be By executing it, the optimization of multiple lamellas by the above-mentioned 4-stage id G is realized.
- 2 4 of Ming is a lamella program that can be executed by a pie, and is a computer program that can exert the function of searching for a positive combination of several lamellas corresponding to a given pie at a given pie. It is assumed that.
- each of the individuals forming the population of each generation consists of a row containing the above-mentioned number of lamellas corresponding to the above-mentioned constant, and these lamellas are distributed with a certain degree of initiality.
- the generation of higher fields is generated after successive generational alternations, so that the optimization of the above-mentioned number of lamellas is performed in G (ism).
- the optimization step is incorporated.
- the means further comprises that the optimizing step is an arithmetic step targeting a specific field that is a part of a population of the generations in a plurality of generations that are part of the entire generation generated by G. , It is a calculation step that targets a specific body that is a part of the population of the generation in a plurality of generations that are part of all generations generated by the GA. Is characterized by.
- Each of the individuals of the instrument that form the population of each generation contains a symbol corresponding to the number of lamellas mentioned above, and these lamellas have some degree of distribution in the early generations.
- the local optimization operation related to the above is included in the G am that aims at the optimization of the above-mentioned number of lamellas due to the generation of higher fields after repeated generational changes at predetermined times.
- the optimization step is incorporated.
- the means further comprises that the optimizing step is an arithmetic step targeting a specific body which is a part of a population of generations in a plurality of generations which are a part of the entire generation generated by G. And at least one of the generations generated by G, which is a part of all generations, which is a calculation step for a specific field that is a part of the generation of the generation. Is also a feature.
- this means is based on the above-mentioned two-fourth step, and removes the constant that the number of lamellas for searching the optimal combination is related to physics, and as a result, a large number of lamellas suitable for non-physical search It can be applied to the problem of searching for various combinations. Therefore, according to this measure, while the results of the above-mentioned 2 3 2 4 steps are obtained, the range is wider than that including social issues such as political decisions and management issues, and the like. There is a result when it spreads to Mino.
- the structure is determined based on the radiation data by the program with a powerful force equivalent to the above 23 steps.
- the means is capable of exerting the function of estimating the structural lamella defining the structure of the material constituting the material at the given lump. It is assumed that it is a computer program.
- Each of the plurality of bodies of the means forming the popo of each generation contains a symbol corresponding to said lamella, and that of these bodies.
- Each of these is an indicator of the frequency of the lamellae emitted from this lamella corresponding to the body, and the degree of matching with the tan, and the lamellae of the lamellae are distributed to a certain degree.
- it has a generation step that generates these bodies as the initial population and repeats the generational change according to a fixed order including this population step, the step, and the mutation step, and then the population population. In order to wait for the higher body to be generated, and to optimize the lamella, the local optimization of the above is performed for a given body.
- the optimization step is incorporated.
- the means further comprises that the optimizing step is an arithmetic step targeting a specific field that is a part of the progeny population among a plurality of generations that are part of the entire generation generated in A. It is at least one that it is a calculation step that targets a specific field that is a part of the population of generations in multiple generations that are part of all generations generated by G. To do.
- the structure is determined based on the radiation data using the strong power of the Aid.
- the number of computations required was large and the number of random lam
- the problem is that the problem can be solved within a practical calculation period.
- the basic program is based on the ray data, and at least one is recorded.
- Ming's 29th is an Evidence G computer. At least one of the above-mentioned Lameta program, which is a deviation of 23 to 25 steps described above, and the program which is one of the above-mentioned 26 to 27 steps, is based on the ray data. Is to be.
- the arrangement of means allows the lines of these programs regardless of whether the arrangement belongs to a pie.
- a device for measuring substances by means of radiation a device for irradiating a predetermined quality with radiation and measuring the diffraction pattern generated by this quality, and an analysis based on the measured data from this class. It is characterized by having 29 steps of pits and 30 steps of pits for estimating the quality structure.
- the above-mentioned constant device and the above-mentioned instrument or analysis are on the same ground. No, it is not an essential problem that the transmission of diffraction data between the two parties is parallel, and that both parties have the same or no right of use.
- a simple explanation of the plane is a set comparing the X-types of the single crystal material and the powder sample. After that, (a) shows X and its value generated in the single crystal material, and (b) shows X and that generated in the powder sample.
- the second is a group that compares the features of GA, which is the nucleus, with surgery.
- 2 (a) is a conventional G composition
- 2 (b) is a conventional G composition
- 2 (c) is a clear G composition. It is a figure.
- 4 is a set showing the structure of various materials used in the X-test. Then, 4 (a) is Pd (d), 4 b) is
- Fig. 7 is a diagram showing the order of the method of defining the structure as a state.
- Figure 8 is a graph of measured data that illustrates the diffraction intensity distribution of a powder sample.
- Figure 9 schematically shows a three-dimensional atomic array crystal structure in a molecule.
- 0 ⁇ is an example of a unit and its child constant.
- Figure 3 is a diagram showing the importance of the process for determining the child constant in this embodiment.
- Figure 3 is a graph that illustrates the Cockground disturbance included in the intensity distribution data.
- 4 (a) is a graph of the X degree distribution data from the powder sample C S PbC 3 and 4 (b) is a graph showing the data generated from the glass carrier.
- 4 (c) is a graph showing the degree of air scattering
- 4 (d) is a graph of the intensity distribution of the turbulence from the final sample
- 4 is the (e) data with the turbulence. It is a claf showing the results.
- 5 is a set showing the types of structural lams determined by the basic process.
- 5 (a) is the (z) of the molecular of the structural lamella
- 5 (b) is of the molecular of the structural lamella.
- Figure 7 is an intensity distribution graph showing the fitting due to the structural densification process.
- Figure 8 is an intensity distribution graph showing the fit 2 due to the structural densification process.
- Figure 9 is a diagram showing the order of the id G used in this embodiment.
- No. 20 indicates that the GA shows that the lattice constants are determined by the lattice constant determination process.
- the second example illustrates the inconvenience that occurs when the lamella is not grouped.
- 2 (a) is the lattice constant corresponding to the field of
- 2 (b) is the lattice constant corresponding to the field of.
- 22 is a set showing the parameters of the lattice constant determination process in GA. , 22 a) is for Ta, 22 b) is for 2, and 22 (c) is for 3, respectively.
- 23 is a set of G parameters of the lattice constant determination process. , 23 a) is for Ta, 23 b) is for Ta 2 and 23 c) is for Ta 3, respectively.
- the ones used in the above are as follows.
- S 2 step (record poppy individuals)
- S 03 step (select bodies to generate neonates)
- S 04 step selective remaining species and manufacture and store in next generation)
- S 05 step new and body Select from
- R P (a number defined by, the lower the higher the adaptation.)
- the inventors completed the above-mentioned description and carried out the present invention in the form described below to obtain the data of the curve obtained by irradiating the powder sample with high X-rays with P ng 8. Based on this, it was possible to determine the structure of various qualities.
- X degree depends on whether short-time measurement is possible, and eventually depends on the amount of money.
- the onion and the X-ray flatness appear to be different S ratios.
- the amount of information in the X data is small due to the number of pictures, it is not possible to provide the small amount of information in the diffusion equipment compared to the large-scale equipment. Therefore, it is more difficult than the large-scale equipment based on the diffraction data measured by the popular equipment. It is injured.
- the core GA of the present invention is used in the lattice constant determination process and the basic process.
- the details of the implementation method as a construction method will be given later, and here, only this id G (GA) will be explained only in two.
- the local optimization is performed on a number () distributed over the alternation of G, and the target individual () is For example, it is a number.
- the table showing that the specified number is the case is not limited to the case where the specific generation is widespread after all generations, and includes the case where there is a specific generation at each generation change and the specific generation continues. . Therefore, 2 (C), which represents GA, is better than 2 (b), which represents Rachia GA. In addition, although it was drawn that there was no optimization in the world, it could be drawn so that generational change local optimization would be performed.
- the number of individuals that are the target is not the number of poppies. Physically, they appear at a certain generational alternation (for example, a few generations, or a few generations or ten generations). And the number of fields in the generations of Popio (in thousands, and in some cases in the minority) is, for example, only a few, but not a few.
- the most frequently used settings in this embodiment are specific (all generations), and the
- the number of optimization operations performed is extremely small compared to the number of neoplasms.
- the number of specific fields is limited to a very small number, which is one of the populations, not only by reducing the number of local optimization operations and reducing the computational load. Not only that, there is also a figure that the number of generations was increased to give a profound evolutionary tendency.
- G which cannot be searched stochastically, converges optimally, and waits for a long time before becoming G.
- an optimization problem that cannot be solved due to the large number of lamellas or the gap between lamellas can be solved densely between practical operations.
- G chooses, as the second characteristic, the optimization () of the particular generation of the population, and does not select the adaptation individuals as in G, but rather the adaptation individuals. I see.
- This table is introduced into G to select a specific body, and the following table shows how many outcomes there are compared to the usual selection of preferential individuals to the specific body.
- the data in (1) is the one when this discovery was made, and in the program using G, a clear land was left in the set parameters such as the number of populations. Therefore, the proper calculation of program lamellas may further reduce the calculation time.
- G has the characteristics of G and Q so that the GA optimization can be completed with each other and the wide area search can be performed efficiently even between lamellas.
- the first is to devise how to combine G optimization and reduce the degree of local optimization.
- it is necessary to devise a method of optimizing individuals such as Popion to increase the probability that they will reach the correct answer (that is, regional) by optimization.
- G A also has a high speed (very small) force over a wide area search, and local adjustment is also precise.
- G there are places where it is possible to carry out a wide-area search at high speed, those that are prone to remnants, and there is a point where it is difficult.
- local optimization there is a place where a wide-area optimum can be reached in close proximity to the optimum, while there is a place where a wide-area search is suitable. Therefore, G has both the above and The result is that G optimization is combined in a very delicate manner, and each place is maximized. (2 clear 2 comparison
- This table is a list of the six classes (a to f) whose structures have been determined by the method of determining the structure based on the ray data of this embodiment, together with their models. It is a thing.
- the table presents the results of the two types of (and implementation 2) comparisons during the analysis of their qualities so that they can be compared with each other.
- the term “implementation” means that the powder sample structure was determined by the method of the present embodiment based on the diffraction data of the world's highest power measured at ng 8 described above.
- Example 2 unlike the ng 8 used in the experiment, an X constant device installed in the laboratory of the inventor of the present invention was used as an apparatus for measuring X data for the same 6 types of powder samples. It This fixed device was manufactured by () Co., Ltd. on the basis of the requirements of the invention. It was done. The fixed device costs about 50 million yen (generally equivalent to 100,000 US dollars), which is a small amount compared to the capital investment required to set up SP ng 8. The equipment specifications are generally below the standard.
- the comparison is to adopt the conventional method to analyze the data measured at the same P ng 8 as the implementation.
- the reason why the conventional method is used for comparison and the method 2 is used is that the conventional method 2 requires a very long calculation period. For example, in case of (e)
- 4 (a) is the crystal structure of the Pd (d) child.
- 4 (b) is (d)
- 4 (c) is
- 4 (d) is tau
- 4 (e) is c ()
- 4 (f) is cupped. Is.
- the analysis takes only several tens of minutes to several tens of minutes, and the accuracy (ie,) of the second sample is improved.
- the degree of the switch of the basic data virtual data is based on the match squared difference, the higher the match is, the higher (the high the margin is).
- the measured data is low because the measurement is performed by the X-equipment equipment in the laboratory rather than P ng 8.
- the structure was almost the same in implementation 2 as well, and the required optimum was close to that of implementation.
- the substance can be determined with the content comparable to that of the world's highest degree data. .
- Conformity in Implementation Example 2, if the substance structure is determined based on the data that is different from each other, it is not tasteful.
- the structure can be defined up to (f).
- implementation 2 (f) was implemented is that it was not possible to prepare data for data analysis by Ming. In other words, in the laboratory X-device, it takes about 1 week to 10 days for measurement, but in this case, it was not possible to receive the time required for the device before the application.
- the number of molecules in the molecule of the analytical quality was 100 in the medium fruit, but in the implementation (e), the number was reduced to less than half and the structure was simple. That is, even if the hypothesized material structure corresponding to each individual is simple, the calculation to calculate X is possible even if the powder sample is formed.
- the GA This is because, in the implementation (e), the population of Popo was optimized, and it was suppressed to ⁇ 50 degrees. In other words, e) is because when executing the program of Ming, the parameters such as the number in the population were properly set.
- the quality can be determined based on the SP ng 8 degree data, and the degree of freedom can be set up to 6 degrees, which is shorter than before. I was able to finish the data.
- the sample (d) descends to more than 8 degrees of freedom, which makes the structure difficult with conventional techniques, it is possible with this embodiment.
- the graph of 5 compares the conversion of R in the present Embodiment 2 with that of Conventional 2. That is, when determining the material structure based on the diffraction data, the best and best R of each generation population converge, and this embodiment corresponds to 2e) above. And conventional
- the evolution tendency is adapted, but the characteristics of the individual in the population are not lost. Therefore, in the present implementation, the R of the best body is only momentarily outpacing that of the conventional 2 and continues to converge thereafter.
- the second implementation is the preferred implementation of the optimization of multiple lamellas with the aid of the ident G.
- the procedure of (a) to (f) and execution 2 (a) to (f), except for the two cases, is the optimum method for the lamella of Ming. It can be applied up to 6 steps.
- the first, the first generation, and all generations except the population of each generation, local optimization is performed without one individual population.
- the product of the two generally approximates the number of local optimization operations per generation. If the product of the two can be appropriately reduced while properly taking the difference between the two, reducing the number of locally-optimized operations that are computationally expensive can lead to high-speed generational change and diversity. It is possible to give a moderate tropism to the preservation.
- a specific body is randomly selected from a group of individuals belonging to the population of the particular generation that is set to be low in the case of radam. Yes. If this method is used for determining the body size, the adaptation individuals are effectively selected at a higher rate than the adaptation individuals.
- a specific body is selected depending on the direction.
- the inventors refer to this specific method as described above. Therefore, the number of cases is 7 to It is also offset.
- G is to take a strategy that the probability that the population with a relatively low generation is relatively high is selected.
- the anterior field also corresponds to the above-mentioned number of lamellas contained in the field, and is an index showing how much the data determined by numerical calculation agrees with the measured data. is there. Then, by generating the high-order field, the data of the field are subjected to the switching between the data, and the data of the data is estimated for the purpose of estimating.
- Both are also forms of construction based on radiation data, which correspond to stages 7 to 20 and stages 2 and 22 above.
- the optimization of multiple lamellas by the above-mentioned ibid G is applied to a method for determining the structure of a material that estimates the structure of this quality based on the diffraction pattern formed by the rays irradiated to a predetermined quality. It is. And the aforesaid quantity is mainly the structural parameters that determine the construction of this quality. is there. It is also a target that shows the degree of coincidence of the diffraction pattern of the anterior body, which is assumed to be those lamellas whose quality is equivalent to that of the anterior body, to the measured diffraction pattern.
- the structural parameter determined by is the lattice constant that determines the sample structure and the molecular structural parameter that determines the three-dimensional atomic arrangement in the molecules that compose this sample. It is a crystal lamella that defines a dimensional atomic arrangement. Also, that is the X that is distributed concentrically each time. In addition, the adaptation is a number that indicates how well the data of the degree distribution of which this is the same as the data generated based on the assumed structural lamella.
- This construction method is expressed in the following two-stage conformance manner.
- the X radiated to this material is also the intensity distribution data, and the lamella is determined by the data.
- the asmism used at that time is the generation of a plurality of individuals with the aforementioned lamella with a certain degree of characteristic, and after the occurrence of the early generation population, Based on G (asm), the degree of the above-mentioned data is evaluated to select these bodies and the alternation process that repeats the stochastic mutation is performed. Then, in G, during the alternation process, local optimization is performed on the body, which is a part of the population, during multiple generations. It is characterized in that the above may be relatively low.
- the method of determining the structure based on the radiation data is based on the diffraction distribution data obtained by irradiating the sample material with X-rays as radiation.
- the purpose is to identify materials that conform to the frequency distribution data.
- the background process, the basic process, the spatial inclusion process, the basic process, and the structural densification process are performed in order.
- the crystal constants contained in this material are determined, and in the background process, the influence of the Cockground disturbance contained in the distribution data is detected. Then, in the space inclusion process, the complement of this space is narrowed down, and in the basic process, the structure of this crystal is initially determined and specified. Later, in the structural densification process, the structure is refined to more closely determine the structure of the constituent materials.
- the determination is carried out using the ibid G, which is a combination of G A ism) and local optimization.
- the local optimization is performed in multiple generations during generational alternation, targeting a specific body, which is a part of the body of the Popo of the generation, and this body is In Pope, it shows that it is actually measured data, but there is a possibility that a relatively low group may be selected.
- one of the above-mentioned lamegram and the ray data used in the above is recorded on a recording medium that can pick up only the data. Then, it corresponds to the 28th stage of Ming.
- the inventors mainly used widely available C RO and S. GA Pita
- This C has the power of 3 FL PS, and more specifically, it is a model name en (product name) made by a PC Stems company (the company name was changed due to the merger of a stock company). And that is called the C cluster (20 CP and 8 CP). Although there is some resistance to simply calling the C cluster as the PC cluster, it has nothing to do with the quality of its clarity, so we allowed it by simply using a powerful commercial C.
- this C corresponds to the 29-day G A pattern of Ming.
- the equipment used to obtain the results of It has a fixed device that measures the diffractor generated by irradiating the quality of radiation, and an analysis that estimates the quality of the structure by performing an analysis based on the measured data obtained from this data.
- the P n 8 used in the experiment and the X position in the anterior laboratory used in the experiment were used as this constant device.
- the above-mentioned C is commonly used in.
- the method for estimating the structure of the powder sample with sufficient accuracy and accuracy (that is,) by following steps (Processes P to P5) shown in 7.
- the lattice constant determination process P is a process for determining the crystal constants of many fine crystals contained in this powder sample.
- the lattice constants that define the crystallites for example, their crystal constants (abcc, p), are determined.
- the background process P2 is a process that reduces the influence of the clock ground disturbance included in the degree distribution data of X-fold, which is the data of this embodiment.
- the space-filling process P3 is a space where the fine crystals contained in this powder sample may be, and is a process that narrows down to a certain extent. Based on the position of the radiation, the crystals are taken and the , It is highly likely that the space will be narrowed down to a few degrees.
- the basic process P4 is a process that initially determines the structure of this crystal and identifies it.
- the most probable space is determined from the space complements that have been inserted by the above-mentioned insertion process, and the position and force of the child and the three-dimensional atomic array within the unit are determined. It is decided every time you stop.
- the structural densification process P5 is a process that densifies this structure and more closely determines the structure of the constituent materials. In addition, the densification process may also estimate the degree of distribution within the molecule.
- the powder sample is put into a glass carrier, and the SP distribution of X-ray diffraction X-rays measured by irradiating this material with SP ng 8 (noun) X-ray radiated X-rays is used as the input data.
- the data formed by the X-rays diffracted by the powder sample are the data of the intensity distribution, the data are one-dimensional along the diffraction 20 as shown in Fig. 8. This is the intensity distribution data of the developed folded X-ray.
- the material conforming to the input data is specified through the predetermined processes P to P5 in order, and the output is specified.
- O is the constant of many fine crystals contained in a powder sample and the three-dimensional atomic arrangement of the substances of the substances that make up the fine crystals.
- the sample quality is determined by using the lattice constant determination process P, the basic process P 4, and the ibid G, which is a combination of GA (asm) and local optimization. It
- the local optimization is performed during the alternation process of G, targeting a specific body which is a part of the body of Popo of the generation in multiple generations. Also, for this body, among the alternative populations, it is possible to select a relatively low group that shows measured data.
- the method of determining the structure based on the ray data of the present embodiment is determined using the ibid G, which is a combination of GA and local optimization.
- these process PP5 are also the standard method of construction based on the radiation data, provided that they are processed using the core-id of the present invention.
- the child constant determination process P is a process for determining the lattice constant as described above, and the lattice constant r, which is the lamella of the unit abc of the unit C, is determined as shown below. It
- the data of X from the powder sample is read into Pita () with P ng 8 (famous words), and then the pictograph is extracted in Step S to obtain the diffraction pattern. create.
- the data obtained from the diffraction data measured at the X position in the laboratory was used as described above.
- the diffraction image is the diffraction distribution data. If the number is as shown in 2, the number is assigned to the peak in order from the diffraction 20. That is, as shown in Table 3 below, the number of the pic 29 is the same.
- the table of data is the diffraction pattern.
- the process P is a process that does not remove the background disturbance included in the X-fold distribution data.
- the X-ray diffraction data contains X-rays from the observed powder sample as well as X-rays due to the black ground disturbance caused by the cause.
- the background level must be removed in order to accurately estimate the degree of construction.
- the powder sample was made from glass powder because of the small amount of powder sample required and the fact that the experiment was performed more frequently. Since the experiment is carried out in a glass, the glass ground tends to have a complicated shape.
- the X degrees of data shown are obtained, but this data also contains the disturbance due to these four children. That is, the glass tag Is shown in 4 b), air scattering is shown in 4 c), and temperature is shown in 4 d). On the other hand, the fluorescent X-rays are also clearly known, because they are equally scattered. Therefore, as shown in 4 e), if the X-ray disturbance due to these quadruples is removed, the frequency distribution of X from the powder sample can be calculated. (3) Embedded process
- the inclusion process P is a process that narrows down the high spatial complement, based on the data of X, except for the 23 types of properties that crystals take.
- the crystals contained in the powder sample were selected from (, single, orthorhombic, tetragonal, trigonal, hexagonal, cubic). Decide to belong. This is because it is necessary to determine the space from the crystal system in order to determine the structure by X-folding.
- the space is a group describing the crystal array of a crystal, and belongs to which of the two spaces.
- the number of space groups included in is 2, 3, orthorhombic 59, tetragonal 68, trilateral 25, hexagonal 27, and cubic 36.
- the space belonging to these is the annihilation that determines the annihilation reflection, and annihilation means that the morphisms that the crystal systems should appear disappear periodically in the action of the space.
- the rules If there is an action of 2 in the axis in the direction of b, then the k 2) of the reflection whose La () is represented by 0 disappears.
- the trust mg is a numerical value defined by the following number.
- w is the weight of the eye
- w is the weight of the eye
- w M29.
- y (20 is the calculated size, “(2 0 observed size.
- eBa is obtained by first having no annihilation at each. The diffraction pattern that determines the shape of the diffraction from this analysis. Find the parameter, and automatically perform this parameter e Ba for all possible and possible spaces.
- the R P value obtained from the eB analysis is low, that is, it may correspond to the actual condition, and it is a correct complement. (In that sense, rather than R P, rather the opposite or the name corresponds.)
- Table 4 shows an example of C () mari seantraquinone (C).
- process P4 determines the most probable space among the complements of the narrowed space as the correct answer, and roughly determines the positions and forces in the unit and the three-dimensional atomic array.
- the process of decision. That is, the basic structure is to determine the sequence of atoms or molecules within a unit once the space is determined. Since it reflects the sequence of the crystal children of the X data, determining the rough atomic arrangement that satisfies the relationship of the diffraction data establishes the basic structure.
- id G can be applied to the interpolating method for determining the molecule and its shape in the unit, and the basic structure can be determined from the powder diffraction data. I'm sorry.
- the intermodal term used here is to determine the atom and how many children are collected (the ball molecule) in the unit cell and (the ball), and the solution is given by the rotation in the part (). It is a method of determining the shape of the body. That is, as shown in 5 (a) to (C), Let the column of be represented by the atom, the (x) of () and the proper posture (8), and the internal .. .. .. Then, in Basic Process P, these parameters are determined by the interleaved method using the ibed GA. Of the decision-making parameters, 6 minutes, which is the force taken by the molecule in the unit, and internal rotation.
- the ipod G used in process P4 is basically the same as that used in the dense process P5 described above, and only the meaning of the optimization parameters and the various settings are different. is there. The details of the id G developed by them will be explained in later sections. (5) Densification process
- the structural densification is to minimize the optimization of the position of the child based on the fixed structure.
- the Reved method ReVed A Cy, 219696
- the position of the lid is measured every 0 °.
- the material structure determined from powder diffraction data and the diffraction data reached 98 degrees, and the difference in atomic arrangement was 0.00 degrees, enabling extremely precise structure determination. Moreover, it is possible to determine the structure of the substance with this degree, and it can be fully utilized for the development of new pharmaceutical products.
- the molecule in the structural densification process P5, the molecule is treated as a body, and the same basic ... Densify the lamella.
- the three-dimensional size lamella xs ys zs which indicates the size of the whole body, is also adopted in the lamella that is optimized and the density is optimized by the least-squares optimization.
- the crystal movement since it causes the crystal movement to a finite degree and contributes relatively to the dynamic diffraction tan, we also refined the movement of the whole body.
- the molecule treated as a body it is possible to increase the diffractive index with respect to the standard case.
- Process P to P5 is also in the form of data and lamogram programs by the optimized timing of multiple lamellas by the explicit G.
- the ipod G which is the core of the optimized lamegram of multiple lamellas by the yd G of this embodiment, is the same as the initial step S, the step S 03 step S 05. Mutation step S 07 The optimization step 9 and the like are repeated.
- this application when this application is referred to as a method, it is called, and when it is a program, it is referred to as a step. We will separate things into processes and steps.
- a set of symbols composing each individual is a lattice constant, which is (a b c p v), and its purpose is to search for a positive combination of lattice constants over a wide area.
- step S an initial (and algebraic) population of a certain number of fields with lattice constants distributed each time is generated. Then, in each generation, recording the generational population, recording step S 02, evaluation step () step S 3 step S 5, and stochastic mutation step S 7 optimization step S 09.
- the generation change group including
- the evaluation step () is a process of evaluating the neoplasm, which is the newly generated body after the generation of the progeny.
- the initial step S step S 03 mutation step It is emitted by the neoplasms generated in S n.
- step S n S selects this Popo number as a parent and crosses between these bodies in a predetermined direction to generate a new body. This is the process of generation.
- step S is a process of selecting a body to be retained in the next generation from the neoplasia produced in step S3 and the individual produced in the replication step S4 from the generations of the poppies, to become another individual. Is.
- the mutation step S 07 is executed at a predetermined rate by the preceding step S 0, and is a process of forcibly changing the symbols constituting the stochastically selected individual.
- step S 9 is also followed by the preceding step S n R, and in the part () of the stochastically selected part, an individual ( ) Is the process of optimizing the lamella of the child constant with respect to
- the number of times is about n times, and the number is limited to at most once in a given number of bodies that make up the substitute Popo.
- the generation is revised in the specified range within the specified number, and then the step S2 is returned to again as a substitute popo.
- the alternation is repeated.
- the generational change process is repeated many times, waiting for the occurrence of a sufficiently adaptable individual in the population as the generational changes are repeated, and making a decision that the answer is correct and converges to the best. Child constant An appropriate combination is searched for.
- the id G A determines the combination of the child constants (a b c p v) as described above, and the details are described below.
- the initial step S step S 03 and the mutation step S 07 optimization step S 09 include an evaluation step () for calculating the newly generated individual.
- the measured data which is referred to as a reference for adaptation, is the diffracted 29 data of the measured end-diffraction data position, as described above (2, 3). .
- the original X is obtained as data at scattered points with even or evenly spaced steps in diffraction 20. Therefore, in the constant value of 20, there is a minute deviation () of the origin near the origin (the center point), and X is a space of decomposition. It is not clear from these data alone.
- this shift is added to the multiple lamellas that are searched for in G in this embodiment, and the lamellas are (abc, p,). Y) In other words, it is only after searching for these lamellas that contain the deviation and correcting and deciding the deviations that accurate data can be tested for the first time.
- step S (9) a proper number of the first-generation population forming the early generation population, the lattice constant (a, bc, p) of the individual set by the user, and the origin deviation () are generated.
- the lattice constant (abcv) is subject to conditions such as the fact that it must form six bodies, the abc size of its children, and the size of atoms.
- a single a b c orientation is included, and the unit fits in a plane and is not a tetrahedron.
- the lattice is larger than the size of the atom and is generated in the ab c O ⁇ 25 range. Due to these limits, it is possible to generate a set of child constants (a b, c ⁇ v) that always represent 6 fields by numbers.
- a deviation range corresponding to the step (marriage) of the data point is set, and the lamella is generated in the radam within this range.
- upper and lower limits can be set for the lam (a b c p).
- ab c, a c b c ca, etc. can be controlled as required. Then, if the constituents and the product of the children from the children can be predicted, the (a X) lower bound (V) of the volume can be entered to find the () within the bounds of the upper bound (lower bound ()). It is possible to generate a set of lattice constants (abcp) to form.
- the individual has such a child constant (ab, c, p,) origin deviation (), and each individual has an diffraction step whose child constant was obtained in the evaluation step (). Will be evaluated.
- the data of the diffractive picture position (20. Diffraction extracted from experimental data Use the of the data (20.) of the table.
- step S it is possible to limit the bounds of the generated individual lamellas by the value of the match R. That is, when an individual corresponding to a larger lamella set by the coincidence R is generated, the body is broken and a new lamella corresponding to another lamella is generated again. Then, when individuals that satisfy various conditions set by the user are obtained, the first-generation population ends.
- R is the evaluation maximum value minimum calculated in 3 above among the individuals belonging to the respective generations.
- step S 03 the choice is used for the choice of the body.
- the selection is that if the individuals selected for the particular generation Popichodam are larger than the uniform number generated in the range 0, they are adopted as the field. On the contrary, if the value of each individual is larger than the above number, another individual is selected and the same operation is repeated, and this operation is continued until the selected body reaches a predetermined number.
- step S 03 there are several types of moduli, and the number of fields chosen for depends on the modulo. That is, it can be of the type that replaces the lamella, of the two types, or of the detype used in the real-valued G. This is 2 when the expression of the parent type is .2., So it is 2 so the number set by the user is 2, while it is 2 to b in the case of the bud type. .
- step S 03 special measures are taken to improve the lamellar ratio for the three organic crystals.
- the lattice constant lams (a, b, c) are not left as they are, but as shown in 20, the lamellas are formed in consideration of the inheritance according to the quality of the lamella.
- grouping preserves the faces of 6 parallel bodies. That is, the planes that are not parallel to the unit If it can be expressed as follows, divide these three lamellas into (abv) bcac) and divide them into three groups. Or divide the four sets of child constants (abc 0) into three groups, (b C) (ab) ac B).
- the GA asm improves the search for solutions by transmitting the body's genes to the body. Therefore, as shown in this example, if the shape and the diffracting device generate a body corresponding to 6 normal lines that are completely different from the body, the ratio of G is also found. It will be damaged. Child constant determination process P. For this reason, the grouping of lamellas is performed in the process.
- the saved gamma is stored and the other gamma is averaged from 2 to b individuals. Rows are generated by a uniform number. That is, the field lamella P is calculated from the field lamella P and the number based on the following equation 5.
- the individuals to be retained in the next generation are selected from the two individuals that are the total of the two newly generated children by the generation of the lamella. At that time, there are roughly two types of options.
- the individuals are selected by displacing them by a uniform number, and the mutations are suddenly performed on those bodies.
- the selected individual constant and the origin-based parameter are changed by random numbers.
- the lamella of (abc,) is selected for, the lambe of (abc 0) is selected for, and the value is replaced with the random number. .
- the displacement () of the origin is always replaced with a random number. Then, this work is returned to x individuals, and the individuals created by mutation are replaced with the individuals before the progeny Popo. Therefore, the generations have not changed in this work.
- the x of the mutant body is pre-determined by the user.
- step S 04 the individual population saves all the lamella evaluation values R and the next population in step S 05, and sends them to the next step S 05 without selection.
- the optimization step S 9 is a step for optimizing the value of the lamella (7 a b c Y) of 7 by the multiplicative method with the nonlinear reduction condition.
- individual individuals are selected and local optimization is performed for adaptation, and the conditions for this are in accordance with the conditions for generation described above.
- This method of selecting individual individuals as the target of local optimization is characteristic. Depending on the selection, contrary to common sense, it is selected from adaptive individuals. The reason is that, as mentioned above, individuals that are already highly adaptable It is less likely to fall into a pit during the lamellae of the population, and now the adapted individuals are more likely to have been previously locally optimized and expected to be locally optimized. is there.
- the optimization of multiple lamellas by the ibid GA of the present embodiment uses the program of the above-mentioned child constant determination process P used in the outline, as shown again. .
- step S the early generation population uses a random number to generate the structural lamellar formula corresponding to the individual set by the user. Then, the generated structural parameters
- the computer is calculated using the created structural model, lattice constant, space group, and previously obtained parameters. This value is evaluated by Rw () of the diffraction tan obtained in the experiment. That is, in the initial step S, the lamella of the generated individuals and the confidence R for them are calculated.
- step S 03 using the expression obtained by replacing the edge match R of 4 with the confidence R P as described above,
- Step S 05, step S 05, local optimization step S 09 And step S are processing steps in the same manner as the steps of the child constant determination process P. 6.
- the process constant determination process P of the structure was used to determine the Pd d) final sample (ab C p V) from the final sample of Pd d).
- the lattice constant determination process P using G which is the core of the light, determines the lattice constant determination compared to the lattice constant determination method using normal G, which does not have local optimization. A significant effect was confirmed in the rate and the number of cycles (alternating number) required for it.
- the number of cycles in G 5, 5, 0 in population, 50 in 50, x 500 mutations per mutation, 500 mutations per natural generation, specific generation alternation, local optimization at each generation ) 0 of the body, that is, local optimization after Popio s) was performed.
- this is the initial number
- the analysis is only successful in all cases, and the existing Pd md) example is used.
- the solution is obtained when the program cannot.
- G was not grouped, no solution could be obtained even with G.
- the success rate may decrease and the number of cycles required for convergence (marriage alternation number) may increase. .
- the lattice constant determination process P clearly obtains a better calculation result than the G standard program.
- the method of determining the structure is
- the ability to determine the substance structure from the radiation environment has been greatly improved by the method of constructing based on Ming-ray radiation data, etc., so that it can be used in fields such as substance measurement, drug development, technology, and surgery.
- the id G A which has the core technical features of the present application, can be used in a wider range of fields, as illustrated below.
- the optimization of multiple lamellas with the explicit id G and the data with lamellagrams and touching are not the only techniques to analyze the measured data as described above, but conversely the optimal optimization is performed. It can also be used for measurement technology.
- the problem in design is not the one that seeks the characteristics of the surrounding airflow when a given shape is placed in two dimensions, but it is The problem is how to design the shape.
- the technique of the present invention can bring about developments in the field of optimal measurement.
- the core iBD G A has the potential to reduce the computational load by optimizing the adjustment of a large number of lamellas regardless of whether they correspond to physics.
- the degree to which GA is exerted in the field of artificial (A) can be accelerated for the same reason, and the training time without bundle time can be shortened. There is a possibility that a new practical area will be opened.
- A may be an effective solution.
- fields of use include, for example, energy forecasting. That is, it may not be useful for a while to predict what will happen after a week, but it may be useful if it can be solved in time.
- Aid-A technique of Ming By applying the Aid-A technique of Ming, it is possible to exert a powerful wide-range power even within the vast lamellas of, so that the conventional technique can be used.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Crystallography & Structural Chemistry (AREA)
- Pathology (AREA)
- Physiology (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Analytical Chemistry (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Immunology (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
Abstract
本発明の中核は、遺伝的アルゴリズム(GA)において、広く分布した多くの世代で適応度が比較的低いごく少数の個体にのみ局所最適化操作を施すハイブリッドGA(HGA)である。本HGAは、多峰性の強い多次元パラメータ空間でも極めて強力な広域的探索能力を発揮するから、本発明によれば、X線回折環に含まれる僅かな情報からでも多数の構造パラメータを効率よく決定できる。その結果、単結晶なしでも粉末試料から複雑な物質構造を決定できるようになり、医薬や素材など多くの分野で新物質の開発が加速される。
Description
ハイプリッド G Aによる複数パラメータの最適化方法、
パターンマッチングによるデータ解析方法、
放射線回折データに基づく物質構造の推定方法、
ならびに関連するプログラム、 記録媒体および各種装置
明
技術分野 書
( 1 ) 物質構造決定
本出願は、 粉末試料に X線を照射して得られた回折環がもつ強度分布のピーク 位置デ^ "タに基づいて、 この試料を形成する物質の構造を同定しょうという、 発 明者らの研究から生まれた一連の発 を特許出願するものである。
それゆえ本発明は、 放射線回折により試料の物質構造を特定する 「物質構造決 定技術」 の分野に属する.。 より詳しくは、 例えぱ粉末試料に無射された X線等の 回折パターンを解析してて同試料の物質構造を推定する 「放射線回折データの解 析技術」 の分野に属する。
ふつう 「物質構造」 とは、 その物質の結晶構造と、 それに含まれる格子構造お よび分子構造との三者のうち、 少なくともいずれかを指す言葉である。 さらに物 質の 「結晶構造」 とは、 「格子構造」 (当該結晶の格子定数) と、 「分子構造」 (同結晶内における分子の配列) との両者を含む技術用語である。 ただし、 「物 質構造」 とは、 このような分子構造パラメータだけに限定されるものではなく、 電子密度分布パラメータや結晶学的構造パラメータなどを指すこともある。 また、 ここで言う 「構造決定」 とは、 このような物質構造のうちいずれかを可能な限り 正しく精密に推定することである。
すなわち本発明は、 単結晶試料ばかりではなく、 多数の微細な結晶粒からなる 粉末試料など、 その放射線回折パターンが回折環の強度分布データとしてしか得 られない試料物質についても、 その物質の結晶構造や分子構造を高精度で決定す
ることを可能にする技術である。 それゆえ本発明によれば、 ある程度以上の大き さを持つ単結晶を作ることが難しい物質の構造決定ができるようになるから、 未 知の分子構造をもつ医薬品や新素材などの構造決定に好適である。
( 2 ) ハイブリッド G A
本発明はまた、 ハイブリッド G Aによって多数のパラメータを最適化する 「パ ラメータ蕞適化」 ないし 「最適パラメータ探索」 の技術分野や'「パターンマッチ ングによるデータ解析」 の技術分野にも属する。
そして、 これら一連の本願発明の中核となる発明概念は、 遺伝的アルゴリズム (略称 「G Aj ) に特定の方式で局所最適化操作を組み込んでハイブリッド化す ることにより、 収束性を向上させたハイプリッド G Aそれ自体である。
なお、 局所最適化操作が組み込まれた G Aについては、 いくつかのバリエーシ ヨンがすでに公知であり、 それらについては、 以下の背景技術の項で公知文献を 挙げて説明する。 そして英語圏では、'このようなアルゴリズムを、 用不用説 唱 えた先達の名を冠して 「ラマルキアン G A」 と呼ぶことが多い。 一方、 日本では 同じものを 「'ハイブリッド G A」 と呼ぶことが多いので、 本明細書でもハイブリ ッド G Aの名称を使うことにした。 また、 必要に応じてこれを 「H G A」 と略称 してもよいものとする。
背景技術
1 . X線回折による物質構造決定技術の概況 ( 1 ) 直接法による構造決定
材料や医薬品などの研究開発において最も重要で基盤となる情報は、 その材料 の原子配列に関する情報である。 すなわち、 当該物質の分子内における立体的な 原子配列がどうなつているかが分かれば、 その物質の機能をある程度は予測する ことができるようになり、 種々の応用研究を進めていくことができる。
このような状況は、 その分野にかかわらず、 分子性の物質の研究開発において もほとんど変わるところがない。 すなわち、 分子を設計し、 新たに創生した時、 最初に求められるのは目的の分子ができたかどうかを判別する原子配列の決定 である。 ここで、 原子配列が決定されてしまえば、 目的としでいた分子ができた かどうかが確認されるだけでなく、 他にも重要な情報が得られる。 た えば、 互 いに隣り合う二つの原子を隔てる原子間距離から、 両原子の結合形態 (炭素原子 ならその結合状態が 2重結合か 1重結合か) や、 各原子のイオン価数など、 分子 の特性決定づける多くの情報を得ることができる。
さて、 このような原子配列を決定する方法として、 最も有力で直接な証拠を与 えられるのが X線回折法である。 すなわち、 他の構造測定手法には、 たとえば核 磁気共鳴 (NMR ) 法などがあるが、 これらの手法ではふつう状況証拠しか与え ることができない。 しかし、 これに比べて、 X線回折法によれば、 当該分子中の すべての原子の立体的な配列を十分な精度 (おおよそ 0 . O l n m以下) で決定 することができる。 一方、 無機材科に対しては原子を観測する手法として電子顕 微鏡観察があるが、 分子性の結晶は電子線に弱いので、.このような材料に対して は、 電子顕微鏡による原 "配列の観測は不可能である。 . '
現在、 一般的な X線回折分野の常識として、 分子性結晶の原子配列決定には、 単結晶試料が必要である。なぜならば、単結晶試料を生成することさえできれば、 タンパク質などの巨大分子を除いて、 大半の材料についてほぼ自動的に原子配列 (構造) を決定することができるからである。 このように結晶試料の X線回折に よる構造決定方法は、 1 9 8 5年にノーベル賞を受賞した J. Karle, H. A. Hauptmanによって開発された結晶構造を直接決定する方法であり、 直接法と呼ば れている。
そして、 X線装置技術の進歩と解析に用いるコンピュータの計算能力の進歩に より、 現在では回折装置と P C (パーソナルコンピュータ) 1台があれば構造が 決定できるシステムが構築され広く普及している。 国内外の大学では理工系学科 に少なくとも 1台は、 単結晶 X線回折装置が設置されているのが普通である。 ま た、 このような回折装置は、 医薬品関連企業や材料開発を行っている企業関係に も広く普及している。
( 2 ) 単結晶の生成という難関
ところで、 このような単結晶 X線回折による原子配列決定方法を実行するうえ で、 避けて通れない最大の難関ないし隘路 (ボトルネック) は、 単結晶試料を得 ることにある。 なぜならば、 単結晶試料として使用できるほどの大きさをもつ結 晶の生成は、 なかなか容易ではないことが多いからである。
すなわち、 自然界に存在する物質のなかで単結晶で存在するものは、 だいへん に稀であり、 ほとんど存在しないと言って良い。 仮に大きな単結晶が例外的に存 在したとしても、 それは自然界ではごく稀であるがゆえに高価な宝石であったり する。 また、 人工的に大型単結晶の作成が可能で実用化されている材料も、.半導 体材料 (たとえばシリコン) くらいしかない。 このよ に、 単結晶の作成とは、 通常では存在する状態ではない物質の状態を作り出すプロセスであるともいえ る。 一般に、 単結晶を作成するためには、 様々な結晶化条件で試料物質の結晶化 を試みる必 がある。 そして、 このプロセスにはかなりの年月と大量の試料 が 必要とされ、 膨大な労苦を費やすことになる。 例えば、 仮にある物質の構造決定 に十年間を要したという場合に、 そのうち八年間は X線回折に十分な大きさの単 結晶を作ることに費やされていたということも珍しくなかった。
このような事情から、 単結晶の生成に成功して実際に原子配列を決定すること ができるのは、 創生される多数の物質のうちほんの数。 /0程度にしか過ぎなレ、。 こうじて、 単結晶試料が生成できないために原子配列が決定できないことは、 分子性材料を用いた開発研究の大きな足かせとなっている。 たとえば医薬品など では、 所望の分子ができているかどうかが分からないせいで、 せっかく新物質を 開発しても結局は薬と.して使うことができないことも少なくなレ、。 また、 機能性 材料の場合にも、 電気伝導度などで興味深い特性を持った物質が創成できたとし ても、 その特性なり機能なりが、 どういった物質構造に起因しているかを知るこ とができない。
以上のように、 単結晶の試料物質を作れないので X線回折パターンによる直接 法で構造決定ができず、 物質設計のための情報が不足してしまっていた。 その結 果、 結局のところ場当たり的で試行錯誤が無駄に多い物質開発に終始せざるを得
なかったというのが、 今までの状況であった。
2 . 代表分野での現状
以上のような理由で、 粉末試料からその物質構造を決定する技術の開発は、 分 子性の材料を研究開発の対象とした極めて広い分野で切望されている。 このこと を具体的に理解していただけるように、 以下では医薬品開発の分野とナノテクノ 口ジー材 * 開発の分野とを例にとって、 背景技術の現状を説明する。 ( 1 ) 医薬品開発
一般的に言って、 医薬品 (ないし薬物) は粉末として用いられることが多いか ら、 医薬品の研究開発において本来必要とされるのは、 粉末状態での物質構造で ある。
ところが、 一般に有機分子から構成される薬の場合、 前述のように粉末では構 造を決められないため、 長期間を'かけ苦労して単結晶を作成して構造を決定して いる。 最近では、 安全性などの観点から、 物質構造を確認してからでなければ医 薬品として認可されない場合が多い。 すると、 せっかく薬効のある物質が発見さ れても、 その物質で大きな単結晶を作ることができないがために、 その立体的な 分子構造が解明できず、 それが故に医薬品として用いられていないという状況に 至ることも物質も少なくない。
そこで、 もしも粉末試料からその薬品の分子構造が決定できるようになれば、 新薬開発を飛躍的に進められることになる。 そればかりではなく、 医薬品開発の 分野では次のような利点も生じる可能性がある。
すなわち、 医薬品に用いられる有機分子は、 たとえ分子式や構造式の表記は同 じであっても、 分子中の原子の立体配列が異なっていたり、 結晶としては異なる 構造で存在したりするものが多い。 このように、 構造式の表記などは同じであつ ても結晶構造が異なることがある分子を、 医薬品の分野では 「結晶多形」 をもつ 分子と呼んでいる。
そして、 ある医薬品の分子が結晶多形である場合には、 同じ構造式をもつ分子 からなる粉末であっても、 結晶構造が異なっているために、 融点や密度、 熱力学
的安定性、 溶媒に対する溶解度などが異なることがある。 それゆえ、 結晶多形の うち目的の相とは別の相を用いてしまうと、 意に反して水に溶けず薬効を示さな かったりするなど、 不都合を生じる可能性がある。 それゆえ、 この結晶多形とい う性質は、 医薬品開発の分野では重大な問題である。
そればかりではなく、 錠剤の作成など、 医薬品を製品化するプロセスでも、 粉 末試料が圧縮されたり、 熱処理されたりことがあるので、 分子性の結晶は、 これ らのプロ スでも構造が変わる可能性がある。 これらのプロセス中での構造の変 化を追跡するには粉末試料からの構造決定が必要であるが、 現状では粉末試料か ら構造を決定できる手法がないため行われていない。
以上のように、 粉末試料から医薬品の構造を決定することができるようになれ ば、 医薬品開発が飛躍的に加速され、 最終的には世のすべて人々の健康の増進に 繋がるのだが、 その手段として今までは実用に耐えるものがなかった。
( 2 ) ナノテク材料開発 . ' ' 有機伝導体やフラーレン関連物質など分子性材料は、 十年先程度の近未来であ つてもナノテクノロジーの基幹物質として期待されており、 国内外の多数の研究 者によって研究が進められている。 そして、 これらの研究でも X線回折による構 造情報は、 材料開発の初期段階で最も重要である。
たとえば、 現在ではボーリングのボール、 テニスラケット、 ゴルフクラブのへ ッド、 化粧品など 1 0品目を超える製品に利用されるようになった炭素のサッカ 一ボール型分子フラーレンも、 発見当初の研究では、 構造の決定が最も重要なテ 一マであった。 すなわち、 構造が決定された後に、 ようやく超伝導体や磁性体な ど機能性材料の生成過樺や様々な特性が、 構造に基づき理解され、 応用研究が進 められていった。 そして現在では、 すでに年産数十トン程度の生産能力を持つフ ラーレン生成用の商用プラントが整備されており、 さらに多くの製品への利用が 始まっている。
さて、 フラーレンに限らず、 分子性の材料であれば結晶の構成単位が分子であ るので、 シリコンなどの無機材料と比較して生成可能な物質の種類は膨大な数に 上る。 それゆえ、 研究者らによりおびただしい数の新物質が合成されている力
その構造決定には単結晶試料が必要とされていたがゆえに、 未だに構造が明らか にされていない物質が多い。 そして前述のように、 構造が明らかにならないこと 自体が、 新物質生成の研究を推進するうえでの足かせになっている。
たとえば、 新物質の物性測定などを先に進め、 苦労の末ようやく単結晶ができ た時点でその物質構造が決定されてみれば、 予測していた分子とは違っていたと 力、 別の方法で生成された分子と同じだったとかということは、 よくあることで ある。 し力 ^し、 そういうことがあると、 それまでの研究に投下された資源は、 ほ とんどが無駄になってしまうわけである。
したがって、 物質生成の初期であって単結晶が作れなレ、段階であっても、 その 粉末試料から構造決定ができる技術があれば、 これらの研究を飛躍的に加速する ことができる。 それゆえ、 粉末試料からの構造決定技術は、 分子材料を用いたナ ノテクノロジ一の分野においても、 その基盤技術となる可能性を持っているのだ が、 残念ながらその手段がなかったという実情が本発明の背景にある。
3 . 粉末試料による構造決定が難しい理由
( 1 ) 概要
以上の説明では、 もし粉末試料からの物質構造の決定技術があれば、 医薬品や 材料の開発に決定的な役割を果たすであろうことは明白でありながら、 それが実 現されていないということ、を述べてきた。 では、 粉末試料の構造決定がこれだけ 切望されている技術でありながら今まで実用化されていなかったのは何故であ る力、 その理由の一端をここで説明しておく。
その理由を簡明に言うならば、 あまりにも少ない情報量に基づいて、.あまりに も多くの自由度を持つ物理量をしかも精密に求めることが要求されたので、 今ま での最適パラメータ探索技術の手に余ったからである。
( 2 ) 回折環の情報量
先ず、 粉末試料から得られた X線回折環に含まれる情報量は、 極めてわずかで しかないことから説明する。
仮に、 当該物質からある程度大きな (例えばサブミ リメートル程度の) 結晶を 生成することができたものとし、 この結晶を試料として X線回折試験装置にかけ た場合を考えてみょう。 すると、 図 1 ( a ) に示すように、 その結晶に入射した X線は回折し、 回折強度が格子状 (ないし碁盤目状) に分布した回折パターンを 生じる。
逆に、 当該物質で回折試験に必要な大きさの結晶を作ることができず、 仕方な しに当該物質の粉末試料を X線回折試験装置にかけた場合を考えてみょう。 する と、 図 1 ( b j に示すように、 その粉末試料に入射した X線は同軸の円錐状に回 折し、 回折強度が同心円状に分布した回折パターン (回折環) を生じる。
ここで、 図 1 ( a ) の二次元的な回折パターンと図 1 ( b ) の回折環とを比較 してみると、 回折環の方は回折角の大きさに応じ半径方向に沿って回折強度が一 次元的に分布した強度分布データしか得られないことがわかる。 それゆえ、 粉末 試料の X線回折である回折環からもたらされる情報量は、 単結晶試料から得られ た二次元的な回折パターンがもつ情報量に比べてずっと少ない。 ' そればかりではなく、 試料結晶の格子面 (h k 1 ) の向きによって X線回折の 方向および回折角が異なってくるから、 粉末試料から得.られた回折環でほ、 その 粉末試料に含まれている多数の微細な結晶が生じる回折ピークが互いに重複し ていることが多い。 すると、 互いに重なったピークを分離することができなくな り、 回折環に含まれる情報はいよいよ少なくなつてしまう。 そして、 粉末試料の 回折強度分布では、 あまりに広い角度範囲に小数のピークが分散しているので、 多くの場合、 回折データは結局のところ、 ピーク位置とピーク強度との対を示す 数値データに落とし込まれる。
また、 定量的に説明すると、 現行の X線回折装置ないしその X線検出器から求 めることができる精度は、 回折角度 2 0にしておおよそ 0 . 1〜0 . 0 1 ° 程度 の桁にある。 一方、 回折角度 2 0の範囲は 1 5 0 ° くらいまでだから、 その解像 度ないし分解能は、 階調数にして 1 0の 3〜4乗程度でしかない。 なお、 回折環 における X線強度の階調数 (つまり明暗の段階数) は、 1 0の 3〜6乗程度であ る。
( 3 ) 格子定数を決定したい場合
一方、 試料物質の結晶が持つ格子定数を決定したい場合には、 以上のように回 折環に含まれる情報が極めて少ないのに対し、 格子定数の決定に要求される精度 は極めて高く、 その解空間が極めて広いことが困難さの原因となっていた。
すなわち、 粉末試料の回折環から 1次元の強度分布データに基づいて、 六つ一 組の格子定数 (a , b, c , α , β , y ) と原点移動パラメータ (t ) とを決定 する際には、 格子定数のそれぞれの決定に要求される精度が非常に高いことが問 題になる。 それに比べ、 多くの場合、 格子定数を決めるべき試料物質の標準的な a , b , cの値は 1 0〜 3 O A程度であるのに対し、 れらの決定に要求される 精度は 0 . 0 1〜0 . 0 0 1 Α程度とかなり細力、い。 それゆえ、 当該パラメータ ( a , b, c ) の探索空間での決定精度は、 階調 (値の取りうる幅に対する分解 能) にして、 各パラメータにっき 1 0の 5〜6乗程度の桁で要求される。
したがって、 決定すべき構造パラメータが格子定数の場合に、 その要求精度を 階調で表すと、 a , b , cがそれぞれ 1 0の 5〜6乗程度の桁に、 α, ]3 , が それぞれ 1 0の 4〜5程度め桁になり、 いずれにしろ非常に大きいことになる。 それに加えて、 原点の位置ずれに関するパラメータ tも, 1 0の 2〜3乗程度の 桁をもつ階調で決定しなければならない。 .
その結果、 探索すべき複数パラメータが解空間で取り うる場合の数は 1 0の 2 9〜3 6乗程度と、 極めて大きいものになっているにもかかわらず、 前述のよう に回折環のもつわずかな情 量からこれを決定しなければならない。 格子定数の 決定においては決定したいパラメータ数がわずか 6個であっても、 回折環に基づ いてこれを決定することの難しさは実にここにある。
( 4 ) 分子の結晶構造を決定したい場合
この場合には、 分子を構成する原子の数が多くなり、 分子内での回転可能な結 合部分が増えていくにつれて、分子内回転の自由度が増していく。このことから、 複雑な分子であれば、 その分子内で各原子がどのように三次元配置されているか を示す結晶構造を決定することは、 多くの自由度をもつ多次元の解空間内で解を 探索することになる。 それゆえ、 分子構造の自由度が増えるだけ (つまり決定す
べきパラメータの数が増えるだけ) 、 指数関数的に構造決定が困難になっていく ことは明らかである。
( 5 ) 遺伝的アルゴリズム (G A) の適用
先ほど、 解空間の取りうる場合の数は極めて大きいことを説明したが、 その数 を控えめに見積もって 1 0の 2 0乗程度とし、 使用可能なコンピュータで毎秒 1 万回の試行演算ができたと仮定してみょう。 すると、 絨毯爆撃方式の全探索を行 うには 3億年間程度かかることになり、 これは明らかに受け入れがたい計算時間 である。
そこで、 もう少し賢明に最適パラメータの探索を行い、 物質構造の決定に要す る計算時間を短縮することができるように、 様々な試みがなされている。 その中 で、 人工知能の分野で研究が盛んにされていた G A (遺伝的アルゴリズム) を用 いる試みもなされており、 本発明はこのような背景の中で行われた研究から生ま れてきたものである。 ' ' 次項には、 発明者らが調査できた範囲で本発明に関連があろうかと思われる公 知文献を列挙し、 ごく簡単に解説レた。 これらの中には、 物質構造の決定方法に 関する文献は'かりではなく、 G Aを改良したハイプリッド G Aに関する文献もあ る。
4 . 公知文献の簡単な説明.
( 1 ) 特許文献
•特許文献 1
この文献には、 所定の空間群に属する斜方晶系のタンパク結晶の一種について、 液滴蒸気拡散法によって所定の大きさの結晶を成長させ、 単結晶試料の X線回折 により複合同位体置換法を用いて三次元構造決定を行った旨が記載されている (第 0 0 1 0段落〜第 0 0 1 1段落) 。 この技術では、 X線回折試験に供するこ とができるだけの大きさに単結晶試料を成長させており、 回折環データの解析に よる物質構造決定は行われていない。
'特許文献 2
この文献には、 X線などを試料に照射して、 薄膜構造解析、 単結晶構造解析や 粉末構造解析などの物質構造解析を行う技術が開示されている。 この技術の特徴 は、 構造パラメータの決定を高精度で短時間に行えるように、 普通の G A (遺伝 的アルゴリズム) またはその改良版である μ G Aで最良解を探索した後、 その最 良解 (適応度最高の個体に相当) に局所最適化を施していることである (同文献 の図 1参照) 。 なお、 この技術で用いる G Aや μ G Aでは、 適応度が高いエリー ト個体は次世^;にそのまま残し、 他の個体を親にして交叉を行っている (同文献 の第 0 0 1 8段落および図 2参照) 。
この技術では、 G Aないし G Aによる最適パラメータ探索が、 その最良解を 正解の近傍に収束させるまで待たなければならないが、 そこまで待てば構造パラ メータの決定を高精度化することができる。 それゆえ、 この技術によれば、 単な る G Aや μ G Αに比べて構造パラメータの決定に要する計算時間を短縮するこ とに、 ある程度の効果を見込むことができる。 ' しかし、 G A探索によってその最良解が正解の近傍に至るまでは局所最適化を かけても無駄であるから、 最良解が正解の近傍に至ったと確信できるまでは待た なければならず、 計算時間の短縮効果は限定的でしかない。
すなわち、 基本的に言ってこの技術は、 G Aや μ G Aで行う広域探索の:^終段 階でしか局所最適化をかけることができず、 個体の進化に方向性を与えるもので はない。 そうではなく、 この技術は、 G Αや G Αによる確率的な広域探索では 難しレ、最後の詰めを、 確定的な操作であ 局所最適化によつて加速するに過ぎな い。 そういう意味で、 この技術は英語圏でいう〃 Lamarckian GA〃 (日本語表記 では 「ラマルキアン G A」 ) とは、 いくぶん主旨が異なるようである。
•特許文献 3
この文献には、 試料ホルダとその周辺部とに工夫を加えて、 散乱 X線による影 響を低減した X線回折計測装置が開示されている。
•特許文献 4
この文献には、 X線や放射光による粉末回折データの測定において空間分解能 を上げるために、 検出器をそのピクセル間隔よりも細かく移動させ、 ピクセル間
を補間するデータを測定する技術が開示されている。 この技術は、 一次元の検出 器にも二次元の検出器にも適用可能である。
•特許文献 5
この文献には、 X線回折試験装置において、 粉末試料を収容したキヤビラリ一 が細かったり、 試料自体が細い線状であったりする場合にも、 小さな試料を取り 付ける際の作業が容易なる工夫がされた試料ホルダが開示されている。
•特許文献 6 '
この文献には、 プロテインキナーゼの突然変異体を結晶化させてその構造を決 定する方法とその結果とが開示きれている。
•特許文献 7
この文献には、 最適化問題に遺伝的アルゴリズムを適用するにあたって、 ポピ ユレーシヨンの多様性を維持する工夫が提案されている。 その工夫の特徴は、 ポ ピユレーシヨンをいくつかの 「島」 と呼ばれる集団に分けて島の間で個体を交換 したり、 「タワー」 と呼ばれる島の階層構造を導入したりすることのようである。 そして、 同文献の 「発明の名称」 には、 その冒頭に 「ハイプリッド型遺伝的ァ ルゴリズム j .という文言があるが、 そのハイブリッド型遣伝的アルゴリズムとは どのようなものであるのかは明記されていないようである。 すなわち、 「既存型 アルゴリズムと組み合わされた遺伝的アルゴリズム」 (同文献の請求項.1および 第 0 0 6 3段落) という程度の説明はあるが、 これでは具体性を欠いている。 さ らに、 「この最適化問題を解くために高速な既存型アル.ゴリズムがあると仮定す る。 ここで, 既存型アルゴリズムとは, ヒューリスティックな解法に基づくアル ゴリズムである。 」 (第 0 0 0 6段落) とあっては、 同文献の記載は仮定の話な のかと読者は思わずにいられない。 そればかりではなく、 同文献では具体的な数 値例は一例も開示されておらず、 「実施例」 の項にある記載内容はむしろ 「産業 上の利用可能性」 の項に記載すべき内容である。
それゆえ、 同文献では所期の課題を解決することができているのかという疑問 と、同文献は発明として完成されているのかという疑問とが払拭されない。また、 単に適応度の高い解を探すことが目的である場合ではなく、 X線回折による物質 構造推定のように単一の正解が存在するデータ解析に適用することが目的であ
る場合には 実用性があるのか否かも疑問である。 .
.特許文献 8
この文献には、 遺伝的アルゴリズムを用いてパラメータの最適化ないし最適パ ラメータの探索を行うにあたり、 遺伝的アルゴリズムの交叉過程にパラメータの 連続性を考慮した工夫を取り入れた技術が開示されている。
すなわち、 同文献では、 その第 0 0 4 1段落に記載されているように、 交叉の 際に両親として選択された二つの親個体について、 先ずそのパラメータ空間にお ける中点を求め、 次にその中点を中' とする正規分布などの連続的な確率分布に 従って二つの子個体を生成する。 この際、 同文献の図 3を参照して第 0 0 4 4段 落に記載があるように、 正規分布の標準偏差は、 両親となる親個体 1, 2間の距 離や、 両癍を結ぶ直線と第三の親個体 3との距離に比例して設定される。 その結 果、 パラメータ空間で互いに近傍にある両親の個体は遺伝子空間でも互いに近傍 にある.ことが認識されて交叉されるから、 要するに親個体に似た子個体が生まれ るようになる。 すると、 探索所期にはふつう両親の間の距離が互いに遠いので比 較的広い範囲で探索が行われ、 探索の終盤では両親が互いに近接していることが 多いので局所的な探索が行われる。.
また、 同文献の第 0 0 4 6段落には、 突然変異は子個体の遺伝子に正規乱数を 加算する操作として、 突然変異に局所的な探索を担当させることにより、 探索終 盤を効率よくすることができる旨の記載がある。 さらに、 同文献の第 0 0 5 8段 落には、 探索の終盤で局所ピークに効率よく到達するために最急降下法などの局 所的探索手法を組み合わせても良い旨の'記載がある。
し力 しながら、 同文献ではその第 0 0 1 0段落で初期収束を問題視していなが ら、 十分に広域的な探索が行われうるのかは疑問である。 なぜならば、 交叉では 親個体に似た子個体しか生まれず、 突然変異で生成される新たな個体の範囲も正 規分布で規制されるわけだから、 初期世代において親個体の分布が偏っていれば、 そのまま初期収束してしまうように推定されるからである。
また、 前述のようにその第 0 0 5 8段落には局所的探索手法を組み合わせる旨 の記載があるが、 その組合せ方は 「遺伝的アルゴリズムによってパラメータを最 適化した後に」 ということなので、 前述の特許文献 2とおおむね同様であろうと
想像される。' これに関しては、 その 「発明の効果」 の項のうち第 0 1 4 3段落に も、 「前記遺伝的アルゴリズムを用いて最適化したパラメータに対して、 局所的 探索手法による最適化を行うことにより」 との記載がある。
なお、 同文献では実施例 1の変形例として 「地域的な小集団」 という概念を導 入し、 その小集団内で遺伝子操作を行う旨が、 第 0 0 6 2段落および第 0 0 6 3 段落に記載されている。 しカゝし、 これは一つの村の中で結婚を繰り返すようなも のだから、 '遺伝子の多様性を求める方向とは全く逆であり、 同文献で問題視して いた初期収束を解決する作用があるものとは考え難い。
( 2 ) 非特許文献
非特許文献の紹介にあたっては、 G Aを用いて広域的探索を行う技術に関する 文献から先ず解説する。
•非特許文献 1 ·
この文献には、 多峰性の著しい (つまり落とし穴の多い) 大域的最適化の問題 である板取り問題の解法として、 G Aに局所最適化を組み合わせたハイプリッド G Aの一種が開示されている (1節末尾) 。 このハイブリッド G Aは、 準ニュー トン法による局所最適化操作を G Aの評価過程に組み込んだものである (同文献 の 4節冒頭および図 4参照) 。
そして、 この組み込み方の特徴は、 同文献の図 9および 4 . 8節を参照する限 り、各個体に対して(あるいは交叉や突然変異で生じた新生個体の全てに対して) 局所最適化操作を施すもののようである。,
なお、 その G Aの選択過程 (淘汰過程) の前処理として、 σ—切り捨て (適応 度による足切り) 処理と、 個体の多様性を維持するために適応度に对する線形ス ケーリング処理とが施されている。 そして、 選択過程では、 適応度の高さに応じ た数の個体が親個体に選択される期待値戦略と、 最も高い適応度を持つ個体が生 き残るエリート保存戦略とが採られている。
その結果、 対象がかなり複雑な問題であるにも拘わらず、 この解法でわずか 3 0〜4 0世代程度の間に収束をみるという成果を出している (同文献の図 7参 照)。 しかしながら、 その 4 0世代にかかる計算時間は、 2 8 . 5 Μ I P S , 4 .
2 M f 1 o p sのワークステーションを用いても、 約 9 0時間すなわち 4日間近 くとなっている (同文献の 5節末尾参照) 。
•非特許文献 2
この文献で開示されている技術内容は、 一読したところ前述の非特許文献 1と おおむね同一のようである。
•非特許文献 3
この文献には、 タンパク質立体構造予測問題を含む大規模な広域探索 (ないし 広域最適化) 問題に適用するために、 G Aを用いた探索手法 (広域最適化手法) を分散して並列処理する方法が開示されている。 その方法としては、 分散 G A , 拡張分散 G A,分散確率モデル G A,近傍培養型 G A及び適応的重み付け G Aと、 これらを互いに組み合わせたハイブリッド手法とが紹介されている。 ただし、 こ こでいうハイブリッド手法とは、 上記の各種 G Aをどう組み合わせるかといった ことであり、 局所最適化操作を G Aに組み込むことではないようである。
•非特許文献 4 ' ノ この文献には、 粉末試料の X線回折データを解析して同試料の物質構造を決定 する方法について、 G A適用の実際を含めて実に良くまとめられており、 同文献 を読めばその執筆当時 ( 1 9 9 7年) までの背景技術がよく分かる。
この文献の導入部には、 細かな粉末状の試料に X線を照射して得られた回折環 データに基づいて、 その資料物質の結晶構造を求めようとしても、 強度ピークの 重なり (ピーク 'オーバーラップ) が大きいので、 伝統的な方法によっては難し い旨が明記されている。 そして同文献の丰旨は、 それがゆえに回折環のデータ解 析に G Aを用いることが研究されており、 著者らは G Aの適用にあたって何某か の工夫を加え、 すでに構造が決定されている物質の粉末試料 X線回折データに適 用してみたということである。
し力、し、 同文献には局所最適化操作を G Aに導入したハイプリッド G Aについ ては特に言及はないので、 結晶構造の特定にあたり決定すべきパラメータの自由 度や精密さが増していくと、 計算時間が爆発的に増大してしまう可能性が高い。
•非特許文献 5
この文献では、 粉末試料の X線回折データを解析して物質構造を決定する新手
法としてラマルキアン G A (すなわちハイブリッド G A) が提案され、 ごく少な い世代交代の間に構造決定がなされる演算例も提示されている。 し力、し、 同文献 で提案されている技術では交叉で生じた子個体と突然変異で生じた新個体との 全てに局所最適化を施しているので、 世代交代の数は少なくても各世代での演算 量が膨大なものとなる。 その結果、 同文献の技術を用いても、 物質構造決定に要 する計算時間の短縮効果は限定されたものにしかならないであろう。
•非特許文献 6
この文献では、 粉末試料の X線回折データから、 前述のように物質構造 (すな わち分子内の原子配置) を決定するのではなく、 試料物質の結晶格子定数を求め る手法に G Aを用いることが提案されており、 実際の回折環データを解析例が開 示されている。 同文献には格子定数決定の困難さとその原因とが整理されて説明 されているが、 広域的なパラメータ探索に使用されている G Aはおおむね公知の ものである。
•非特許文献 7 . 1 ノ この文献は、 G Aの交叉における B L X—α法を説明するための資料として参 照した。 すなわち、 G Aにおける交差過程では、 両親となる二つの個体がもつ遺 伝子パラメータに対して最適化すベきパラメータ空間中で適度な範囲で拡がり を持たせる手法がある。 この手法は、 ブレンド ' クロスオーバー blend crossover 〃と呼ばれ、 適正な拡がりを設定するために新たなパラメータ. αを導 入するので 「B L X— c」 と簡素に記されることが多い。 なお、 パラメータでの 値が例えば 0 . 5に設定されている場合 は、 B L X— 0 . 5と表現される。
•非特許文献 8〜非特許文献 1 0
結晶構造を直接的に決定する技術に関する研究の歴史は古く、 このような方法 に関する文献としては、 代表的なところで非特許文献 8〜非特許文献 1 0などを 挙げることができる。 すなわち、 非特許文献 8には原理的な数式の導出が開示さ れており、 非特許文献 9には数式を解く際の有力な関係式が開示されている。 ま た、 非特許文献 1 0には、 数式の結晶学的取り扱いがまとめられている。
( 3 ) 直近の従来技術
何らかの形で局所最適化を G Aに組み込んだハイプリッド G Aに関する記載 があるものは、 以上の公知文献のうち特許文献 2および非特許文献 1 , 2, 5く らいなものである。 それゆえ、 これら 4本の文献が本発明に対して直近の従来技 術に当たるものと、 発明者らは認識している。
そこで、 本明細書中では、 G Aに局所最適化を組み合わせた広域最適化に関す る従来技術を、 特許文献 2と非特許文献 1, 2, 5との二つの系統に分類して論 ずることにする。 すなわち、 特許文献 2に開示されているように、 G Aによるパ ラメータ空間の広域的探索を行った後、 最終世代に属するポピュレーシヨンのう ち適応度最高の個体にだけ局所最適化を施す広域最適化技術をもって、 「従来技 術 1」 (図 2 (a) 参照) と称することにする。 一方、 非特許文献 1, 2, 5に 開示されているように、 G Aで生じた新生個体の全てに局所最適化をかけて広域 探索を行おうとする所謂ラマルキアン GAのことを、 「従来技術 2」 (図 2 (b) 参照) と称すること-にする。
(4.) 公知文献リスト . .'
[特許文献 1] 特開 2000_ 86696号公報 梶昭、 アンダース ' リル ジャス 「 · · · タンパクの結晶及び該結晶から得られる三次元構造情報に基づ くラショナルドラグデザィン.への応用」
[特許文献 2] 特開 2.001—83 106号公報 ァレキサンダー · ゥリャ ネンコフ、 原田仁平 「物質構造解析方法およびその装置」
[特許文献 3] 特開 2002— 71 589号公報 西堀英治、高田昌榭 「X 線回折計測装置」
[特許文献 4] 特開 2003— 149 1 80号公報 高田昌樹、 西堀英治、 坂田誠、 原田仁平 「 · · ·粉末 X線回折データ測定方法」
[特許文献 5] 特開 2004— 37345号公報 原田仁平、 西堀英治、 涌 井義一、 熊揮克芳、 鷲見高雄、 小塚基榭、 高田昌樹、 坂田誠 「試料ホルダ及び X線装置」
[特許文献 6] 特表 2005— 500844号公報 ノバルテイス ' · · ノく ィオメディカル · リサーチ社 (スイス) 出願 「キナーゼ結晶構造ならびにキナ
—ゼ活性化のための · · ·」
[特許文献 7 ] 特開 2 0 0 1— 1 1 7 9 0 1号公報 笹川文義、品川明雄(出 願人:富士通株式会社) 「ハイプリッド型遺伝的アルゴリズムの島モデルによる' 最適化問題処理方法おょぴその処理プログラム」
[特許文献 8 ] 特開 2 0 0 3 _ 2 8 8 5 7 9号公報 村川正宏、镯口哲也(出 願人 :産業技術総合研究所) 「最適フィッティングパラメータ決定方法およ び . . .」'
. [非特許文献 1 ] 藤田喜久雄、 赤木新介、 廣川敬康 「遺伝的アルゴリズム と極小探索アルゴリズムとのハイブリ ッ ド化による板取り問題の一解法」 〃 Approach for Optimal Nesting Using Generic Algorithm and Loca丄 Minimization Algorithm" 日本機械学会論文集 (C編) 第 5 9卷第 5 6 4号 (1 9 9 3年) 2 5 7 6— 2 5 8 3頁 論文 N o . 9 2— 1 8 7 5
[非特許文献 2」· Kikuo Fujita, Shinsuke Akagi and Noriyasu Hirokawa Hybrid Approach for Optimal Nesting Using a Generic Algorithm and a Local Minimization Algorithm", Proceedings the 1993 ASME Design Automation Conference, DE_Vol. 65 - 1, (Sept. 1993) , pp. 477-484, Albuquerque, New Mexico, U. S. A.
[非特許文献 3 ] 廣安知之 「進化的手法による知的最適化とその並列化」 Development and Parall ization of Intel ι gent Optimization by Evolutionary Computation" 同志社大学 学術フロンティア 「知能科学とその応用」 に関す るシンポジウム一 A F I I S S YM P O S I UM 2 0 0 1 ( 2 0 0 2年)
[非特許文献 4 ] K. HARRIS, R. JH0NST0N and B. KARIUKI : Actra Crryst. (1998) . A54, 632-645, " The Generic Algorithm: Foundation and Appl ications in Strunture Solution from Powder Diffraction Data
[非特許文献 5 ] G. Turner, E. Tedesco, K. Harris, R. Jhonston and B. Kariuki : Chemical Physics Letters 321 (2000) 183 - 190, " Implementation of Lamarck i an concepts in a Genetic Algorithm for strunture solution from powder diffraction data "
[非特許文献 6 ] B. Kuriuki, S. Belmonte, M. McMahon, R. Jhonston, K.
Harris and R. Nelmes : Journal of Syncrotron Radiation (1999) 6, 87 - 92, " A new approach for indexing powder diffraction data based on whole-profi le fitting and global optimization using a generic algorithm "
[非特許文献 7 ] L. J. Eshelman and J. D. Schaffer: " Real-Coded Genetic Algorithm and Interval Schemata ", Foundation of Generic Algori thm 2, ppl87-202 (1993)
[非特許文献 8 ] D. Harker and J. S. Kasper : Acta Crist. 1 (1948) 70. , . Phases of Fourier Coefficients directly from Cristal Dif traction Data " [非特許文献 9 ] D. Sayre: Acta Cryst. 5 (1952) 60., " The Squaring Method : a New Method for Phase Determination "
[非特許文献 1 0 ] W. COCHRAN : Acta. Cryst. 8 (1955) 473. , " Raration between the Phases of Structures
発明の開示
発明が解決しようとする課題 (背景技術の不都合)
前述のように、 従来の X線回折による 接法では、 ある程度の大きさ (例えば 直径 0 . 数 mm程度) にまで単結晶を成長させることができない限り、 実質的に 言って物質構造を決定することができなかった。
しかしながら、 単結晶が得られない段階の新物質であっても、 粉末なら得られ るという場合は非常に多い。 表現を変えて言うと、 物質の創生間もない初期段階 では、 当該物質の粉末しか得られない場合がほとんどである。 それゆえ、 もしも この時点で物質の構造を決定することができれば、 目的とした物質ができている か否かが迅速に判断できるようになる。 そして、 物質構造が明らかになればその 機能特性の理解も進むため、 構造に基づく物質設計が推し進められることとなる。
(本発明の課題)
そこで本発明は、、単結晶ではなく粉末状等の試料物質に放射線を照射して得た 回折環の実測データからでも、 現実的な範囲の計算負荷で当該試料の物質構造を 高精度で決定できるようにする手段を提供することを解決すべき課題とする。 す なわち本発明の課題は、 多くの新物質のように、 ある程度大きな単結晶を作るこ とが難しい物質であっても、 例えばその粉末試料から得た X線回折環の強度分布, データから、 その結晶構造や分子配置などの構造パラメータを決定することがで きるようにすることである。
このような課題の解決手段として、 より具体的には、 方法発明としての 「放射 線回折データに基づく物質構造の推定方法」 と、 そのゾフトウエア関連発明とし ての 「物質構造推定プログラム」 及びその 「記録媒体」 と、 それらに関連した各 種の装置発明とを、 本発明は提供するものである。
そしてこの中核技術として、 G Aの探索速度を加速して収束時間を短縮し、'従 来よりも多数のパラメータを精密かつ効率良く最適化または特定ないし推定す ることを、 現実的なコス小範囲で可能にする手段を提供することをも、 本発明は 解決すべき課題としている。 そして、 より.高速なパターンマッチングを行い、 情 報量が少ない実測データに基づきながら、 従来よりも多数のパラメータを精密か つ効率良く最適化ないし推定することができる手段を提供することも、 本発明の 解決すべき課題である。
より具体的には、 方法発明としての 「ハイブリッド G Aによる複数パラメ一タ の最適化方法」 及び 「パターンマッチングによるデータ解析方法」 を本発明は提 供する。 併せて、 そのソフトウェア関連発明である 「最適パラメータ探索プログ ラム」 やその 「記録媒体」 をも提供する。
課題を解決するための手段 [発明の経緯]
本願発明の発明者らは、 シンクロ トロン放射光設備 「S P r i n g— 8」 (固 有名詞) などの X線回折測定装置を用いて、 X線を始めとする各種放射線を試料 物質に照射してその回折パターンを測定し、 当該物質の構造解析を行ってきた (例:特許文献 3 , 4 , 5 ) 。 そして、 すでに背景技術の項や課題の項でも述べ たように、 粉末試料の放射線回折データ (回折環の実測データ) に基づく物質構 造決定の必要性を痛感していた。
そこで、 '結晶の格子定数や分子の立体構造などの構造パラメ タの決定に適し た強力な広域 ¾適化方法 (大域的最適化方法ともいう) と、 それを実現するソフ トウエアとを開発し、 回折環から物質構造を決定できるようにすベく努力を続け てきた。 その結果、 僥倖にも恵まれて、 以下のような発明に一応の完成をみたの で、 ここにその一部を出願するに至った。
なお、 本発明の適用は、 S P r i n g— 8 (固有名詞) など巨大設備での測定 データに限られるものではなく、 企業や大学の研究室にあるような小規模な X線 回折測定装置等で得られた測定データに対しても可能である。 '
[出願の単一性]
本願発明の中核となる部分は、 技術分野の項で触れたように、 G A (遺伝的ァ ルゴリズム) に特定の方式で局所最適化操作を組み込んだ 「ハイブリッド G A」 それ自体である。 すなわち、 本願発明は、.このハイブリッド G Aを実行して複数 パラメータを最適化する方法とそのプログラムとを提供し、 これを利用して構造 パラメータを多峰性の多次元パラメータ罕間中で広域的に十分に最適化し、 もつ て回折環などの放射線回折データから物質構造を十分な確度で推定 (すなわち決 定) する技術を提供する。
したがって、 本項で解決手段として列挙される本願の各発明は、 以下の名称で 呼ばれるが、 いずれもこの中核的な単一の発明概念 (すなわち 「ハイブリッド G AJ の利用) をもって貫かれており、 同一の特別な技術的特徴を共通に有してい る。
( 1 ) 方法発明
• 「ハイブリッド G Aによる複数パラメータの最適化方法」
• 「パター.シマッチングによるデータ解析方法」
• 「放射線回折データに基づく物質構造の推定方法」
(2) ソフトウユア関連発明
• 「最適パラメータ探索プログラム」
• 「物質構造推定プログラム」
• 「記録媒体」
(3) 装虜発明 '
• 「ハイブリッド G A搭載コンピュータ」
• 「ハイブリッド GAを搭載した解析装置」
• 「放射線回折パターンによる物質構造推定装置」
それゆえ、 本願発明たる以下の各手段の間では、 単一性の要件が満たされてい るものと考え、 一つの出願にまとめた。 なお、 この項に記載された各解決手段の 番号は、 本願の出願時点では特許請求の範囲に記載された各請求項の番号に対応 している。 また本項では、 各手段の構成上の特徴に併せて、 その構成がもたらす 作用効果についても簡潔に説明する。
[方法発明のカテゴリー]
1. ハイブリッド GAによる複数パラメータの最適化方法
(1) 第 1手段 ,
(第 1手段の枠組み)
本発明の第 1手段は、 以下に示す 「ハイブリッド GAによる複数パラメータの 最適化方法」 である。 なお、 局所最適化過程が組み込まれた遺伝的アルゴリズム "Genetic Algorithm" (略して GA) のことを、 ここでは 「ハイブリッド GA」 、 略記すれば 「HGA」 (英語表記では" Hybrid GA"または" HGA") と呼ぶことにす る。
なお、 「ハイブリッド GA」 なる名称は、 前述のように日本での用語を踏襲し たものであり 、 対応する用語と して英語圏では 「ラマルキアン G AJ
( "Lamarck i an GA ") の名称が広く使われている。 ただし、 日本での 「ハイブリ ッド G A」 とレヽぅ用語と、 英語圏での 「ラマルキアン G A」 という用語とが、 互 いに厳密に等価であるとまでは断言することができない。 なぜならば、 特許文献 2の解説で触れたように、 日本でいう 「ハイブリッド G A」 が最後の詰めを局所 最適化で加速しょうとするものが多いのに対し、 英語圏でいう 「ラマルキアン G A」は全ての段階で新生個体の全てを局所最適化して進化を加速しようとする傾 向がある らである。 '
すなわち本手段は、 各個体を構成する記号列のうち少なくとも一部は所定の物 理量に対応した複数のパラメータであり、 これらのパラメータの適正な組合せを 探索することを目的とした G Aによって、 複数パラメータを広域最適化する方法 の一種である。
(第 1手段の定義)
本発明の第 1手段は、 各個体を構成する記号列のうち少なくとも一部は、 所定 の物理量に対応した複数のパラメータであり、 これらのパラメータの適正な組合 せを探索することを目的として、 これらのパラメータがそれぞれ適度に分布した 複数の前記個体を初期世代のポピュレーションとし、 各世代において、 当該世代 のポピュレーションのうち少なく とも新たに生成された前記個体である新生個 体の適応度を評価する評価過程と、 このポピュレーションのうち複数の前記個体 を親個体としてこれら親個体の間で行う交叉により新しい子個体を生成する交 叉過程と、 次世代に残すべき複数の前記個体を選択して他の前記個体を淘汰する 淘汰過程とを繰り返すうちに、 これらの個体のうち一部に変更を加える突然変異 過程を適宜交えながら、 世代交代を重ねて前記適応度がより良好な前記個体の発 生を待ち、 もって前記複数のパラメータの最適な組合せを探索する G A (遺伝的 アルゴリズム) による複数パラメータの最適化方法において、 全世代のうち一部 にあたる複数の特定世代において、 当該世代の前記ポピュレーションのうち少な くとも一部にあたる特定個体を対象に、 局所最適化操作が行われることと、 全世 代のうち少なくとも一部にあたる複数の特定世代において、 当該世代の前記ポピ ユレーシヨンのうち一部にあたる特定個体を対象に、 局所最適化操作が行われる こととのうち、 少なくとも一方である局所最適化過程を有することを特徴とする
ハイブリッド G Aによる複数パラメータの最適化方法である。
なお、 第 1手段を定義する記載がこのままでは一読して理解することは難しい ので、 読者に理解が容易になるよう、 本手段の構成を前提部分と特徴部分とに分 けて以下で説明する。
. (第 1手段の前提)
本手段の前提構成は、 簡単に言ってしまえば G Aを有することである。
すなわち本手段は、 たとえば、 これらのパラメータがそれぞれ適度に分布した 複数の前記個体を初期世代のポピュレーションとし、 各世代において、 当該世代 のポピュレーシヨンのうち少なく とも新たに生成された前記個体である新生個 体の適応度を評価する評価過程と、 このポピュレーションのうち複数の前記個体 を親個体としてこれら親個体の間で行う交叉により新しい子個体を生成する交 叉過程と、 次世代に残すべき複数の前記個体を選択して他の前記個体を淘汰する 淘汰過程とを繰り返すうちに、 これらの個体のうち一部に変更を加える突然変異 過程を適宜交えながら、 世代交代を重ねて前記適応度がより良好な前記個体の発 生を待ち、 もって前記複数のパラメータの最適な組合せを探索する G Aによる複 数パラメータの最適化方法であることを、 構成上の前提.とする。
言い換えると、 本手段が構成上の前提としてもつ G Aは、.これらのパラメータ がそれぞれ適度に分布した複数の前記個体を初期世代のポピユレーションとし、 世代交代を重ねて前記適応度がより良好な前記個体の発生を待つアルゴリズム である。 この G Aは、 各世代において評価過程、 交叉過程および淘汰過程とを繰 り返すうちに、 突然変異過程を適宜交えながら世代交代を進めていく。 ここで、 評価過程は、 当該世代のポピュレーションのうち少なくとも新たに生成された前 記個体である新生個体の適応度を評価する過程である。 また、 交叉過程は、 この ポピュレーションのうち複数の前記個体を親個体として、 これら親個体の間で行 う交叉により新しい子個体を生成する過程である。 さらに、 淘汰過程は、 次世代 に残すべき複数の前記個体を選択して他の前記個体を淘汰する過程である。 そし て突然変異過程は、 これらの個体のうち一部に変更を加える過程である。 本手段 は、 このように世代交代を重ねる G Aにより、 前記複数のパラメータの最適な組 合せを探索することを目的とした複数パラメータの最適化方法である。
ここで、 '「世代交代を重ねて前記適応度がより良好な前記個体の発生を待ち」 とあるうちの 「前記個体」 は、 ふつう局所最適化操作または交叉ないし突然変異 の結果、 新たに生じた個体のうち適応度が最良のものといった意味合いである。 ここに 「前記」 とあるは、 既に記載された要件を満たしているといった程度の意 味であり、 けつして以前の世代から生き残つている個体であるという限定を意味 するわけでない。
なお、 G Aの構成については種々のヴァリエーションがあるので、 少なくとも 交叉過程と突然変異過程とを有し、 世代交代を重ねて適応度の高い個体の発生を 待つ G Aでさえあれば、 前提構成が異なつていても構わない。
すなわち本手段は、 上記の前提構成のうち各処理過程を列挙している部分が、 たとえば 「各世代において、 当該世代のポピュレーションのうち少なくとも一部 の前記個体について当該個体の適応度を評価する評価過程と、 このポピュレーシ ヨンから複数の前記個体を選択して親個体とする淘汰過程と、 これらの親個体の 間で交叉を行って新しい子個体を生成する交叉過程とを繰り返すうちに、 ···」'な どとなっていても構わない。
(第 1手段の特徴) .
本手段の特徴は、 前述の G Aにおいて、 .全世代のうち一部にあたる複数の特定 世代において、 当該世代の前記ポピュレーションのうち少なくとも一部にあたる 特定個体に対して局所最適化操作が行われることと、 全世代のうち少なく.とも一 部にあたる複数の特定世^:において、 当該世代の前記ポピュレーシヨンのうち一 部にあたる特定個体に対して局所最適化舉作が行われることとのうち、 少なぐと も一方である局所最適化過程を有するハイプリッド G Aによる複数パラメータ の最適化方法であることである。
これは要するに、局所最適化操作の対象は、全ての世代の全ての個体ではなく、 全世代のうち一部の複数世代であったり、 逆に全世代であっても一部の個体であ つたり、 あるいは一部の複数世代のポピュレーシヨンのうち一部個体であったり ということである。 換言すれば、 局所最適化操作の対象は、 全世代のうち一部の 複数世代での一部個体であるか、 全世代での一部個体であるか、 一部の複数世代 での全個体であるかのうちいずれかであるということである。
なお、 特定世代の分布には色々な場合がありうる。 すなわち、 特定世代が飛び 飛びに散在する場合にも、 必ずしも所定世代毎に周期的に特定世代が出現しなけ ればいけないわけではなく、 特定世代の出現頻度ないし出現周期が世代交代の間 に変動しても良い。 また、 特定世代の出現が初期世代にもあるようにしても良い し、 逆に初期世代は特定世代にはなり得ないようにしておいても良い 9
また、 各特定世代で選定される特定個体の数も、 全ての特定世代の間で一定し ていても良いし、 あるいは世代交代の間に変わっていっても良い。 ここで、 特定 個体がポピュレーションのうち一部である場合には、 特定個体の数を絶対的な個 数で決めても良いし、 ポピュレーションのうち所定パーセンテージ (例えば 1 % とか 0 . 1 %と力 が特定個体に選定されるようにしても良い。 両者はポピユレ ーションが一定であれば等価であるが、 世代交代によってポピュレーションが変 動する場合には両者の間に違いが出る。 あるいは、 特定個体の数は、 交叉や突然 変異によって生じた新生個体の数に対して所定パーセンテージを占めるように 設定されていても良い。 もちろん、 .このようなパーセンテージも一定である必要 はなく、 世代が代われば変動するようにしても良い。
例えば、 GAにより 1 0 0 0個の個体からなるポピュレーションが世代交代を 繰り返す場合を想定してみょう。
まず、 一方の極端な実施形態では、 世代交代毎に各世代のポピュレーションの うち一つが特定個体に選ばれて局所最適化操作を施される。 そして、 これが最も 好ましい実施形態であるこ.とも少なくない。
なぜならば、 仮に各世代のポピユレ一、:/ヨン (個体数 1 0 0 0.個) のうち半分 ( 5 0 0個) 程度が新生個体であるとすれば、 各世代での局所最適化操作の回数 が、 ラマルキアン G Aに比べてこの実施形態では約 5 0 0分の 1に減っているか らである。 これは劇的な演算量の低減を意味しているとともに、 ラマルキアン G Aとは違って当該世代のポピュレーシヨンのうちほとんどの個体は局所最適化 操作を受けないから、 個体の多様性はほとんど失われずに済む。 それでありなが ら、 初期世代を入れるか入れないかにかかわらず、 世代交代毎に全ての世代で進 化に幾分かの方向性が与えられて、 継続的に進化が加速され続けるから、 広域的 な最適値にごく小さな演算量で到達する可能性が高まる。
次に、 中間的な実施形態では、 例えば二三世代毎ないし十世代毎に特定世代が あり、 当該世代のポピュレーションのうち一つない.し数個程度の特定個体が最適 化操作される。
そして、 他方の極端な実施形態では、 例えば百世代毎に一度、 当該世代のポピ ュレ一シヨンを形成する個体の全てに対して局所最適化操作が施される。
ところで、 複数の個体に局所最適化を施した結果、 同一世代のポピユレ一ショ ンに属する個体のうち幾つかが、 パラメータ空間中で同じ局所最適値に相当する 位置にまとまってしまうことがありうる。 そこで、 実質的に同一点または等価と 言えるほど近傍に集合した複数の個体は、 一つの個体と見なしてしまい、 こうし て個体数が減った分については、 交叉や突然変異で新生個体を補充するようにし ても良い。 .
また、 世代交代を重ねるうちには、 以前の世代ですでに局所最適化されている 個体が再び特定個体に選ばれ、 局所最適化操作をかけられる可能性が生じる。 そ こで、 この可能性を封じるために局所最適化済みかそうでないかを示す印 (フラ ッグなど) を個体に付けておくようにしても良い。 ただし、 このようなことをし なくても、 局所最適化操作が施される特定個体の数がポピュレーシヨンに対して ごく僅かなものであれば、 同一の個体が重複して特定個体として選ばれることは ごく稀であるから、 実質上問題になることはない。 そして、 仮に同一個体に対し て重ねて局所最適化操作が行われた場合にも、 二回目以降の同操作では即座に完 了してしまうので、 ほとんど演算処理の負担が生じることはなレ、。
さて話を本筋に戻すと、 このように、 本手段においては、 特定世代の分布ど当 該世代のポピュレーションから選び出される特定個体の個数とに、 かなり広いヴ ァリェ一ションがある。
ただし、 前述の公知文献のうち特許文献 2に開示されているように、 個体に局 所最適化が施されることがある特定世代は、 最終世代にあたる一世代だけである 場合は、 本手段に含まれていない。 また、 非特許文献 1, 2, 5に開示されてい る " Lamarckian GA 〃のように、 全ての世代で全ての新生個体に局所最適化を施 す (すなわち全世代が特定世代でその全個体が特定個体である) 場合も、 本手段 には含まれない。
そして、 本手段では、 前提となる G A自体の構成にも、 その G Aに組み合わさ れる局所最適化操作の手法自体にも、 特段の限定はない。 すなわち、 局所最適化 操作を G Aの中にどのように組合せてハイブリッド化するかという点に、 本手段 の特徴がある。
それゆえ、本手段が前提として有する G Aの構成は、単に「各世代で評価過程、 淘汰過程 (選択過程) および交叉過程を繰り返しつつ、 突然変異過程が適宜交え られて世代交代を重ねるうちに、 適応度が良好な個体の生成を待つ G A」 として も良い。 あるいは、 評価過程を選択過程に含めてしまい、 もっと簡単に 「選択過 程 (淘汰過程) 、 交叉過程、 突然変異過程をもつ G A」. としても良い。
ここで、 一部の用語に定義を加えておく。 先ず、 放射線としては、 X線が代表 的であるが、 中性子線や電子線などの粒子線も含まれる。 X線の中には、 放射光 (シンクロ トロン軌道放射) のような高エネルギー X線や、 X線領域でのコヒー レント光なども、 もちろん含まれるものとする。 次に、 回折とは、 透過回折が主 流ではあるが、 反射現象によるものも含まれるものとする。 そして、 各個体の適 応度が探索範囲の全域で連続量であることは、 適応度に関する局所最適化操作を 個体に施すための十分条件である。 .
(第 1手段の作用効果) .
本手段では、 従来技術 1 (図 2 ( a ) 照) ように、 方向性が与えられず確率 的に進化する単純な G Aによって広域的な探索を行い、 その G Aによって最適解 近傍への収束が確信される.に至るのを待つというわけではない。 あるいは、 従来 技術 2 (図 2 ( b ) 参照) のように、 各世代の全ての個体 (または新生個体の全 て) に対して局所最適化操作が行われることはない。
そうではなく、 本手段の好ましい実施形態を挙げれば、 本手段での局所最適化 操作の対象となる 「特定個体」 は、 全世代のうち一部にあたる分散した複数世代 ( 「特定世代」 ) に散在しており、 当該世代のポピュレーションに属するごく一 部の個体である。 ただし極端な例としては、 全世代において各世代のポピユレ一 シヨンのうちごく一部の個体であるとか、 逆に、 全世代のうち分散したごく一部 の複数世代の全個体であるかのうちいずれかであるとかいう場合も、 本手段の実 施形態に含まれる。
それゆえ本手段では、 特定世代の出現頻度の設定如何とその世代での特定個体 の選定方法の如何とによって、 局所最適化操作の回数を従来技術 2よりも劇的に 減らすことが可能になる。
ここで留意すべきことは、 局所最適化を行うには、 特定個体の近傍において適 応度の勾配を算出する微分処理か、 あるいはそれに類する演算処理が操り返し必 要であり、 なかなか大きな演算処理が必要となることである。 そして、 最適化す べきパラメータの個数ないし自由度が増え、 探索すべきパラメータ空間の次元数 が増えるにつれて、 このような微分操作に要する演算負荷も大きくなるから、 局 所最適化操作の回数を減らすことができれば、 それがもたらす演算負荷の低減効 果は大きくなる。
したがって、 本手段の実施によって局所最適化操作の回数を従来技術 2よりも 劇的に減らすことができれば、 最適化すべきパラメータの数が多い場合には演算 負荷を大幅に減らすことができる。 それゆえ本手段によれば、 最適化すべきパラ メータの数が多ければ多いほど、 従来技術 2よりも計算時間を大幅に短縮するこ とができるという効果が見込める。 その結果、 計算時間が長くかかることがネッ クになって今まで実用にならなかったようなパラメータの数が多い問題であつ ても、 本手段によってその問題を解くことができるようになる可能性がある。 そればかりではなく、 本手段では、 従来技術 2のように各世代のポピユレーシ ョンがもつ多様性が急速に失われるような不都合は生じることがない。 それゆえ、 本手段は漏れの少ない広域的な探索能力を強力に発揮することができ、 結果的に' 短い演算時間のうちに広域的な最適値に達することが、できる。 .
一方、 本手段では、 従来技術 1とは違って、 G Aの進化に方向性をなんら与え ることなく、 G Aの最良解が正解の近傍にまで収束したことが確信できるまで待 つていることは、 必要ではない。 より正確に言うと、 本手段では、 世代交代の間 に適宜その進化に方向性が与えられるので世代交代の回数が少なくて済むうえ に、 広域的な最適値に至る最後の詰めも局所最適化でなされることがほとんどで ある。
すなわち本手段では、 世代交代の途中であっても、 幾つもの世代で何れかの個 体に局所最適化操作を施すことにより進化に方向性を与えることができるから、
広域的な最適値に収束するまでの世代交代の回数自体をも劇的に減らすことが できる。 それでいながら、 交叉や突然変異で生じる全ての新生個体の数に比べて 局所最適化操作の回数がずつと少ないようにしておけば、 前提構成として持つ G Aに比べて、 世代交代毎の平均的な演算負荷はそれほど増えないで済む。
したがって本手段によれば、 世代交代の間に進化の方向性が適度に与えられる ようになるにもかかわらず、 単純な G Aで広域探索を行う従来技術 1に比べても 世代交代毎の平均的な演算負荷があまり增えないで済む。 すなわち本手段では、 世代交代の間に進化の方向性が適度に与えられながら、 単純な G Aに比べてもあ まり演算負荷が増えることがないので、 広域的な最適値に達するまでの世代交代 の.回数が、 従来技術 1に比べて劇的に低減される。 特に、 広域的な最適値 (正解) が形成している峰の一部 (たとえ裾野であっても) に個体が達し、 その個体に局 所最適化がかけられたならば、 一気にその正解に達しうる。 それゆえに本手段で は、 従来技術 2ばかりではなく従来技術 1に比べても、 広域的な最適値に達する までの演算時間を短縮することができる。
すなわち本手段によれば、 従来技術 1および従来技術 2のいずれに比べても、 広域的な探索能力が劇的に向上しており、 多数のパラメータの広域最適化にかか る計算時間を大幅に短縮することができるという効果がある。 その結果、 広域的 に探索すべき多峰性空間があまりに複雑で、 従来技術 1でも従来技術 2でも現実 的には今まで解けなかった複数パラメータの最適化問題であっても、 本手段によ つてその問題を解くことが.できるようになる可能性がある。
(第 1手段に関する考察)
•ポイント
さて、 本手段のように、 局所最適化を適正に組み合わせることによって G Aの 収束特性が改善され、 多数のパラメータを広域的に最適化するのに要する時間が 大幅に短縮する理由は、 局所最適化と G Aとが互いにその欠点を補完し合うため であると考えられる。
すなわち、 G Aによる複数パラメータの広域探索というのは、 確率的 (stochastic) な探索方法である。 それゆえ G Aは、 多峰性の (すなわち落とし 穴の多い) 多次元パラメータ空間を、 たとえ粗くであっても素早く (つまり小さ
な演算負荷で) 広域的に探索し、 そこそこ良い適応度をもつパラメータの組合せ を見つけ出すことを得意としている。 逆に、 広域的な最適点 (つまり求める 「正 解」 ) の近傍まで肉薄していても、 そのことを認識することはできないので、 ピ ンポイントでその最適点に達することは不得手である。 つまり、 局所最適化すれ ば最適点にたどり着けるような最適点の近傍に個体が生じても、 その個体は適応 度がそれほど良くはないという理由などで淘汰されてしまい、 次世代に生き残れ ないと行ったこと 、世代交代の過程で少なからず起きているものと考えられる。 一方、 局所最適化操作による探索は、 確定的 ( determinist ic) な探索方法で ある。 それゆえ局所最適化は、 多次元パラメータ空間の中であっても、 多峰性の ない領域に限ってしまえば、 速やかかつ容易に最適点に到達することが得意であ るが、 逆に、 強い多峰性を持つ多次元空間中を広域的に探索することは不得手で ある。
そこで、 G Aと局 最適化とを上手に組み合わせれば、 互いの長所が互いの短 所を補って補完し合い、 多峰性の多次元空間中を広域的に探索して回り、 ピンポ ィン卜で最適点に達するという困難な課題であっても、 達成することができるよ うになる可能性が生じる。 本手段は.、 このような考えに基づいて開発された技術 であるから、 本手段でこのような効果がどの程度大きく得られるかは、 主として 局所最適化と G Aとを如何に巧妙に組み合わせるかという点に大きく依存する。 ここで、 局所最適化と G Aとの糸且み合わせる上での重要なポイントには、 次の 二つがある。 第一のポイン.トは、 世代交代の間における特定世代の出現頻度と、 . 当該世代のポピュレーションに対する特定個体の個数ないしパーセンテージと である。 第二のポイントは、 特定世代のポピュレーションの中から所定数の特定 個体を選び出す際に、 どのような選定基準を採用するかである。 なお、 局所最適 化と G Aとの組合せ効果を十全に発揮するためには、 淘汰過程で生き残り個体を 選択するルールや、 交叉過程で交叉させる親個体の選定や交叉の仕方などのルー ルなど、 G A自体の設計にも留意した方がよい。
したがって、 本手段に従属している解決手段には、 G Aと局所最適化との組合 せ方に関する限定か、 あるいは組み合わせる際に G A自体をどう設計するかとい つたことに関する限定を含むものが多い。 このことには、 以下の記載を読み進め
る上で留意されたい。
•両従来技術の組合せに対する阻害要因
前述のように、 局所最適化操作を G Aに組み合わせたハイブリッド G Aには、 従来から大きく分けて二通りがある。 この二通りとは、 前述のように、 ずっと G Aで世代交代を繰り返して広域を探索したうえで最後の詰めだけを局所最適化 操作で行う従来技術 1と、 G Aの世代交代毎に全ての新生個体を局所最適化する 従来技術 2'とである。 、
すなわち従来技術 1では、 単純な G Aによってダーウィン的な進化を行う世代 交代が繰り返され、 確率的に広域的な探索が行われた後に、 最終的に残った世代 のポピュレーションのうち適応度が最高の個体にだけ局所最適化が施される。 こ の技術では、 淘汰過程での選択戦略や交叉過程での親個体の選択はあるものの、 最終世代に至るまでは通常の G Aと変わるところは基本的にない。 それゆえ、 最 終世代に至るまで G Aに進化の方向性が与えられることは全くないから、 G Aに よる進化が加速されることはない。 そして、 たまたま最終世代の最優秀個体が広 域的な最適解の近傍にあればよいが、 そうでなければ広域的な最適解には到達で きないままに探索が終了する。 .
いつぼう従来技術 2では、 G Aの世代交代毎に全ての新生個体が局所最適化さ れるので、 進化の方向付けが全ての世代で強烈に行われ、 ごぐ初期の数世代程度 では確かに急速に適応度が向上し、 特に各世代のポピュレーションの平均適応度 の向上は著しい。 し力 しな.がら、 その間にポピュレーションを形成する個体から 多様性が失われてしまうらしく、 その後は適応度があまり向上しないところをみ ると、 むしろ狙いとは逆に、 多峰性空間における広域的な探索能力が損なわれて しまっている可能性さえある。 しかも、 計算量が大変に多い局所最適化操作を全 ての新生個体に施すので、 一回の世代交代にかかる演算量は膨大となり、 多数の パラメータを広域的に最適化するのにかかる計算時間を短縮する効果は小さい ものと考えられる。
端的に言ってしまうと、 従来技術 1は、 世代交代の途中で進化に方向性を与え ず、 徹底してダーウィン的な適者生存の進化を繰り返した後、 最後の詰めで最優 秀個体にだけ方向性をあたえる広域探索方法である。 逆に従来技術 2は、 全ての
新生個体を局所最適化してその進化に方向性を強要するあまり、 そのポピュレー ションから多様性を奪ってしまい、 多峰性の強い多次元パラメータ空間では簡単 に落とし穴に陥って捉えられてしまう傾向がある。
さて、 それでは本発明の第 1手段のように局所最適化を G Aの一部にだけに組 み込むというコンセプトを発想することが、 なぜ専門家にとっても難しかった力、 何がその阻害要因になっていたかを考察してみよう。
それは、 一言で言うと、 世代交代を重ねてもポピュレーションから多様性が失 われないようにすることと、 進化に方向性を付与することとは、 両立することが 今まではできなかったのではないかと思われる。 そもそも、 多様性の確保と進化 の方向付けとの両者をバランスをとつて両立させることの必要性は、 認識されて いなかったようであり、 その必要性が認識されていたという証拠を発明者らは寡 聞にして知らない。
すなわち、 従来技術 1では、 G Aで行われる進化に方向性を与えようという試 みが、 最終世代に至るまで全く行われていない。 一方、 従来技術 2では、 広域的 な探索を効率よく行うために必要な個体の多様性が確保されておらず、 最初の数 世代を経るだけで速やかにポピュレーションから多様性が失われてしまってい る。 本願発明者らの見るところ、 本発明以前には、 このような両従来技術の欠点 がしつかりと認識されていたとは考え難い。 ましてや、 世代を重ねてもポピユレ ーシヨンに属する個体の多様性が失われないようにしながら、 進化の過程で適度 な方向性が与えられるようにした G Aを開発すること力 当該技術分野で課題と ' して認識されていたとは、 いっそう考え難い。
そして、 ダーウィン的な適者生存の進化論は、 不作為な確率重視であるから、 各個体で行った努力が子孫にまで継承されるとするラマルクの要不要論とは、 思 想的に相容れない傾向が強い。 この傾向は、 従来技術 1と従来技術 2とを組み合 わせることに対する阻害要因であると考えるべきである。 したがって、 基本的な 発想の過程から考えても、 従来技術 1と従来技術 2とを組み合わせれば容易に本 願発明に達することができるとするのは、 妥当ではない。
それ故に、 遺伝的アルゴリズムやその改良としてのハイブリッド G Aゃラマル キアン G Aの分野の専門家が本願発明のような技術を完成させるには、 小さから
ぬ阻害要因があったものと考えるのが自然である。 .
•まとめ
なお、 第 1手段を発明するに至るためには、 世代交代を繰り返すうちに散在す る飛び飛びの世代で、 ごく少数の個体に局所最適化操作を施すだけでも、 進化に 方向性を与えることができるということに気づくことが必要である。 そして、 本 手段での局所最適化と G Aとの組合せ方の良いところは、 このよゔに進化に方向 性を与えることができながら、 世代が下っていっても広域的な探索能力に必要な 多様性がポピュレーシヨンから失われないで済むことである。
その結果、 本手段によれば、 多峰性が強い多次元パラメータ空間であっても落 とし穴に囚われることなく、 両従来技術のいずれにも勝つて強力な広域的探索能 力を発揮することができるという効果がある。 しかも、 世代交代の間に広域的な 最適値の近傍に達した個体があり、 たとえ偶然であってもその個体に局所最適化 が施されたならば、 それで複数パラメータの広域的最適化という目的は即時に達 成される。 そして、 このような偶然は少なくともほとんどの場合に於いて両従来 技術のいずれよりも少ない計算時間で起こるから、 結果的に本手段によればずつ と短い計算時間のうちに広域的な最適値 (ないし 「正解」 ) に達しうる。
( 2 ) 局所最適化操作の頻度に関する限定
以下では先ず、 局所最適化操作の頻度に関する限定を、 前述の第 1手段に対し て加えた解決手段から説明する。
ここで、 先ずこのような限定を加える は何故かというと、 局所最適化操作を 行うには多大な演算量を要するので、 局所最適化操作を行う頻度を減らしたいか らである。 そしてその一方で、 G Aの進化に方向性を持たせる局所最適化の作用 が失われないようにすること力 多峰性パラメータ空間における広域的な最適値 の探索過程全体の演算負荷を減らす上で大切であるからである。
(第 2手段)
本発明の第 2手段は、 前述の第 1手段の 「ハイブリッド G Aによる複数パラメ ータの最適化方法」 において、 前記局所最適化過程は、 前記全世代のうち一部に あたる前記複数の特定世代において、 当該世代の前記ポピュレーシヨンのうち一
部にあたる前記特定個体を対象に、 前記局所最適化操作を行う過程であることを 特徴とする。 すなわち、 本手段では、 局所最適化操作の対象は、 全世代のうち一 部の複数世代での一部個体である。
ここで、 特定世代の出現頻度と特定個体の個数との組合せを具体的に例示して おこう。 例えば、 特定世代の出現頻度は二〜三世代毎ないし数世代毎に一回で、 その世代における特定個体の数は一つだけという場合があり得る。 また、 特定世 代の出現頻度は十世代毎ないし数十世代毎に一回で、 その世代における特定個体 の数は一つないし十個程度とかでもよい。 さらに、 特定世代は、 世代交代の度に 連続した世代で出現するが、 初期の幾つかの世代では出現しなかったり、 または 初期の幾つかの世代でだけ飛び飛びであったり、 あるいは飛び飛びに出現しない 世代があったりしてもよレ、。
本手段では、 前述の第 1手段の範囲では局所最適化操作の頻度が比較的低い方 に属し、 設定の仕方如何では、 進化の方向性が適度に与えられながら、 局所最適 化操作の頻度を大きく減らすことができる。 すなわち、 G Aの作用により広域的 な探索を確率的に行いながら、 たまたま広域的な最適値の周辺にある個体が局所 最適化されることがあれば、 一気に求める最適値に達することが可能である。
したがって本手段によれば、 前述の第 1.手段の中でも広域的な最適値に達する までの演算負荷が低減される効果が大きくなり、 特に最適化すべきパラメータの 数が多い場合には計算時間の短縮効果が著しい。
(第 3手段)
本発明の第 3手段は、 前述の第 1手段 「ハイプリッド G Aによる複数パラメ ータの最適化方法」 において、 前記局所最適化操作の対象たる前記特定個体は、 当該世代の前記ポピュレーションのうち一つの前記個体であることを特徴とす る。
本手段では、 局所最適化操作が行われる特定世代 (全ての世代でも良い) に属 するポピユレーションのうち、 たった一つの個体に対してのみ局所最適化操作が 行われるので、 前述の第 1手段の範囲では局所最適化操作の頻度が特に低い方に 属する。 それゆえ、 本手段によれば、 計算時間の短縮効果が大きくなるという効 果があり、 この効果は特に最適化すべきパラメータの数が多い場合に顕著になる。
(第 4手段)
本発明の第 4手段は、 前述の第 1手段の 「ハイブ.リツド G Aによる複数パラメ ータの最適化方法」 において、 前記局所最適化過程が行われる前記特定世代は、 前記全世代のうち少なくとも一部に散在していることを特徴とする。
本手段では、 局所最適化操作が行われる世代が全世代に全般的に散在している 必要はなく、 全世代のうち一部区間では全く局所最適化操作が行われないことが あっても構わない。 例えば、 世代交代の浅いうちには局所最適化が全く行われな い世代があつたり、 局所最適化が行われない世代がしばらく続いたりしても構わ ない。
したがって本手段によれば、 全世代における特定世代の分布を設定する自由度 が増しているので、 その設定次第ではより効率的に広域的な最適化を進めること ができる可能性があるという効果がある。
実は、 実際に回折環に基づいて物質構造決定を行ったケースのうち幾つかで、 世代交代のうち始めの幾つかの世代までは局所最適化を行わないでいた方が、 ノ、 イブリツド G Aの収束が速く、 計算時間が短縮されたということがあった。 そこ で、 その特徴のうち一部を本手段で定義しておいた。
なお、 次の第 5手段および第 6手段も、.その特徴を部分的に表現を変えて記載 したものである。
(第 5手段)
本発明の第 5手段は、 前述の第 1手段の 「ハイブリッ ド G Aによる複数パラメ ータの最適化方法」 において、 前記特定 ¾:代が各前記世代のうちに出現する頻度 は、 前記全世代のうち前記世代が下る方が高く設定されていることを特徴とする。 本手段では、 その世代のポピュレ一ションのうちどれかの特定個体に局所最適 化操作が行われる特定世代は、 その出現頻度を世代交代の途中で変え、 しかも増 えるという設定がなされている。 ただし、 特定世代の出現頻度の増え方に限定は ないから、 世代交代の途中から一度だけステップ状に出現頻度が增えても良いし、 世代交代の一部区間または全区間で徐々に出現頻度が増えても良い。
本手段によっても、 ハイブリッド G Aの収束がいっそう速くなり、 計算時間が さらに短縮されるという効果が発揮される場合がある。
(第 6手段)
本発明の第 6手段は、 前述の第 1手段の 「ハイプリッド G Aによる複数パラメ ータの最適化方法」 において、 前記特定世代は、 前記全世代のうち少なくとも後 半部で、 所定の複数世代毎に周期的に出現することを特徴とする。
実際に回折環に基づいて物質構造決定を行った際に、 初期世代から所定世代ま では局所最適化を行わないでおき、 所定世代以降ではどれかの個体に局所最適化 を施す特定世代を周期的に出現させるようにしたところ、 ハイプリッド G Aの収 束が速くなり、 計算時間が短縮されたということがあった。 そこで、 本手段でそ の特徴を定式化しておくことにした。
φ:手段によっても、 ハイブリッド G Aの収束がいっそう速くなり、 計算時間が さらに短縮されるという効果が発揮される場合がある。
( 3 ) 局所最適化対象の指定方法に関する限定
(当該限定の意義) ■ ' . '
. 「正解」 の必要性
次に、 局所最適化の行われる特定世代のポピユレ一シ ンから、 その対象とな る特定個体を選び出す方法について限定を加えた解決手段を開示する。
ここでのポイントは、 意外なことに、 適応度の高い個体に局所最適化操作を施 した場合よりも、 むしろ逆に適応度の低い個体に局所最適化操作を施した方が、 その局所最適化の結果、 正解にたどり着く確率が高くなるということである。 発 明者らがこのことを発見したのは、 プログラムミスが切っ掛けになって、 不思議 に収束が速いケースがあつたという僥倖 (セレンディビティー) にも恵まれたせ いもある。
さて、 先ほど 「正解」 という言葉を使ったが、 これは発明者らが放射線回折に よる物質構造の決定という技術分野における研究者であるからである。
すなわち、 この技術分野においては、 最適設計などの分野とは違って、 単にデ ータマッチングの適応度が比較的高いというだけでは不足であり、 広域的に最適 な (つまり適応度が最高の) 正解であることが必要である。 なぜならば、 物質構 造を決定するうえで、 実測データとよく似た回折パターンを形成するのでデータ
マツチングの適応度は高いのだけれど、 実は正解とは異なる構造を持つ物質でし たというのでは、 ほとんど全く意味がないからである。
•思考実験
そして、 適応度の低い個体に局所最適化操作を施した方が正解にたどり着く確 率が高くなるということは、 例えば世界地図の中から世界最高峰を探索する問題 を想定しみると、 理解しやすい。 これは一種の思考実験である。
すなわち、 世界地図は緯度経度という二次元のパラメータ空間であり、 その陸 地の部分は所定の拘束条件を満たす範囲であって、 各個体が位置する地点の標高 は当該個体の適応度に相当する。 そして、 陸地のうちなるベく広範な範囲に多数 の個体を散在させ、 本発明のハイプリッド G Aによって、 世界最高峰の山頂を極 めることを目的とした探索を行うことを想像してみよう。
すると、 適応度が高い個体は、 すでに標高が高い山岳部なり山麓なり高地なり にいるわけだが、 それがアルプス山脈やウラル山脈、 ロツキー山脈あるいはアン デス山脈に連なる部分にいるのでは、'局所最適化をかけて上り坂を登らせ UJ頂に 至ったところで、 世界最高峰には達し得ない。 そうではなく、 局所最適化をかけ れば世界最高峰のエベレス ト (チヨ.モランマまたはサガルマータともいう) 山頂 に至る可能性があるのは、 むしろガンジス川北岸の低地に佇む個体である。 このように考えれば、 比較的適応度が低い個体も局所最適化操作の対象に選ぶ ことがある方が、 より速く正解にたどり着くことになるということは、 思考実験 によって妥当な説明が付ぐことではある。
し力 しながら、 局所最適化操作する個伴を選ぶうえでこのような方法を採るこ とは、 適応度の高い個体を優遇するエリート戦略やルーレツト戦略などを重宝し てきた G Aの世界では、 全く常識の逆を行く発想であった。 なぜならば、 このよ うな概念は、 適者生存として自然淘汰が行われるダーゥィン的進化論を模して誕 生した G Aとは相容れなレ、性格を持つものだからである。
以下の各手段は、 一連の本願発明のうち、 このような発想に基づいて設けられ た限定を色々に規定したものである。
(第 7手段)
本発明の第 7手段は、 前述の第 1手段の 「ハイブリッド G Aによる複数パラメ
ータの最適化方法」 において、 前記特定個体は、 当該特定世代の前記ポピユレ一 シヨンのうち前記適応度が比較的低い前記個体の中からも指定される.可能性が あることを特徴とする。
本手段では、 前述のような作用が得られる。 その結果、 本手段によれば、 ふつ うに適応度が高い個体の中ばかりから局所最適化操作の対象を選ぶようにした 場合よりも、 正解への収束が速くなり、 計算時間がさらに短縮されるという効果 が発揮される。
. (第 8手段;)
本発明の第 8手段は、 前述の第 7手段の 「ハイプリ、;/ド G Aによる複数パラメ —タの最適化方法」 において、 前記特定世代の前記ポピュレーションのうち、 前 記適応度が比較的低い複数個の前記個体からなるグループをもって、 劣等グルー プと呼ぶことにし、 前記特定個体は、 この劣等グループの中から指定されること を特徴とする。
本手段では、 前述の第 7手段よりも限定が狭くなされているので、 前述の作用 がいつそう強くなる。 その結果、 本手段によれば、 ハイブリッド G Aがいつそう 速く正解へ収束する可能性が高まり.、 計算時間がさらに短縮されるという効果が ある。 ' .
(第 9手段)
本発明の第 9手段は、 前述の第 8手段の 「ハイプリッド G Aによる複数パラメ —タの最適化方法」 において、 前記劣等グループは、 前記ポピュレーションのう ち前記適応度が低い方の所定数および所定割合のうち少なくとも一方に属する 複数の前記個体からなるグループであることを特徴とする。
本手段では、 前述の第 8手段よりもさらに狭く限定ざれているので、 前述の作 用がよりいつそう強くなる。 その結果、 本手段によれば、 ハイブリッド G Aによ る探索がいっそう速やかになり、 正解に至るまでの計算時間がよりいつそう短縮 されるという効果がある。
(第 1 0手段)
本発明の第 1 0手段は、 前述の第 8手段の 「ハイプリッド G Aによる複数パラ メータの最適化方法」 において、 前記特定個体は、 当該世代の前記劣等グループ
の中からルーレッ ト選択法およびランダム選択法のうち一方により選択される ことを特徴とする。
本手段でも、 前述の第 8手段よりもさらに狭く限定されているので、 前述の作 用がよりいつそう強くなる。 その結果、 本手段によっても、 ハイブリッド G Aが いっそう速く正解へ収束し、 計算時間がよりいつそう短縮されるという効果があ る。
(第 1 1'手段) 、
本発明の第 1 1手段は、 前述の第 1手段の 「ハイプリッド G Aによる複数パラ メータの最適化方法」 において、 前記局所最適化過程は、 前記特定世代の前記ポ ピュレーシヨンの一部を前記特定個体として選び出して前記局所最適化操作を 施す過程であり、 前記特定個体の選定に当たっては、 前記適応度がより低い前記 個体の方がより高い確率で選定ざれるという弱者優先の傾向を持つことを特徵 とする。 - ただし本手段では、 「弱者優先」 の傾向を持つとはいえ、 前述の第 8手段およ び第 9手段とは異なり、 劣^グループには属さないエリ ト集団の中からも特定 個体が選ばれる可能性が残っている。
本手段でも、 前述のように適応度が低い個体の中にこそ局所最適化操作の結果、 正解に至るものが多いという考えから、 適応度がより低い個体の方がより高い確 率で選定されるようになっている。 その結果、 本手段によっても、 ハイブリッド G Aがいつそう速く正解へ収束し、 計算時間がいっそう短縮されるという効果が 得られる。 .,
( 4 ) 淘汰過程の選択戦略に関する限定
ここでは、 次世代に生き残る個体を選択する選択戦略において、 適者生存とい う自然淘汰の思想 (ダーウイ二ズム) とは逆行し、 言うなれば 「不適者生存」 と もいうべき逆転の発想を採り入れた解決手段を幾つか開示する。
したがって、 以下の幾つかの解決手段が持つ特徴は、 淘汰過程で生き残る個体 の選択に関するものであり、 局所最適化操作の对象となる特定個体の選択に関す るものではないことに留意されたい。
(第 1 2手段)
本発明の第 1 2手段は、 前述の第 1手段の 「ハイプリッド G Aによる複数パラ メータの最適化方法」 において、 前記淘汰過程では、 当該世代のポピユレーショ ンのうち前記適応度が比較的低い前記個体であっても次世代に生き残る可能性 がある選択戦略が採られることを特徵とする。
前述の第 1手段では、 交叉なり突然変異なりで新たに生成された個体の全てに 局所最適化操作を施すわけではないので、 局所最適化が施されれば正解に至る個 体が、 局所最適化を施されず適応度が低いままに放置されている可能性がある。 そ.こで本手段では、 このような個体が世代交代の折に全滅してしまうことを、 な るべく回避することができるようにした。
すなわち、 本手段の淘汰過程では、 適応度の高い個体だけが生き残るェリート 戦略を採らず、 適応度が比較的低い個体であっても次世代に生き残る可能性があ る選択戦略を取っている。その結果、局所最適化が施されれば正解に至る個体は、 その世代では局所最適化が施されずに放置されていても、 次世代に生き残る可能 性があるから、 世代を下ったところで局所最適化されて芷解に至る可能性を持つ。
したがって本手段によれば、 このような可能性がある分だけ、 ハイブリッド G Aが速く正解へ収束する可能性が高まり、 '計算時間が短縮される可能性が高まる という効果が得られる。
(第 1 3手段)
, 本発明の第 1 3手段は、 前述の第 1手段の 「ハイプリッド G Aによる複数パラ メータの最適化方法」 において、 前記淘汰過程で前記選択の際に採られるルール のことを選択戦略と呼ぶことにし、 この選択戦略は、 この適応度とは関わりなく 無作為に前記個体が選択されるランダム戦略と、 この適応度が比較的低い前記個 体が優先的に選択される逆ェリ一ト戦略と、 この適応度が比較的低い前記個体の 方が選択される確率が高くなる逆ルーレツト戦略と、 この適応度が比較的低い前 記個体の方が優先的に選択されるようにした逆期待値方式、 逆ランク方式および 逆トーナメント方式とのうち何れかとのうちいずれかであることを特徴とする。 前述の第 1 2手段では、 適応度が比較的低い個体であっても次世代に生き残る 可能性が否定ざれなかっただけであるが、 本手段では、 適応度とは関わりなく無
作為に生き残り個体が選択されるか、 むしろ積極的に適応度が低い個体の生存が 優先される。 すなわち、 本手段は、 不適者の生存を優先する選択戦略を提案する ものである。
その結果、 仮に局所最適化が施されたとすれば正解に至るであろう個体が、 局 所最適化さらないままで放置されていても、 この個体は、 次世代に生き残る可能 性が高まるので、 世代を下ったところで局所最適化されて正解に至る可能性を持 つ。 したがって本手段によれば、 このような可能性が高まる分 け、 ハイブリツ ド G Aが速く正解へ収束する可能性が高まり、 計算時間が短縮される可能性が高 まるという効果が得られる。
(第 1 .4手段) .
本発明の第 1 4手段は、 前述の第 1 2手段または第 1 3手段の 「ハイプリッド G Aによる複数パラメータの最適化方法」 において、 当該世代の前記ポピユレ一 シヨンのうち前 IB適—応度が最高である前記個体をトップ個体と呼ぶことにし、 当 該世代からその次世代に世代交代する際にこのトップ個体は必ず生き残るとい う トップ保存戦略が併用されることを特徴とする。
本手段でば、 トップ個体の生存が保証されているので、 仮に探索が正解に至つ ていた場合には、 世代交代の際にその正解に至った個体が淘汰されてしまうよう 'な不都合は防止される。 その結果、 いったん正解に収束してしまえば、 そこから 外れてしまうことがなくなり、 しかも世代交代を重ねてもトップ個体が交代する ,ことはなくなるから、 収束判定が容易になる。
したがって本手段によれば、 正解に収束したらもはや動かず、 収束判定が容易 になるという効果がある。
( 5 ) 代替手段 (第 1手段の別表現)
(第 1 5手段)
本発明の第 1 5手段は、 前述の第 1手段とおおむね同様の 「ハイプリッド G A による複数パラメータの最適化方法」 である。
本手段は、 各世代のポピュレーションを形成する個体のそれぞれは、 所定の物 理量に对応した複数のパラメータを含む記号列からなり、 これらのパラメータが
ある程度の多様性をもって分布した初期世代から所定のルールで世代交代を重 ねるうちに、 より高い適応度をもつ前記個体が生成'されることをもって、 前記複 数のパラメータの最適化を図る G Aによる複数パラメータの最適化方法である ことを前提とする。 本手段の特徴は、 全世代のうち一部にあたる複数の特定世代 において、 当該世代の前記ポピュレーションのうち少なくとも一部にあたる特定 個体を対象に、 局所最適化操作が行われることと、 全世代のうち少なくとも一部 にあたる複数の特定世代において、 当該世代の前記ポピュレーシヨンのうち一部 にあたる特定個体を対象に、 局所最適化操作が行われることとのうち、 少なくと も一方であることである。
本手段の作用効果は、 第 1手段の作用効果とおおむね同様である。
なお、 前述の第 1手段に従属した上記の各解決手段に相当する限定を設けたヴ アリエーシヨンを、 本手段に対しても同様に従属して設定することができ、 それ ぞれ対応する上記解決手段とおおむね同様の作用効果が得られる。
2 . パターンマッチングによるデータ解析 ¾ "法
(第 1 6手段)
本発明の第 1 6手段は、 前述の第 1手段〜第 1 5手段のうちいずれかに記載さ れた 「ハイブリッド G Aによる複数パラメータの最適化方法」 において、 各前記 個体がもつ前記適応度は、 当該個体の前記記号列に含まれる前記複数のパラメ一 ,タに対応する前記物理量を仮定すると数値演算により决まる仮想データのバタ ーンが、 実測データのパターンとどの程度一致しているかを示す指標であり、 こ の適応度が高い前記個体を生成することによって、 当該個体の前記仮想データと 前記実測データとの間でパターンマッチングを行い、 前記物理量を推定すること を目的として前記実測データの解析を行うことを特徴とする 「パターンマツチン グによるデータ解析方法」 である。
ここでいう適応度は、 普通はパターンマッチングないしデータマッチングの程 度を示す指標であるから、 逆に二乗誤差などマッチング不足の程度 (ずれの大き さ) を示す指標を利用しても良い。
本手段では、 その中核となるハイブリッド G Aが、 前述の第 1手段〜第 1 5手
段のうちいずれかに記載された特徵を有しているので、 それぞれに特有の作用効 果が得られる。その結果、本手段によれば、パターンマツチングの正解に対して、 ハイブリッド G Aがより速やかに収束するようになり、 データ解析方法に要する 計算時間が短縮されるという効果がある。
3 . H G Aの応用たる物質構造の推定方法
(第 1 7手段)
本発明の第 1 7手段は、 以下の特徴を持つ 「放射線回折データに基づく物質構 造の推定方法」 である。 ここでは控えめに 「推定」 という言葉を用いたが、 本手 段は、 かなりの (少なくとも両従来技術を大幅に凌駕する) 確度をもって推定す ることができ、しかもその推定精度もかなり高いので、実質的には物質構造の「決 定」 を行う方法である。
本手段の特徴は、 前述の第 1手段〜第 1 5手段のうちいずれかに記載された 「ハイプリッド G Aによる複数パラメータの最適化方法」 を、 所定の試料物質に 照射された放射線が形成する回折パターンに基づいてこの試料物質の構造を推 定する物質 造の推定方法 (ないし決定方法) に応用したことである。 そして、 本手段では、 前記物理量のうち少なくとも一部は、 この試料物質の物質構造を決 定する構造パラメータである。 また、 各前記個体の前記適応度は、 この試料物質 が当該個体に相当するこれらの構造パラメータをもっと仮定すると生じる回折
'パターンが、 実測された前記回折パターンに対してどの程度一致しているかを示 す指標である。 '
本手段では、 その中核となるハイブリッド G Aが、 前述の第 1手段〜第 1 5手 段のうちいずれかであり、 当該手段の項に記載された特徴を有しているので、 そ の特徴に起因してそれぞれに特有の作用効果が得られる。 すなわち、 放射線回折 パターンのパターンマッチングが行われる際に、 本手段が用いるハイプリッ K G Aの特徴によって構造パラメータの正解に対する収束が、 従来技術 1や従来技術 2に比べて格段に速やかになる。
したがって本手段によれば、 より多数のパラメータ空間を広域に探索してより 精密に最適化することができるようになり、 物質構造の推定ないし決定に要する
計算時間が著しく短縮されるという効果がある。 その結果、 両従来技術によって は実際的に構造決定ができなかった物質まで、 費用および時間の許容 tfe囲内でそ の構造決定をすることが可能になるという効果がある。
(第 1 8手段)
本発明の第 1 8手段の 「放射線回折データに基づく物質構造の推定方法」 は、 前述の第 1 7手段において、 前記構造パラメータとは、 前記試料物質の結晶構造 を規定する格子定数と、 この試料物質を構成する分子内における三次元的な原子 配列を規定する分子構造パラメータと、 この分子内での確 的な電子密度分布を 規定する電子密度分布パラメータと、 この試料物質の結晶内での三次元的な原子 配列を規定する結晶学的構造パラメータとのうち、 少なくとも一つであることを 特徴とする。
すなわち本手段は、 前述の第 1 8手段における 「構造パラメータ」 という用語 の内容を具体的に限定するものである。
なお、 ここでいう 「試料物質の結 ^内での三次元的な原子配列を規定する結晶 学的構造パラメータとは、 結晶の各軸方向の長さ a , b , cをそれぞれ単位長さ 1として規格化した分極座標 (X , y, z ) である。 また、.結晶内での分子全体 の向き (姿勢) を定義する角度パラメータも含まれる。 ここで、 x, y , zはそ れぞれ 0〜 1の範囲の値で表すのが普通である。
(第 1 9手段)
, 本発明の第 1 9手段は、 前述の第 1 7手段の 「放射線回折データに基づく物質 構造の推定方法」 において、 前記回折パターンは、 その回折強度が同心円状に拡 がって分布する回折環であることを特徴とする。
本手段によれば、 試料物質から形成される放射線の回折パターンが回折環であ つても、 その試料物質の構造を決める構造パラメータを決定することができるよ うになるという効果がある。 ここで、 回折環ではピーク重複が大きく、 回折デ一 タに含まれる情報量は単結晶が作る格子状の回折パターンに比べて格段に少な くなつてしまうから、 ある程度複雑な物質構造を決定することは困難であったこ とを付言しておく。
換言すれば、 構造を決定したい物質で試料に適当な大きさの結晶を作ることが
未だできなくても、 その物質が形成している微細な結晶の格子定数や当該物質を 構成している分子中の原子の立体配置構造などを決定することが、 本手段により できようになる。 その結果、 結晶を成長させる技術が未だ確立されないほど生成 間もない新物質の構造決定が可能になるから、 医薬品や新材料の開発や物質設計 の分野に大きな貢献をすることが、 本手段には期待できる。
それは、 本手段で使用されるハイプリッド G Aが、 極めて強力な広域での最適 値探索能力と精密な局所最適化との両方を併せ持っているからである。 すなわち、 前述のように本手段の中核技術は本発明の 「ハイブリッド G A」 であり、 それに よって多数のパラメータを広域で探索して精密に最適化するのに要する計算時 間が大幅に短縮されていることが、 本手段の実用化の最大要因である。
(第 2 0手段)
本発明の第 2 0手段は、 前述の第 1 9手段において、 前記適応度は、 前記回折 環がもつ半径方向への強度分布の実測データと、 仮定された前記構造パラメータ に基づいて生成される仮定データとが、 どの程度一致しているかを示す評価関数 であることを特徴とする、 「放射線回折データに基づく物質構造の推定方法」 で ある。 ノ
本手段は、 前述の第 1 9手段において、 'その限定をより具体的にしたものであ る。 本手段では、 適応度として、 例えば実測データと仮定データとの間にある誤 差の二乗和などの評価関数を用いることができ、 適応度の算出が容易になる。 そ ,うすれば、 局所最適化操作には、 最小二乗誤差法による多種多様な局所最小化手 法の中から選択することができるようになる。
したがって本手段によれば、 適応度の算出に関する演算負荷が低減されるので、 計算時間がいっそう短縮されるという効果がある。
(第 2 1手段)
本発明の第 2 1手段は、 前述の第 1 7手段などによく似た 「放射線回折データ に基づく物質構造の推定方法」 である。
本手段では、 複数の結晶を含む粉末試料、 多結晶集合体である多結晶試料、 非 晶質 (アモルファス) 試料および溶液試料のうち少なくとも一つである試料物質 の構造を特定するために、 この試料物質に照射された放射線の回折によってもた
らされる回折環の強度分布を示す回折データを解析する。 すなわち、 この回折デ ータに基づき、 この試料物質がもつ物質構造を示すいずれかの構造パラメータを、 データマッチングにより推定する。
その推定アルゴリズムとしては、 遺伝的アルゴリズム (G A) に局所最適化操 作を組み込んだハイブリッド G A (H G A) を使用し、 この H G Aの構成に本手 段の特徴がある。
ここで、 前提となる G Aとは、 初期世代のポピュレーションを生成する発生過 程と、 交叉、 複製、 選択を繰り返して突然変異を交える世代交代過程とをもつ。 すなわち G Aでは、 先ず発生過程で、 前記構造パラメータがコーディングされた 個体を、 ある程度の多様性を持たせて複数個発生させ、 初期世代のポピユレ一シ ヨンとする。 この発生過程の後に、 これらの個体の交叉および複製と、 前記デー タマッチングの程度を示す適応度を評価してこれらの個体を淘汰する選択と、 確 率的に起こる突然 異とを繰り返す世代交代過程を行う。
そして、 本手段の特徴には二つあり、 第一の特徴は、 この G Aが、 世代交^:過 程の間に複数の世代において、 当該ポピュレーションの一部個体に対して局所最 適化操作を行う H G Aであることである。 第二の特徴は、 この局所最適化操作の 対象には、 当該ポピュレーションのうち適応度が比較的低い個体もなる可能性が あることである。
本手段では、 G Aの世代交代のうち、 複数世代で当該ポピュレーションのうち ,適応度が比較的低い個体も局所最適化操作の対象になるから、 第 7手段とほぼ同 様の作用効果が得られる。 その結果、 本手段によれば、 推定すべき構造パラメ一 タの正解に収束するまでの計算時間が大幅に短縮され、 今までは計算時間が膨大 になるなどして実現できなかった物質構造の決定が可能になるという効果があ る。
(第 2 2手段)
本発明の第 2 2手段は、 以下のような解析手順を構成要素とした 「放射線回折 データに基づく物質構造の推定方法」 である。
すなわち本手段は、 放射線を試料物質に照射して得られた回折環の強度分布デ ータに基づき、 この強度分布データに適合する物質構造を特定するために、 格子
定数決定プロセスと背景散乱除去プロセスと空間群絞り込みプロセスと基本構 造決定プロセスと構造精密化プロセスとのうち、 少なくとも格子定数決定プロセ スと空間群絞り込みプロセスと基本構造決定プロセスとを有する。 そして本手段 では、 格子定数決定プロセスおよび基本構造決定プロセスのうち少なくとも一方 で、 G A (遺伝的アルゴリズム) に局所最適化操作を組み合わせたハイブリッド G Aを利用した物質構造決定が行われることを特徴とする。
第一に、 格チ定数決定プロセスとは、 この試料物質に含まれる結晶の格子定数 を決定するプロセスである。 すなわち、 このプロセスでは、 当該結晶の単位格子 を定義する格子定数、 例えば格子定数 (a , b , c , α , β , γ ). などが決定さ れる。
第二に、 背景散乱除去プロセスとは、 この強度分布データに含まれているバッ クグラウンド散乱の影響を、 除去ないし低減するプロセスである。 ここで、 バッ クグラウンド散乱の原因には種々のものがあるが、 レ、ずれも有用な情報ないし信 号を埋もれさせるノイズとして作用するので、 その影響をできるだけ減らすこと が必要である。
第三に、 空間群絞り込みプロセスとは、 この結晶が属する空間群の候補を絞り 込むプロセスである。 このプロセスでは、 回折パターンのピークないし反射の出 現位置に基づき、 結晶が取りうる 2 3 0種類の空間群のうちから可能性の低いも のを除き、 可能性が高い空間群を数種類程度に絞り込むことが行われる。
第四に、基本構造決定プロセスとは、この結晶の基本構造を初期的に決定して、 . この空間群を一つに特定するプロセスである。 すなわち、 このプロセスでは、 前 述の空間群絞り込みプロセスで絞り込まれた空間群の候補の中から、 最も確から しい空間群が決定され、単位格子内での分子の位置及び姿勢と三次元的な原子配 列とが、 やや粗めの精度で決定される。
第五に、 構造精密化プロセスとは、 この基本構造を精密化して、 この結晶を構 成する物質の構造をより精密に決定するプロセスである。 さらに、 この構造精密 化プロセスでは、 分子内での電子密度の分布をも推定ないし決定することがある。 本手段の最大の特徴は、 前記ハイブリッド G Aでは、 世代交代の間に複数の特 定世代で、 当該世代のポピュレーシヨンのうち一部の個体である特定個体を対象
にして前記局所最適化操作が行われることと、 この特定個体には、 当該世代のポ. ピュレーションのうちでは実測データとの一致度を示す適応度が比較的低い劣 等グループからも選定される可能性があることである。
本手段では、 放射線回折データに基づいて物質構造を段階的に推定ないし決定 していく手順が明らかにされており、 さらにその手順の中でハイブリッド G Aを 用いるべきプロセスはどれであるかも明らかにされている。 そればかりではなく、 そのハイブリ 、 ド G Aがもつ特徴も限定されており、 これによつて構造パラメ一 タが正解に速やかに収束し、 計算時間が大幅に短縮される。
したがって本手段によれば、 粉末試料が形成する回折環に基づく物質構造の決 定など、 今までは計算時間が膨大になって実現できなかった新物質の構造決定も、 所定の手順を踏んで実現することが可能になるという効果がある。
[物の発明のカテゴリー]
1 . ソフトウエア関連発明
( 1 ) 最適パラメータ探索プログラム
(第 2 3手段)
本発明の第 2 3手段は、 コンピュータに実行可能な 「最適パラメータ探索プロ グラム」 であり、 所定の物理量に対応した複数のパラメータの適正な組合せを探 ' 索する機能を、 所定のコンピュータに発揮させるべきコンピュータ ·プログラム であることを前提にする。 本手段の特徴は、 第 1手段〜第 1 4手段のうちいずれ かに記載された 「ハイブリッド G Aによる複数パラメータの最適化方法」 を実行 するために、 前記初期世代の前記ポピュレーシヨンの生成および読込のうち一方 を行う初期世代設定ステップと、 前記評価過程、 前記淘汰過程、 前記交叉過程、 前記突然変異過程および前記局所最適化過程のそれぞれに対応する各演算ステ ップ (すなわち、 評価ステップ、 淘汰ステップ、 交叉ステップ、 突然変異ステツ プおよび局所最適化ステップ) とを有することである。
換言するならば、 本手段の 「最適パラメータ探索プログラム」 を所定のコンビ
ユータに実行させることにより、 前述の第 1手段〜第 1 4手段の 「ハイブリッ ド. G Aによる複数パラメータの最適化方法」 は実現される。
(第 2 4手段)
本発明の第 2 4手段は、 コンピュータにより実行可能な 「最適パラメータ探索 プログラム」 であり、 所定の物理量に対応した複数のパラメータの適正な組合せ を探索する機能を、 所定のコンピュータに発揮させるべきコンピュータ ·プログ ラムであることを前提とする。 '
本手段の特徴は、 先ず、 各世代のポピュレーションを形成する個体のそれぞれ は、 前記所定の物理量に対応した前記複数のパラメータを含む記号列からなり、 これらのパラメータがある程度の多様性をもって分布した初期世代から所定の ルールで世代交代を重ねるうちに、 より高い適応度をもつ前記個体が生成される ことをもって、前記複数のパラメータの最適化を図る G A (遺伝的アルゴリズム) の中に、'前記適応度に関する局所最適化操作を所定の前記個体に対して行う局所 最適化ステップが組み込まれていることである。
本手段はざらに、 この局所最適化ステップが、 前記 G Aで生成される全世代の うち一部におたる複数の特定世代において、 当該世代の前記ポピュレーションの うち少なくとも一部にあたる特定個体を対象にする演算ステップであることと、 前記 G Aで生成される全世代のうち少なく とも一部にあたる複数の特定世代に おいて、 当該世代の前記ポピユレーションのうち一部にあたる特定個体を対象に する演算ステップであることとのうち、 少なくとも一方であることを特徴として いる。 '
本手段では、 G Aが世代交代を重ねるうちに、 複数の特定世代で、 適応度に関 する局所最適化操作を特定個体に対して行う局所最適化ステップが組み込まれ ているから、 最適パラメータ探索の収束が速くなり、 計算時間が大幅に短縮され る。 その結果、 本手段によれば、 従来は計算時間が膨大にかかって実際上不可能 であった複雑な複数パラメータの広域探索問題が、 実用的な計算時間内に解ける ようになるという効果がある。
なお、 本手段についても、 前述の第 1手段に従属した第 2手段〜第 1 4手段の うちいずれかに相当する限定を付けた各種ヴァリエーシヨンが実施可能であり、
それぞれに相当する作用効果が得られる。
(第 2 5手段)
本発明の第 2 5手段は、 コンピュータにより実行可能な 「最適パラメータ探索 プログラム」 であり、 複数のパラメータの適正な組合せを探索する機能を、 所定 のコンピュータに発揮させるべきコンピュータ ·プログラムであることを前提に している。
本手段の特徴は、 各世代のポピュレーションを形成する個体のそれぞれは、 前 記複数のパラメータに対応した記号列を含んでおり、 これらのパラメータがある 程度の多様性をもって分布した初期世代のポピュレ一シヨンから始めて、 所定の ルールで世代交代を重ねるうちに、 より高い適応度をもつ前記個体が生成される ことによって前記複数のパラメータの最適化を図る G A (遺伝的アルゴリズム) の中に、 前記適応度に関する局所最適化操作を所定の前記個体に対して行う局所 最適化ステップが組み込まれていることである。
本手段はさらに、 この局所最適化ステップが、 前記 G Aで生成される全世代の うち一部にあ,たる複数の特定世代において, 当該世代の前記ポピュレーシヨンの うち少なくども一部にあたる特定個体を対象にする演算ステップであることと、 前記 G Aで生成される全世代のうち少なくとも一部にあたる複数の特定世代に おいて、 当該世代の前記ポピュレーシヨンのうち一部にあたる特定個体を対象に する演算ステップであることとのうち、 少なくとも一方であることをも特徴とし ,ている。
すなわち本手段は、 前述の第 2 4手段から、 最適な組合せを探索すべき複数の パラメータが物理量に関するものであるとの限定を外したものであり、 その結果、 物理量以外を探索対象とする多数のパラメータの最適な組合せを探索する問題 にも適用することができるようになる。 したがって本手段によれば、 前述の第 2 3手段や第 2 4手段とほぼ同様の作用効果が得られながら、 その適用範囲が、 政 治決定や経営問題などの社会的な問題やテーブルゲームなどを含むより広い分 野にまで拡がるという効果がある。
なお、 本手段についても、 前述の第 1手段に従属した第 2手段〜第 1 4手段の うちいずれかに相当する限定を付けた各種ヴァリエーシヨンが実施可能であり、
それぞれに相当する作用効果が得られる。
( 2 ) 物質構造推定プログラム
(第 2 6手段)
本発明の第 2 6手段は、 コンピュータにより実行可能な 「放射線回折データに 基づく物質構造推定プログラム」 であり、 所定の試料に照射された放射線が形成 する回折パターンに基づいて当該試料を構成する物質の構造を推定する機能を、 所定のコンピュータに発揮させるべきコンピュータ ·プログラムであることを前 提にしている。
本手段の特徴は、 前記回折パターンの実測データを数値的に読み込む実測デー タ読込ステップと、 第 2 3手段記載の 「最適パラメータ探索プログラム」 が有す る前記初期世代設定ステップ、 前記評価ステップ、 前記淘汰ステップ、 前記交叉 ステップ、 前記突然変異ステップおよび前記局所最適化ステップとを有し、 前記 適応度は、 前記各個体の前記記号列に相当する仮定された前記構造パラメータか ら算出される前記回折パターンの予想値が、 前記回折パターンの実測値に対して どの程度一致するかを示す指数であることである。
.本手段では、 放射線回折パターンに基づく物質構造の推定が、 前述の第 2 3手 段に相当する強力な探索能力を持つプログラムによって行われる。 その結果、 本 手段によれば、 従来は計算時間が膨大にかかって実際上不可能であった複雑な複 教パラメータの広域探索問題が、 実用的な計算時間内に解けるようになるという 効果がある。
(第 2 7手段)
本発明の第 2 7手段は、 コンピュータにより実行可能な 「放射線回折データに 基づく物質構造推定プログラム」 である。 本手段は、 所定の試料に照射された放 射線が形成する回折パターンに基づいて、 当該試料を構成している物質の構造を 規定する構造パラメータを推定する機能を、 所定のコンピュータに発揮させるベ きコンピュータ ·プログラムであることを前提にしている。
本手段の特徴は、 各世代のポピュレーシヨンを形成する複数個の個体のそれぞ れは、 前記構造パラメータに対応する記号列を含んでおり、 これらの個体のそれ
ぞれがもつ適応度は、 当該個体に対応したこの構造パラメータから算出される回 折パターンの予想値が、 前記回折パターンの実測値とどの程度一致するかを示す 指標であって、 この構造パラメ一タの各要素がある程度の多様性をもつて分布す るように、 これらの個体を生成して初期世代ポピユレーションとする生成ステツ プをもち、 この初期世代ポピュレーションから淘汰ステップ、 交叉ステップおよ び突然変異ステップを含む所定の手順に従って世代交代を重ねるうちに、 当該世 代ポピュレーションの中にこの適応度がより高い前記個体が生成されることを 待ち、 もって前記構造パラメータの最適化を図る G A (遺伝的アルゴリズム) の 中に、 前記適応度に関する局所最適化操作を所定の前記個体に対して行う局所最 適化ステップが組み込まれていることである。 本手段はさらに、 この局所最適化 ステップが、 前記 G Aで生成される全世代のうち一部にあたる複数の特定世代に おいて、 当該世代の前記ポピュレーションのうち少なくとも一部にあたる特定個 体を対象にする演算ステップであることと、 前記 G Aで生成される全世代のうち 少なくとも一部にあたる複数の特定世代において、 当該世代の前記ポピユレーシ ョンのうち一部にあたる特定個体を対象にする演算ステップであることとのう ち、 少なくとも一方であることを特徴とする。
. 本手段では、 放射線回折パターンに基づく物質構造の推定が強力な探索能力を 持つハイブリッド G Aを利用して行われる。 その結果、 本手段によれば、 従来は 計算時間が膨大にかかって実際上不可能であった複雑な複数パラメータの広域 •探索問題が、 実用的な計算時間内に解けるようになるという効果がある。
なお、 本手段についても、 前述の第 1手段に従属した第 2手段〜第 1 4手段の うちいずれかに相当する限定を付けた各種ヴァリェ一シヨンが実施可能であり.、 それぞれに相当する作用効果が得られる。
( 3 ) 記録媒体
(第 2 8手段)
本発明の第 2 8手段は、 コンピュータ読み取り可能な記録媒体である。 そして 本手段の特徴は、 前述の第 2 3手段〜第 2 5手段のうちいずれかである 「最適パ ラメータ探索プログラム」 と、 前述の第 2 6手段〜第 2 7手段のうち一方である
「放射線回折データに基づく物質構造推定プログラム」 とのうち、 少なくとも一 方が記録されていることである。
本手段によれば、 これらのプログラムの保存および流通が容易になる。
2 . 装置発明
(第 2 9手段)
本発明の第 2 9手段は、 「ハイプリッド G A搭载コンピュータ」 である。 本手 段の特徴は、 前述の第 2 3手段〜第 2 5手段のうちいずれかである 「最適パラメ ータ探索プログラム」 と、 前述の第 2 6手段〜第 2 7手段のうち一方である 「放 射線回拆データに基づく物質構造推定プログラム」 とのうち、 少なくとも一方が インストールされたコンピュータであることである。
本手段のコンピュータにより、 これらのプログラムの実行が可能になり、 その 結果、 多次元の広域で最適パラメータを精密に探索することや、 今まではできな かった物質構造の決定ができるようになる。
(第 3 0手段)
本発明の第 3 0手段は、 「ハイプリッド G Aを搭載した解析装置」 であり、 前 述の第 2 3手段〜第 2 5手段のうちいずれかである 「最適パラメータ探索プログ ラム」 と、 前述の第 2 6手段〜第 2 7手段のうち一方である 「放射線回折データ に基づく物質構造推定プ ΰグラム」 とのうち、 少なくとも一方を実行可能な解析 ,装置であることを特徴とする。
本手段の解析装置により、 当該装置がコンピュータに属するか否かの判断に関 わりなく、 これらのプログラムの実行が可能になる。
(第 3 1手段)
本発明の第 3 1手段は、 「放射線回折パターンによる物質構造推定装置」 であ り、 所定の試料物質に放射線を照射してこの試料物質から生じる回折パターンを 測定する測定装置と、 この回折パターンから得られた実測データに基づいた解析 を行うことにより当該試料物質の構造を推定する第 2 9手段のコンピュータお よび第 3 0手段の解析装置のうち一方とを有することを特徴とする。
ここで、 上記測定装置と上記コンピュータまたは解析装置とが同じ敷地にある
か否かとか、 両者の間で行われる回折データの移送がオンラインかオフラインか と力 \ 両者の所有権ないし使用権の帰属先が同一力否かとかは、 本質的な問題と はならない。
本手段によれば、 試料物質に放射線を照射して回折パターンを測定し、 この回 折パターンに基づいて当該試料の物質構造を決定するまでの一連の操作手順を 一貫して行うことができる。 しかも、 前述のように、 従来は現実的なコストや期 間の範囲内ではできなかった物質の構造決定までが可能になるという効果があ る。
図面の簡単な説明 図 1は、 単結晶試料と粉末試料とで X線回折パターンを比較して示す組図であ る。 同図のうち、 図 1 (a) は、 単^晶試料で生じる X線回折とその回折パ^ー ンとを示す模式図であり、 図 1 (b) 粉末試料で生じる X線回折とその回折環と を示す模式図である。
図 2は、 本発明の中核をなす HGAの第一特徴を従来技術と比較して示す組図 である。 同図のうち、 図 2 (a) は従来技術 1としての HGAの概要構成を示す 流れ図であり、 図 2 (b) は従来技術 2としての HGAの概要構成を示す流れ図 であり、 図 2 (c) は本発明の実施形態での HG Aの概要構成を示す流れ図であ る。 '
図 3は、 本発明の中核をなす HG Aの第二特徵とその作用とを示す概念図であ る。
図 4は、 X線回折の比較試験に供された各種粉体試料の物質構造を示す組図で ある。 同図のうち、 図 4 (a) は P d ( t m d t ) 2 の、 図 4 (b) は Au ( t md t) 2 の、 図 4 (c) はシチジンの、 図 4 (d) はタウリンの、 図 4 (e) は 1一 F c AqH(C 1 O4)の、 図 4 ( f ) はコハク酸プレドニゾロンの、 それ ぞれ立体分子構造および結晶構造を示す斜視図である。
図 5は、 本発明の一実施例での HG A収束速度を両従来技術と比較して示すグ
ラフである。
図 6は、 本発明によって決定された 1— F c AqH(C 104)の物質構造を示 す斜視図である。
図 7は、 本発明の実施形態としての物質構造の決定方法の手順を示す流れ図で ある。
図 8は、 粉末試料から得た回折環の強度分布を例示する実測データのグラフで ある。
図 9は、 分子中の三次元的な原子配列と結晶構造どを模式的に示す斜視図であ る。
図 1 0.は、 単位格子とその格子定数とを例示する模式図である。
図 1 1は、 本実施形態がもつ格子定数決定プロセスの手順概要を示す流れ図で ある。
図 1 2は、 回折環の X線強度分布データにおけるピーク位置を例示するグラフ である。
図 1 3は、 強度分布の実測データに含まれるバックグラウンド散乱を例示する グラフである。
図 1 4は、 本実施形態がもつ背景散乱除去プロセスの作用を示す組図である。 同図のうち、 図 14 (a) は粉末試料 C s P b C l 3からの X線強度分布実測デ —タのグラフであり、 図 14 (b) はガラスキヤビラリ一から生じるハローパタ ,ーンを示すグラフである。 また、 図 14 (c) は空気散乱の強度分布を示すダラ フであり、 .図 14 (d) は粉末試料からの温度散漫散乱が示す強度分布のグラフ であり、 図 14は (e) 実測データに各背景散乱をフィッティングさせた結果を 示すグラフである。
図 1 5は、 基本構造決定プロセスで決定される構造パラメータの種類を示す組 図である。 同図のうち、 図 1 5 (a) は構造パラメータのうち分子の位置 (X , y, z) を示す斜視図であり、 図 1 5 (b) は構造パラメータのうち分子の姿勢 (θ, φ, φ) を示す斜視図である。 また、 図 1 5 (c) は構造パラメータのう ち複数の分子内回転角 τ iを示す斜視図である。
図 1 6は、 構造精密化プロセスにより調整されるサイズパラメータを示す模式
図である。
図 1 7は、 構造精密化プロセスによるフイツティング結果例 1を示す強度分布 グラフである。
図 1 8は、 構造精密化プロセスによるフィッティング結果例 2を示す強度分布 グラフである。
図 1 9は、 本実施形態で使用するハイプリッド G Aの処理手順を示す流れ図で ある。
図 20は、 格子定数決定プロセスで HG Aが行う格子定数のグループ化を示す 模式図である。
図 21は、 パラメータのグループ化をしないと生じる不都合を例示する組図で ある。 同図のうち、 図 21 (a) は親個体の記号列に相当する格子定数をもつ単 位格子を示す模式図であり、 図 2 1 (b) は子個体の記号列に相当する格子定数 をもつ単位格子を示す模式図である。
図 22は、 格子定数決定プロセスの HG Aでの三斜晶系の交叉パターンを示す 組図である。 同図のうち、 図 22 (a) は交叉パターン 1の、 図 22 (b) は交 叉パターン 2の、 図 22 (c) は交叉パターン 3の、 それぞれ親個体と子個体と を比較して示す模式図である。
図 23は、 格子定数決定プロセスの HG Aでの単斜晶系の交叉パターンを示す 組図である。 同図のうち、 図 23 (a) は交叉パターン 1の、 図 23 (b) は交 叉パターン 2の、 図 23 ( c) は交叉パターン 3の、 それぞれ親個体と子個体と を比較して示す模式図である。 なお、 上記各図中で使用されている符号のうち主たるものは、 以下のようなも のである。
P 1 格子定数決定プロセス (ハイプリッド G Aで最適パラメ- -タ探索)
P 2 背景散乱除去プロセス
P 3 空間群絞り込みプロセス
P 4 基本構造決定プロセス (ハイプリッド G Aで最適パラメ^" -タ探索)
P 5 構造精密化プロセス
D :読込ステップ (回折環の X線強度分布データの読み込み)
S O :前処理ステップ (回折角 2 0軸上で強度ピーク位置を抽出)
S 1 :ハイブリ ッ ド G Aステップ
S 1 1 :初期世代設定ステップ (第 1世代ポピュレーションを生成) S 1 0 2 :記録ステップ (当該世代ポピュレーションの各個体を記録) S 1 0 3 :交叉ステップ (親個体を選択して交叉させ新生個体を生成) S 1 0 4 :複製ステップ (生き残る個体を選定し複製して次世代に保存) S 1 0 5 :淘汰ステップ (新生個体および複製個体から選択して淘汰) . S 1 0 6 :判定ステップ (突然変異を起こすか確率的に判定)
S 1 0 7 :突然変異ステップ (特定個体の記号列の一部を強制的に変更)
S 1 0 8 :判定ステップ (特定世代の判定および特定個体の選定)
S 1 0 9 :局所最適化ステップ (特定個体に対し局所最適化操作)
S 1 1 0 :収束判定ステップ (解の収束判定等による終了判定)
S 1 1 1 : インクリメントステップ (世代番号のインクリメント)
S 1 2 :結果出力ステップ (決定された構造パラメ一ダ等を出力)
L :世代交代ループ
L .C :格子定数
•三斜晶系の格子定数 (a , b , c , α , β , y )
•単斜晶系の格子定数 (a, b , c , ]3 )
d :結晶中の格子面間隔 (数 2参照)
t : X線検出器原点の位置ずれ (探索すべきパラメータの一つ)
R :一致度 (格子定数から算出されたピーク位置とその実測データとの差異、 数
3参照)
R w p :信頼度因子 (数 1で定義される数値であり、 低いほど適応度としての信 頼度が高い。 )
発明を実施するための最良の形態
本項は記載内容が大量でありその構成も複雑であるから、 読者が本項の全体像 を把握しやすいように、 先ず目次 (項目のみ) を設けておく。
この目次をご覧になってお判りのように、 本実施形態の説明の順番としては、 先ず物質構造の決定技術の分野において本発明が発揮する効果を理解していた だくために、本発明の実施によって得られた研究成果を先に提示する。 しかる後、 そのような研究成果を得るには、 具体的にどのような構成の実施形態で本発明が 実施されていたのかを説明する。 '
[目次]
1. 本実施形態の.意義
(1) 巨大設備での先端的研究
(2) 実験室レベルへの簡易化
2. 本発明の実施例
(1) 本発明の実施形態がもつニ大特徴
(2) 本発明の実施例 1, 2と比較例との対比
(3) 実施例で実施された解決手段
3. データ解析方法の全体構成
(0) 解析手順の概要
(1) 格子定数決定プロセス
(2) 背景散乱除去プロセス
(3) 空間群絞り込みプロセス '
(4) 基本構造決定プロセス
(5) 格子定数決定プロセス
4. 格子定数決定プロセスでの HG A
(1) HGAの概要
(2) HGAの詳細
5. 基本構造決定プロセスでの HG A
(1) HGAの概要
(2) HGAの詳細
6 . その他の実施例 1 . 本実施形態の意義 この項では、 本発明の 「放射線回折データに基づく物質構造の推定方法」 及び その関連発明の実施形態と、 これらの中核技術たるハイプリッド G Aの実施形態 とについて、 この分野の他の研究者等にも実施可能な理解が得られるように、 明 確かつ十分に説明する。 ここに記載されていることは、 おおよそ発明者らが実際 に X線回折環の測定試験おょぴそのデータ解析を行って好結果を得たという実 績に基づいている。
( 1 ) 巨大設備での先端的研究
前述めように、 発明者らは SPring- 8 (大規模設備の固有名詞:本註以下略) で 生成される世界最高クラスのエネルギー強度ないし輝度を持つ放射光 X線を用 い、 各種の試料物質を対象にその構造解析ないし構造決定に取り組んできた。 そ して SPring-δによれば、 前述のようにその X線の強度ないし輝度が抜群に高いの で、 ほんの数 m g程度の粉末試料からでも、 他の設備では得られないほど極端に 鋭く立ち上がったピークを多数含む世界最高精度の回折環データが得られる。 ところが、 これだけ高い精度で回折環の実測データが得られるようになると、 逆にこの計測精度に対し、有効にデータ解析を行って物質構造を決定することが できるほどの強力なデータ解析方法がなかった。 それ故、 今までは SPring-8で回 折環が測定されても、 そのデータに基づいて構造決定を行うことができず、 せ ό かくの SPring-8の測定能力を生かし切れていないという皮肉な状態が続いてい た。
そこで発明者らは、 前述の発明を完成させ、 以下に記載する形態で本願発明を 実施することにより、 SPring- 8で粉末試料に高エネルギー X線を照射して得た回 折環の実測データに基づいて、 各種の物質の構造を決定することができるように した。
その結果、 従来は構造決定の信頼性も精度も低く、 間違いも多かったために、
医薬品業界では構造決定とは呼ばず 「構造予測」 と位置づけていたものを、 十分 な確度と精度とを持って 「構造決定」 できるようになった。 すなわち、 医薬品に 使われる有機低分子の構造決定が、 極めて高い実測データとの一致度 (例えば 9 8 % , 信頼度因子 R w p = 2 %) をもってできるようになつており、 その際の誤 差は、単" f立格子の各辺でわずか 0 . 0 0 0 1 n m程度、原子の配列でも同じく 0 . 0 0 0 1 n m程度と推定される。
このようにして世界で初めて決定した物質構造の数々については、 これまでに も発明者らが学会の講演会や論文で発表してきた。 し力 し、 本願発明の物質構造 の決定技術それ自体と、 その中核技術たるハイプリッド G Aとについては、 本願 の出願までに具体的に公開したことがない。
( 2 ) 実験室レベルへの簡易化
本願発明者らは、 前述のように世界最高クラスの大規模設備による先端的な研 究を進める一方で、 このような物質構造の決定方法を大学や企業に普及している 実験室レベルの普及型設備でも実施することを試みた。 .
その結果、'大学や企業の実験室に普及しているような X線回折装置で測定した 回折環のデータを解析しても、 前述の SPring- 8での測定データを用いて行った物 質構造の決定に準ずる成果を上げられるようになった。 しかも、 そのデータ解析 に使用したのは、 上級機とはいえ市販の P Cであった。
ここで、 SPring - 8のような大規模設備と実験室レベルの普及型設備との間に、 X線回折装置としてどのような違いがあるかというと、 本質的には X線強度とェ ネルギー分解能、 そして X線の平行度において大規模設備の方が優れているとい うことである。 すなわち、 X線強度の違いは、 短時間測定が可能か否かの違いに つながり、 ひいてはごく微量の試料による測定の可否につながる。 また、 ェネル ギー分解能の違いと X線の平行度の違いとは、 そのまま S ZN比の違いとなって 現れる。 要するに、 X線回折環データではピーク重複などによってただでさえ情 報量が少ないというのに、 大規模設備に比べて普及型設備ではいつそう少ない情 報量しか与えられないというわけである。 それゆえに、 普及型設備で測定された 回折データに基づいての構造決定は、 大規模設備に比べていっそう難しくなるわ
けである。
また、 このように世界最高レベルの大規模設備かち実験室レベルの普及型設備 に簡易化して本願発明を実施できるようにするにあたり、データ解析手法には特 筆すべき変更点はない。 すなわち、 本願発明の中核となるハイブリッド G Aにつ いては基本的に同一のものを同一手法で使用しており、 データ解析プログラムも 基本的に同一なら、 それを走らせる P Cも同一である。
したがって、 本実施形態のように、 本発明は、 どこの大学や 業であっても自 前で用意できる程度の普及型設備でも、物質構造の決定を進められるという広範 な普及性をもつ。 その結果、 本発明によれば、 大規模設備がなくてもそれに準ず る結晶構造ないし物質構造の決定ができるようになるから、構造決定を要する研 究の費用対効果およびペースが劇的に向上することが期待できる。
2 . 本発明の実施例
( 1 ) 本発明の実施形態がもつニ大特徴
本発明の実施形態たる「放射線回折データに基づく物質構造の推定方法」では、 格子定数決定プロセスと基本構造決定プロセスとで、本願発明の中核となるハイ プリッド G Aが使用されている。 物質構造の決定方法としての本実施形態の詳細 については後に譲り、 ここでは、 このハイブリッド G A ( 「本 H G A」 と呼ぶ) がもつ特徴点のうち二つだけについて、 概念的に説明するものとする。
•第一特徴:局所最適化操作が散在 '
本 H G Aがもつ第一の特徴は、 図 2 ( c ) に示すように、 G Aの世代交代を重 ねるうちに分布した複数の世代 (特定世代) において局所最適化操作が行われ、 しかもその対象となる個体 (特定個体) は例えば一つというようにごく少数であ ることである。
ここで、 特定世代は 「分布した複数の世代」 である旨の表現は、 全世代のうち に特定世代が飛び飛びに広く散在する場合だけではなく、世代交代する毎に特定 世代があり特定世代が連続する場合をも含む。 それゆえ、 本 H G Aを示す図 2 ( c ) では、 ラマルキアン G Aを示す図 2 ( b ) との差異をより際だたせるため
に、 隔世で (つまり飛び飛びに) しか局所最適化が行われないように描いたが、 世代交代毎に局所最適化が行われるように描いても良い。
すなわち、 本実施形態で使用されているハイプリッド G Aでは、 局所最適化操 作が行われるのは時折でしかなく、 その対象となる個体はポピュレーシヨンのう ちごく少数でしかない。 具体的には、 特定世代は世代交代のうち所定周期 (例え ば毎世代とか、 あるいは二三世代毎ないし十世代毎と力 で現れる。 そして、 当 該世代のポピュレーション (例えば個体数で千個とか五百個と 、 あるいは絞り 込んでもつと少数個とか) のうち特定個体の数は、 例えば一個だけとかせいぜい 二三個ないし数個とかの程度である。 そのうち本実施形態で最も多用した設定は、 特定世代は毎世代 (つまり全世代) であり、 各世代のポピュレーションのうち特 定個体は一個だけであった。 それゆえ、 本実施形態では、 演算量の大きい局所最 適化操作が行われる回数が新生個体の発生個数に比べて極めて少なく抑制され ている。
ここで、 特定世代の分布を、 飛び飛びにではあっても全世代のうちほぼ全域に 散在するように設定しているのは、 単に局所最適化操作の回数を減らして演算負 荷を軽減したいというだけではない。 それだけではなぐ、 進ィ匕に対する方向性が 与えられる程度が、 世代交代の全域でほぼ均等になるようにという意図もあって のことである。
また、 特定個体の数が当該ポピユレ一ションのうち一つとかというように極め て少ない数に限定されているのは、 局所最適化操作の回数を減らして演算負荷を 軽減したいというだけではない。 それだけではなく、 なるべく特定世代の数を增 やして頻繁に進化の方向性を与える操作をしたいという意図もあってのことで ある。
それゆえ、 世代交代する毎に全ての新しい世代が特定世代となり、 その特定世 代での特定個体の数は極めて少数 (例えば一つだけ) であるという実施形態が、 おそらく最良の実施形態である。 なぜならば、 局所最適化操作の行われる回数が 新生個体数に対して極めて小さいので、 ラマルキアン G Aに比べて演算負荷が劇 的に低減されておりながら、 継続的して方向性が適度に与えられて進化が加速さ れるからである。 しかも、 ラマルキアン G Aとは違い、 局所最適化される個体の
数に比べて新生個体の数の方が圧倒的に多いので、 ポピュレーションを構成する 個体の多様性が損なわれることなく世代交代が進めちれる。
さて、 このように所定世代あたりの局所最適化操作の回数が、 図 2 ( b ) に示 す従来技術 2に比べてごく少数であるから、 本 H G Aでは遺伝的アルゴリズムが 本来持っている高速性が損なわれることがない。 それでいながら本 HG Aでは、 時折行われる局所最適化操作によって G Aに進化の方向性ないし指向性が導入 されているので、 進化に方向性が与えられていない通常の G Aに比べ、 広域的な 最適解に対する収束性が格段に向上している。 すなわち、 図 2 ( a ) に示す従来 技術 1のように、 確率的な探索しかできない G Aが最適値の近傍に収束するまで、 かなり長い時間を待っていなければならないということはなくなる。
その結果、 多峰性のきつい多次元パラメータ空間を探索する場合であっても、 従来技術 1および従来技術 2のいずれに比べても広域的な最適解に達するまで の演算量が桁違いに小さくなつている。 すなわち、 探索すべきパラメータ空間の 次元数 (つまり自由度) が高くその多峰性も強い場合であっても、 局所最適 陥 穽に捉えられることが避けられ、 極めて効率よく広域的な探索を進めることが可 能になる。 '
したがって、 本 H G Aによれば、 パラメータの数が多すぎたりパラメータ空間 の多峰性がきっかったりして従来は解けなかったような最適化問題を、 実用的な 演算時間で精密に解くことができるようになる。 つまり、 本 H G Aによれば、 演 算負荷が小さく高速であるばかりでなく、 極めて効率的に広域探索を進められる から、 いず Lの従来技術でも実際上できなかった多数パラメータの広域最適化が できるようになる。
•第二特徴:局所最適化操作の対象選択
さて、 ポピュレーションの多様性を確保する上でも、 演算負荷の都合上でも、 新生個体全てを局所最適化できず、 上記のように局所最適化操作が稀にしか行わ れないとするならば、 次にはその個体をどう選ぶかを工夫しなければならない。 そこで本 H G Aは、 その第二の特徴として、 特定世代のポピュレーションのう ちから局所最適化の対象個体 (特定個体) を選ぶにあたり、 G Aの淘汰過程でい うエリ一ト戦略のように適応度の高い個体を選ばず、 むしろ適応度の低い個体を
選んでいる。
本 H G Aでは何故このような選択志向を取っているかというと、 図 3に示すよ うに、 当該ポピュレーションのうちで適応度の低い個体の中にこそ、 局所最適化 を施せば広域的な最適解 ( 「正解」 と呼ぶ) に至る個体が紛れている可能性が高 いからである。
さて本 H G Aでは、 当該世代のポピュレーションの中で適応度が比較的低い劣 等グループから特定個体を選定するにあたって、具体的には「 ルーレツ 卜選択」 (より詳しくは 「値の制限付き逆ルーレット選択」 ;) と名付けた選定方法を採つ ている。
この方法では、 先ず当該世代 (つまり特定世代) のポピュレーションに属する 個体のうち、予め設定した割合に相当する適応度の高い個体(例えば上位 1 0 %) をエリートグループとして除いておく。次に、残りの (この例では下位 9 0 %の) 個体に適応度で序列を付け、適応度が最悪の個体(0に該当)から最良の個体(1 に該当) までを実数 0〜1の範囲に等間隔で割り振る。 しかる後、 一様乱数 αを 発生させ、 0〜αの範囲に収まる個体で 「劣等グループ」 を構成する。 そして、 この劣等グループに属する個体を改めて適応度の序列に従って実数 0〜 1の範 囲に割り振ったうえで、 一様乱数 J3を発生させ、 この に相当する個体をこの劣 等グループから選択する。 こうして選択された個体を特定個体とし、 当該ポピュ レーシヨンのうちこの個体にだけ局所最適化を施す。 ここで、 特定個体の数が複 数に設定されている場合には、 この処理を複数回繰り返すようにするか、 あるい は一様乱数 をその回数だけ発生させで劣等グループから指定個数の特定個体 を選び出すようにする。
この 「逆ルーレッ ト.選拆」 を本 H G Aに導入して特定個体の選択を行うと、 適 応度の高い個体を優先的に特定個体に選ぶ通常のルーレツト選択に比べて、 どの 程度の効果があるかを次の表 1に示す。
[表 1 ]
すなわち本 H G Aで、 特定個体の平均的な適応度が 0 · 2 5付近になるように 設定した 「逆ルーレッ ト選択」 をもって局所最適化操作の対象個体を選択するよ うにした場合には 同 0 . 2 5付近のルーレッ ト選択を採用した場合に比べ、 広 域的探索能力が飛躍的に向上している。 同表にあるように、 本願発明者らが行つ た数値解析例では、 自由度 1 2〜1 4の多峰性パラメータ空間を広域的に探索す る時間が、 おおむね l Z l 0 0〜 1 / 2 0 0程度に短縮されている。
それゆえ、 特定個体の選定方式に逆ル レツト選択を導入すれば、 通常のルー レツ ト選択方式に比べて二桁以上も本 H G Aの探索能力が向上することが分か る。 その結果、 本 H G Aによって自由度の数が 2 0を超える物質構造モデルにつ レヽても、 回折環データを解析して構造決定ができるようになっている。
余談ながら、 発明者らは仲間内で、 ある世代のポピュレーションのうち適応度 の低い個体のことを「ォチコボレ」 (劣等生や落ち穂の意) と呼んでいる。また、 このような志向で特定個体の選択をすることを 「ォチコボレ拾い」 (落ち穂拾い "gleaning"に日本語では発音も意味も似た言葉) と、 呼び習わしている。
表 1の基になった複数の実施例では、 分子が百個程度の原子からなり決定すベ き自由度が 1 2〜 1 4程度の物質構造を決定するために、 本発明のプログラムを 1, 0 0 0ポピュレーションで走らせて回折環データを解析している。 この際の 特定世代の出現頻度は毎世代毎にであり、 各世代での特定個体の個数は一つであ る。 また、 表 1の各実施例で物質構造決定の対象とした粉体試料の物質は、 後述
の実施例 1や実施例 2で構造決定されたものと同じである。
そして、 まさにこれらの実施例で計算時間が異様に短くなる現象が発現し、 そ の原因を追及したところ、 発明者らは 「逆ルーレッ ト選択」 に該当するプロダラ ムミスを発見した。 すなわち、 異様に収束が速かった実施例では、 プログラム中 のバグにより意図せずに 「逆ルーレッ ト選択」 方式で特定個体が選ばれているこ とが分かった。 その僥倖の結果、 適応度の低い個体を優先的に選択して局所最適 化した方が、 最適パラメータの広域探索に要する計算時間が劇的に短縮されるこ とを発明者らは発見することができた。
ただし、 表 1のデータはこのような発見をしたときのものであり、 H G Aを用 いた本発明のプログラムでは、 ポピュレーションの個体数など設定パラメータに 未だ調整の余地を残していた。 それゆえ、 本プログラムの設定パラメータを適正 にチューニングすれば、 表 1中に記載された計算時間をさらに短縮できる可能性 力 sある。
.まとめ
さて、 以上を簡単にまとめると、 G Aと局所最適化とが互いに補完し合って多 峰性のパラメータ空間であっても効率的に広域探索を行う.ことができるように、 本 H G Aは第一特徴および第二特徴のニづの特徴を有する。 すなわち、 第一特徴 は、 G Aと局所最適化とをどのように組み合わせるかを工夫して、 局所最適化操 作の頻度を減らすことである。 そして第二特徴は、 ポピュレーションから局所最 ;適化する個体をどう選ぶかを工夫して、 その個体が局所最適化によって正解 (す なわち広域的最適解) に至るものである確率をなるベく増すことである。 . なんとなれば、 ふつう局所最適化を G Aに導入する狙いは、 G Aのもつ広域的 な探索を高速で (つまり小さい演算量で) 行う能力を、 局所最適化のもつ局所的 な精密さで補うことにあるからである。
すなわち G Aには、 広域的な探索を高速で行うことができるという長所がある 一方、 遺漏が生じやすく、 しかも詰めが甘いという短所がある。 逆に局所最適化 には、 広域的な最適値の近傍からスタートすれば、 遺漏なく精密にその最適値に 到達することができるという長所がある一方、 広域的な探索には向かないという 短所がある。 そこで本 H G Aでは、 前述の第一特徴および第二特徴を併せ持つこ
とにより、 G Aと局所最適化とが極めて巧妙に組み合わされて、 それぞれの長所 が最大限に生かされるようになった。
( 2 ) 本発明の実施例 1, 2と比較例との対比
本実施.形態の効果は、 次の表 2を参照すれば一目瞭然である。
ほ 2 ]
この表は、 本実施形態の 「放射線回折データに基づく物質構造の推定方法」 に よって決定された構造が決定された 6種類の物質 (a〜 f ) を、 その立体分子モ デルの自由度と併せて一覧表にして示したものである。 この表には、 二種類の実 ,施例 (実施例 1および実施例 2 ) と比較例とで、 その物質の構造決定にかかった 解析時藺とその結果の一致度とが、 互いに比較できるように提示されている。
(実施例の概要)
ここで、 実施例 1というのは、 前述の SPring- 8で測定した世界最高レベルの精 度をもつ回折環データに基づき、 本実施形態の方法により粉末試料の物質構造を 決定した本発明の実施例である。
—方、 実施例 2では、 実施例 1と同じ 6種類の粉末試料について X線回折環デ ータを測定する装置として、 実施例 1の SPring-8とは異なり、 発明者らの属する 大学の実験室に設置した X線回折測定装置を使用している。 この測定装置は、 発 明者らの出した要求仕様に基づき、 株式会社リガク (固有組織名) によって制作
されたものである。 そして、 この測定装置の取得費用は五千万円程度 (おおむね 四十万米ドルに相当) で済んでおり、 この額は SPring- 8の建設に要した設備投資 に比べてわずか千分の一ほどである。 なお、 同装置のスペックは、 おおむね以下 の通りである。
• X線の波長: 0. 7 [A] (SPring- 8と同程度)
• X線のエネルギー密度:正確には分からないが、 おそらく 1 0 8 [光子数/ 秒 mm2(mrad)20.1%バンド幅] 程度 (SPring-8の千分の一程度) '
'センサの解像度: 50 [ πι] X 50 [μπι] (SPring- 8と同程度)
そして比較例というのは、 実施例 1と同じ SPring-8で測定したデータを解析す るのに、 従来技術.1の手法を採用してみたものである。 ここで、 比較例に従来技 術 1を採用して従来技術 2の手法による記載を省いた理由は、 従来技術 2ではあ まりに計算時間が長くなつてしまうからである。 たとえば試料 (e) の場合でも 従来技術 2の手法を適用すると、 計算時間に数日間以上を要してしまった。
(試料物質) '
また、 実施例 1および実施例 2と比較例とは、 前述のようにそれぞれ 6種類の 物質の構造決定を試みており、 実施例 1で決定された物質構造は、 図 4 (a) 〜 (f ) に示されている。 したがって実施例 1とは、 より正確には実施例 1 (a) 〜実施例 1 ( f ) からなる一連の実施例シリーズであり、 実施例 2および比較例 についても同様である。
, ここで、 図 4 (a) は、 P d (tmd t) 2 の分子内での原子の立体配置とそ の分子が作る結晶構造とを示す斜視図である。 同様に、 図 4 (b) は Au (tm d t ) 2 の、 図 4 (c) はシチジンの、 図 4 (d) はタウリンの、 図 4 (e) は 1— F c AqH(C l.Ojの、 図 4 ( f ) はコハク酸プレドニゾロンの物質構造 をそれぞれ示す斜視図である。
参考のため、 これら 6種類の試料物質を次に列挙する。
、a) Pd mdt)2 : Pd-trimethylenetetrathiaf ulvalenedithiolate
( b ) Au mdt)2 '■ Au-trimethylenetetrathiaf ulvalenedithiolate
(c) シチジン : ピリ ミジンヌクレオシドの一種
(d) タウリン : アミノエチルスルホン酸
( e ) 1 -FcAq (C104): 1-ferrocenylethynyl-anthraquinone, C104
( f ) コハク酸プレドニゾロン:合成副腎皮質ホルモン剤の一種
(比較検討)
先ず、 自由度 6の試料物質 (a ) 〜 (c ) については、 決定すべき自由度の数 が少ないので、 比較例であってもデータ解析に数十秒程度の演算時間をかければ 概ね構造決定をすることができ、 同じデータを解析した実施例 1に準ずる一致度 を得ることができる。 '
しカゝし、 同じデータを本実施形態の方法により解析した本発明の実施例 1によ れば、 解析時間は数十分の一〜百数十分の一で済み、 試料物質三つのうち二つま では一致度 (すなわち適応度) も向上している。 ここで、 一致度は二乗誤差に.基 づく実測データと仮想データとのミスマッチの程度であるから、 一致度がゼロに 近づくほど評価は高い (つまり適応度が高い) 。
したがって、 計算時間と一致度との両方から見て、 SPring-8での高精度測定デ ータに基づいて広域的最適値を探索する構造決定能力は、 本発明の実施例 1の方 が従来技術による比較例よりも二桁程度は向上しているものと推定される。
一方、 実施例 2では、 SPring- 8からではなく実験室レベルの X線回折測定装置 で測定をしているので、 実測データの精度が低くなつている。 それにもかかわら ず、 実施例 2でもおおむね実施例 1と同等の解析時間で構造決定をするに至って おり、 求められた最適解も実施例 1のそれに近い。.このようにして、 本実施形態 によれば、 実験室レベルの測定装置での測定データからであっても、 世界最高レ ベルの精度をもつ測定データからと比肩しうる内容で物質構造決定ができると いう効果が確認された。 なお、 一致度に関する比較は、 実施例 1と実施例 2とで は互いに異なる測定データに基づいて物質構造の決定がなされているから、 あま り意味をなさない。
次に、決定すべき自由度がそれぞれ 8 , 1 2, 2 6である試料物質(d )〜( f ) については、 比較例では SPring- 8での測定データに基づいても構造決定をするこ とができなかった。 しかし、 本発明の実施例 1によれば、 自由度 2 6の試料物質 ( f ) に至るまで、 構造決定することができる。
そして、 本発明の実施例 2 ( d ) では、 このタウリンの物質構造が、 大学の実
験室で測定したデータを解析して僅か 0 . 4秒で構造決定するに至っている。 . また、 自由度 1 2の試料物質 (e ) についての構造決定は、 実施例 1 ( e ) で 7秒程度、 実施例 2 ( e ) では 2 9秒程度でなされている。 同物質の構造決定に かかった演算時間は、 基になる測定データの精度が違うので、 実施例 2 ( e ) で は実施例 1 ( e ) の数倍になっているが、 その絶対値は問題にならない程度の短 さである。
ここで、 現況では実施例 1 ( d ) が未実施となっている理由ほ、 ひとえにタウ リンの粉末試料について SPring- 8の利用時間 (マシンタイム) を確保することが できなかったせいである。 し力、し、 タウリンの自由度は 8に過ぎず、 しかも前述 のように、 実施例.2 ( d ) では実験室レベルの装置による測定データによっても 構造決定ができている。 それゆえ、 SPring- 8の利用時間を割いてタウリンの測定 データさえ取ることができれば、 実施例 1 ( d ).でも実施例 2 ( d ) とおおむね 同等の解析結果が得られるものと推察される。
また、 実施例 2 ( f ) が未実施になっている理由も、 本発明によるデータ解析 に供するための実験データを用意することができなかったからである。 つまり、 実験室レベ の X線回折装置では、 測定に一週間から十日間程度の時間が必要で あるが、 この実施例については、 本出願までに同装置の利用時間の配分を受ける ことができなかった。
(表 1との差異)
なお、 実施例 1 ( e ) では 1 2自由度でありながらマ秒間で最適解に達してお り、 前述の表 1中に記載がある逆ルーレツト選択では自由度 1 2〜1 4で約 1時 間を要するという実施例よりも、 二〜三桁ほど解析時間が短くて済んでいる。 こ れは何故かというと、 その理由は大きく分けて次の二つである。
第一に、 表 1中の実施例では解析対象物質の一分子中の原子数が百個程度であ つたのに対し、 実施例 1 ( e ) ではその数が半数以下に減っていて物質構造が簡 素であるからである。 すなわち、 各個体に相当して仮定された物質構造が簡素で あれば、 その粉末試料が形成するであろう X線回折像を算出する演算負荷も小さ くなるからである。
第二に、 表 1中の実施例では、 本発明のプログラムを実行するに当たり H G A
のポピュレーションの個体数を 1 0 0 0個としていたのに対し、 実施例 1 ( e ) では、 ポピュレーションの個体数も最適化されていて、 わずか 1 0〜5 0個体程 度に抑えているからである。 すなわち実施例 1 ( e ) は、 本発明のプログラムを 実行するに当たって、 ポピュレーション中の個体数など幾つかの設定パラメータ を適正に設定した最速値だからである。
さらに、 自由度 2 6の試料物質 ( f ) については、 比較例では全く構造決定を することができず、 本発明の実施例 1によってのみ約 8時間の 析時間をかけて 物質構造の決定を行うことができた。 この解析時間は、 コンピュータを一晩だけ 放置すれば済む程度のものであるから、 十分に実用に耐えるものである。
ここで、 前述のように、 SPring- 8によらず実験室レベルの測定データに基づい てであっても、 本発明の実施例 2では自由度 1 2の試料物質 (e ) までは短時間 のうちに構造決定を行うことができ、 本発明の有効性を実証することができた。 以上のように、 本実施形態によれば、 SPring-8による高精度の回折環データに 基づいて試料物質の構造決定を行う場合、 その決定すべき自由度が 6程度までで あれば、 従来技術よりもずつと短時間のうちにデータ解析を終えることができた。 また、 試料物質 (d ) 以降のように'自由度が 8を超えてしまうと、 従来技術では 構造決定が困難になるが、 本実施形態でほ可能である。 そして、 例えば試料物質 ( f ) のように自由度が 2 6もあっても、 SPring- 8の測定データを数時間で解析 してその物質構造を決定することができることを実証した。
, なお、 試料物質のうち (f ) にあたるコハク酸プレドロ二ゾンの構造は、 本発 明の実施例 1によって初めて決定されたものである。
そして、 本願発明者らを含む研究グループは、 本発明の本実施形態によって決 定された物質構造をすでに幾つかの学会に報告しており、 参考までに学会発表お よび論文のうち主要なものを次に列挙する。
[学会発表]
• 「中性単一分子金属 Ni (tmdt) 2と Au (tmdt) 2の MEM電子密度分布」 藤城雄一'、 西 堀英治'、 高田昌榭'、 坂田誠'、 鈴木和佳子2、 藤原絵美子2、 小林昭子2、 藤原秀紀 3、 小林速男3'4 (名大院ェ'、 東大院理 2、 分子研3、 CREST4) 日本結晶学会 平成 1 5 年年会 平成 1 5年 1 2月 1〜2日 熊本産業文化会館
• 「ベンゼンを加えた大型フエ口セン一アントラキノン共役結合錯体の結晶構造」 吉田雅則、 青柳忍、 西堀英治、坂田誠、 近藤美欧、村田昌樹、 西原寛 (名大院ェ、 東大院理) . 日本結晶学会 2005年 平成 1 7年 1 2月 6日、 7日 ィーダレひ めじ
[論文]
• 「放射光粉末 X線回折法による精密結晶構造解析法の開発と展開」 西堀英治, 日本結晶学会韩, Volume 48 (3) , 2006. p216- 223 、
·' Recent progress in development of single一 component molecular metals. , Kobayashi A, Fujiwara E, Suzuki W, Sasa M, Fujishiro Y, Eij i Nishibori, Masaki Takata, Makoto Sakata, Okano Y, Fuj iwara H, Kobayashi H. , Journal De Physique IV 114 (2004) 419-424
• "Structures of a single-component palladium complex with extended TTF - type dithiolate ligands, bis- (tetrathiafulvalenedithiolato) palladium determined by powder X-ray diffraction. ", Suzuki, W. , Fujiwara, E., Kobayashi, A. , Fujishiro, Y. , Eiji Nishibori. , Masaki Takata. , Makoto Sakata. , Okano, Y. , Kobayashi, H. , Chemistry Letters 32 (2003) 1106-1107.
(従来技術 1 , 2との比較)
図 5のグラフに、 本実施形態と従来技術 1 , 2とで一致度 Rの時間変化を比較 して示す。 すなわち同図は、 回折環データに基づいて物質構造を決定するにあた -り、 各世代のポピュレーションのうち適応度が最も良い最優秀個体の一致度尺が 収束していく様子を、前述の実施例 2 ( e ')に相当する本実施形態と従来技術 1 , 2とで比較して示したグラフである。 ここで、 本実施形態と従来技術 1 , 2とで 共通して解析に供された回折環データは、 1— F c A q H ( C 1 40 ) の粉末試 料を実験室レベルの X線回折装置にかけて測定したデータであり、 前述の実施例 2で使用したものである。
同図に明らかなように、 従来技術 1では、 進化の方向性が G Aに与えられてい ないので、 最優秀個体の一致度 Rがなかなか収束しようとはしない。 逆に従来技 術 2では、 全ての新生個体が局所最適化されるので、 最優秀個体の一致度 Rは演 算の初期段階では急速に向上する。 し力 し、 その際に個体の多様性も急速に失わ
れてしまうらしく、 ほんの数十秒間から先では一致度 Rの収束は遅々として進ま なくなってしまう。
一方、 本実施形態での一実施例 (実施例 2 ( e ) に相当) は、 進化の方向性が 適宜与えられていながら、 ポピュレーション中の個体の多様性も失われないよう になっている。 それゆえ本実施例では、 最優秀個体の一致度 Rがほんの百秒間ほ どで従来技術 2のそれを追い越し、 その後も収束を続ける。 そして、 千秒間 (十 数分間) 程度が経過した頃には、 一致度 Rがおおむね収束しきっており、 その段 階での一致度は従来技術 1や従来技術 2より.もずつと改善されている。
( 3 ) 実施例で実施された解決手段
以上の実施例 1およぴ実施例 2で実施された本願発明の解決手段を、 なるべく 前述の解決手段の項の記載に沿って表現すれば、 以下のようなものである。
[方法発明] . -
•パラメータ最適化方法 ' 実施例 1および実施例 2は、 いずれも本発明のうち 「ノ、イブリツド G Aによる 複数パラメータの最適化方法」 の好ましい実施形態である。 そう解釈すると、 実 施例 1 ( a ) 〜 (f ) および実施例 2 ( a ) 〜 ( f ) のうち未実施の 2ケースを 除く 1 0ケースの大半は、 本発明の複数パラメータの最適化方法にあたる第 1手 段〜第 1 5手段のうち、 第 2手段および第 4手段〜第 6手段を除くいずれにも該 当する。
ここで、 これら大半のケースが第 2手段に該当しない理由は、 これらのケース では、 H G Aの設定が、 世代交代の毎に各世代で一つの個体だけを局所最適化す るようになっているかちである。 すなわち、 初期世代を除く全ての世代がいずれ も特定世代であるようでは、 第 2手段のように特定世代は全世代のうち一部であ るとは、 言い難いからである。
さて、 両実施例の最適化方法は、 各個体を構成する記号列のうち少なくとも一 部は、 所定の物理量に対応した複数のパラメータであり、 これらのパラメータの 適正な組合せを探索することを目的としている。 この方法は、 前提として、 評価 過程と交叉過程と淘汰過程とを繰り返すうちに突然変異過程を適宜交えながら
世代交代を重ねる G A (遺伝的アルゴリズム) を使用する。
そして、 この方法にはいくつかの特徴がある。
先ず、 第一の特徴は、 初期世代を除く全世代で、 各世代のポピュレーションの うちそれぞれ一個体ずつに局所最適化が施されることである。
すなわち、 両実施例では、 原則として特定世代の出現頻度は世代交代のある毎 に (つまり連続した各世代毎に) であり、 当該ポピュレーションのうち特定個体 の数は一個だけということである。 それゆえ両実施例の全ケースは、 いずれも第 3手段に該当している。 ただし、 実施例 1の系統と実施例 2の系統とでは、 特定 世代の分布に若干の違いがある。 すなわち、 実施例 1の各ケースでは、 初めから 特定世代が連続しているが、 一方、 実施例 2の各ケースでは、 第 1 0世代までは 特定世代が出現せず、 第 1 1世代から特定世代が連続して出現している。 それゆ え実施例 2の各ケースは、 第 2手段および第 5手段にも該当している。
このような第一の特徴は、 特定世代の出現頻度と当該世代のポピュレーシヨン での特定個体の個数とに関する特徴であり、 両者の積によって、 一世代当た に 局所最適化操作を行う平均的な回数がおおむね決まる。 そして、 両者のバランス を適正に取りながら、 両者の積を適度に低減することができれば、 計算負荷の大 きな局所最適化操作の回数を減らすことにより、 高速で世代交代を重ねながら、 多様性を保ちつつ進化に適度の方向性を与えることができる。
次に、 この方法の第二の特徴は、 最適化過程で局所最適化操作の対象となる特 定個体を選ぶ際に、 適応度が比較的低い個体の中からも特定個体が選ばれる可能 性があるということである。
すなわち、 両実施例のいずれのケースでも、 特定世代のポピュレーションのう ち適応度が低い方の所定割合 (この割合もランダムに設定される) に属する個体 からなる劣等グループの中から、 ランダム選択法によつて特定個体が選ばれるよ うになつている。 特定個体の選定に際してこのような方法を採ると、 実質的には 適応度の低い個体の方が適応度が高い個体よりも高い確率で選ばれるような弱 者優先の傾向を持つルーレッ ト選択法によって特定個体が選ばれる。 そして、 こ のような特定個体の選択方法のことを、 発明者らは前述のように 「逆ルーレッ ト 選択」 と呼んでいる。 それゆえ、 両実施例の全ケースは第 7手段〜第 1 1手段の
いずれにも該当している。
そして、 この方法の第三の特徴は、 H G Aの淘汰過程では、 当該世代のポピュ レーションのうち適応度が比較的低い個体の方が選択される.確率が高くなる逆 ルーレッ ト戦略を取っていることである。
その結果、 適応度が比較的低い個体であっても (むしろその方が) 、 次世代に 生き残る可能性が高くなつている。 ただし、 せっかく広域的な最適値にまで達し た個体が生き残れないのでは困るから、 当該世代の前記ポピュレーシヨンのうち 適応度が最高のトップ個体だけは世代交代の際に必ず生き残るという トップ保 存戦略も併用されている。 それゆえ、 両実施例の全ケースは第 1 2手段〜第 1 4 手段のいずれにも該当している。
•データ解析方法
次に両実施例は、 本発明の 「パターンマッチングによるデータ解析方法」 の実 施形態でもあり、 .前述の解決手段のうち第 1 6手段に該当する。
すなわち両実施例ではさらに、 前述の 「ハイプリッド G Aによる複数パラメ一 タの最適化方法」 において、 次のような特徴を持つ。 先ず、 各前記個体がもつ前 記適応度は、 当該個体の前記記号列に含まれる前記複数のパラメータに対応する 前記物理量を仮定すると数値演算により決まる仮想データのパターンが、 実測デ —タのパターンとどの程度一致しているかを示す指標である。 そして、 この適応 度が高い前記個体を生成することによって、 当該個体の前記仮想データと前記実 測データとの間でパターンマッチングを行い、 前記物理量を推定することを目的 として前記実測データの解析を行う。 ·
•構造決定方法
両実施例はまた、 本発明の 「放射線回折データに基づく物質構造の推定方法」 の実施形態でもあり、 前述の解決手段のうち第 1 7手段〜第 2 0手段ならびに第 2 1手段および第 2 2手段に該当する。
すなわち、 両実施例では前述の 「ハイブリッド G Aによる複数パラメータの最 適化方法」 を、 所定の試料物質に照射された放射線が形成する回折パターンに基 づぃてこの試料物質の構造を推定する物質構造の推定方法に応用している。 そし て、 前述の物理量は主に、 この試料物質の物質構造を決定する構造パラメータで
ある。 また、 各前記個体の前記適応度は、 この試料物質が当該個体に相当するこ れらの構造パラメータをもっと仮定すると生じる回折パターンが、 実測された回 折パターンに対してどの程度一致しているかを示す指標であ 。
ここで、 両実施例で決定している構造パラメータは、 試料物質の結晶構造を規 定する格子定数と、 この試料物質を構成する分子内における三次元的な原子配列 を規定する分子構造パラメータと、 この試料物質の結晶内での三次元的な原子配 列を規定する結晶学的構造パラメータとである。 また、 その回折パターンとは、 その回折強度が同心円状に拡がって分布する X線回折環である。 さらに、 適応度 とは、 この回折環がもつ半径方向への強度分布の実測データと、 仮定された構造 パラメータに基づいて生成される仮定データとが、 どの程度一致しているかを示 す評価関数である。
この物質構造の推定方法を、 第 2 1手段の記載に準拠して表現すると次のよう になる。'
すなわち、 この方法は、 多数の細かい結晶を含む粉末試料の物質構造を特定す るために、 この試料物質に照射された X線回折環がもつ強度分布の回折データに 基づ 、て、 その構造パラメータをデータマッチングにより推定する方法である。 その際に用いられるアルゴリズムは、 前記 造パラメータがコーディングされた 個体を、 ある程度の多様性を持たせて複数個発生させ、 初期世代のポピユレーシ ヨンとする発生過程の後に、 これらの個体の交叉および複製と、 前記データマツ チングの程度を示す適応度を評価してこれらの個体を淘汰する選択と、 確率的に 起こる突然変異とを繰り返す世代交代過程を行う G A (遺伝的アルゴリズム) を 基礎としている。 そして、 前記 G Aでは、 前記世代交代過程の間に複数の世代に おいて、 当該ポピュレ^シヨンの一部である前記個体に対して局所最適化操作が 行われ、 この局所最適化操作の対象には、 当該ポピュレーションのうち前記適応 度が比較的低い前記個体もなる可能性があることを特徴としている。
あるいは、 この物質構造の推定方法を、 第 2 2手段の記載に準拠してプロセス に分けて表現すれば次のようになる。
すなわち、 両実施例の 「放射線回折データに基づく物質構造の推定方法」 は、 放射線としての X線を試料物質に照射して得られた回折環の強度分布データに
基づき、 この強度分布データに適合する物質構造を特定することを目的とする。 そしてこの目的を果たすために、 背景散乱除去プロセスと、 基本構造決定プロセ スと、 空間群絞り込みプロセスと、 基本構造決定プロセスと、 構造精密化プロセ スとが、 順に行われる。
先ず、 格子定数決定プロセスでは、 この試料物質に含まれる結晶の格子定数が 決定され、 次に背景散乱除去プロセスでは、 この強度分布データに含まれている バックグラウンド散乱の影響が除去ないし低減される。 そして、' 空間群絞り込み プロセスでは、 この結晶が属する空閩群の候補が絞り込まれ、 そのうえで基本構 造決定プロセスでは、 この結晶の基本構造が初期的に決定されてこの空間群が一 つに特定される。 後に、 構造精密化プロセスでは、 この基本構造が精密化され てこの結晶を構成する物質の構造がより精密に決定される。
この格子定数決定プロセスおよびこの基本構造決定プロセスでは、 それぞれ G A (遺伝的アルゴリズム) に局所最適化操作を組み合わせたハイブリッド G Aを 利用した物質構造決定が行われる。 このハイプリッド G Aでは、 世代交代の崗に 複数の特定世代で、 当該世代のポピュレーシヨンのうち一部の個体である特定個 体を対象にじて前記局所最適化操作が行われ、 この特定個体には、 当該世代のポ ピユレーシヨンのうちでは実測データとの一致度を示す適応度が比較的低い劣 等グループからも選定される可能性がある。
[ソフトウェア関連発明]
'最適パラメータ探索プログラム
両実施例では、 「最適パラメ一タ探索プログラム」 が使用されており、 このプ ログラムは本発明の第 2 3手段〜第 2 5手段の一実施形態である。 すなわち両実 施例では、 X線回折環のデータ解析に同プログラムが実施されており、 同プログ ラムの広域探索機能により求められた最適パラメータとして、 物質構造が決定さ れている。
•物質構造推定プログラム
同様に両実施例では、 「物質構造推定プログラム」 が使用されているとも捉え ることができ、 そうすると同プログラムは第 2 6手段および第 2 7手段の一実施 形態にも該当する。
•記録媒体
両実施例で使用されている前述の「最適パラメータ探索プログラム」および「放 射線回折データに基づく物質構造推萆プログラム」 のうち少なくとも一方をコン ピュータ読み取り可能な記録媒体に記録したとしょう。すると、その記録媒体は、 本発明の第 28手段の一実施形態に該当する。 なお、 具体的な記録媒体の種類と しては、 発明者らは主として広く市販されている CD— ROMや US Bメモリを 使用している。
[装置発明] し
.· HGA搭載のコンピュータ
両実施例のデータ解析にあたっては、 前述のように市販 PCの上級機ないしヮ ークステーションで上記プログラムを実行している。 この PCは、 3 [GFL0PS]程 度の演算能力をもつもので、 より具体的には、 HP Cシステムズ株式会社 (固有 組織名': 旧株式会社 H I Tが他社と合併して社名変更した) 製の型式名 Silent- S(X (商品名) である。 そしてその構成は、 PCクラスタ (20 CPljお よび 8 CPU) と呼ばれるものである。 なお、 このような PCクラスタを単に P Cやワーク^テーションと呼んでしまうことに抵抗のある向きもあろう力 その 議論は本発明の本質とは関わりがないので、 単に強力な市販 P Cということでお 許しをいただきたい。
そして、 この PCには前述の 「最適パラメータ探索プログラム」 がインス ト一 ルされており、 このプログラムは 「放射線回折データに基づく物質構造推定プロ グラム」 でもある。 それゆえ、 この PCは本発明の第 29手段 「ハイブリッド G A搭載コンピュータ」 の一実施形態に該当する。
• HG A搭載の解析装置
さらにこの PCを解析装置として捉えれば、 この PCはやはり前述の 「最適パ ラメータ探索プログラム」 ないし 「放射線回折データに基づく物質構造推定プロ グラム」を実行可能な解析装置である。それゆえこの PCは、第 30手段たる 「ハ イブリッド GAを搭載した解析装置」 の一実施形態にも該当する。
•物質構造推定装置
両実施例の物質構造決定結果を得るに当たって用いた設備全体は、 当該試料物
質に放射線を照射して生じる回折パターンを測定する測定装置と、 この回折バタ ーンから得られた実測データに基づいた解析を行うことにより当該試料物質の 構造を推定する解析装置とを有する。 ここで、 この測定装置として使用されてい るのは、 実施例 1では SPring- 8であり、 実施例 2では前述の実験室レベルの X線 回折装置である。 一方、 解析装置としては、 両実施例で共通して前述の P Cを使 用している。
それゆえ、 両実施例のうちいずれで使用した 「放射線回折パターンによる物質 構造推定装置」 も、 本発明の第 3 1手段の一実施形態に該当する。
3 . 物質構造決定の手順
( 0 ) 全体像
本発明の実施形態たる 「放射線回折データに基づく物質構造の推定方法」 は、 図 7に示す解析手順 (プロセス P 1〜P 5 ) を踏んで、 粉末試料の物質構造を十 分な確度および精度をもって推定 (すなわち決定) する方法である。 本実施形態 は、 格子定数決定プロセス P 1と、 背景散乱除去プロセス P 2と、 空間群絞り込 みプロセス P 3と、 基本構造決定プロセス P 4と、 構造精密化プロセス P 5とを 有する。
第一に、 格子定数決定プロセス P 1は、 この粉末試料に含まれる多数の微細な ,結晶の格子定数を決定するプロセスである。 すなわち、 このプロセスでは、 当該 結晶の単位格子を定義する格子定数、例えば三斜晶系の結晶と特定されればその 格子定数 (a, b, c , α , β , y ) が決定される。
第二に、 背景散乱除去プロセス P 2は、 本実施形態の入力データ I Nたる X線 回折の強度分布データに含まれているバックグラウンド散乱の影響を、 除去ない し低減するプロセスである。
第三に、 空間群絞り込みプロセス P 3は、 この粉末試料に含まれる微細な結晶 が属する可能性がある空間群を、 ある程度少ない候補に絞り込むプロセスである。 このプロセスでは、 入力データ I Nたる回折強度のピークないし反射の出現位置 に基づき、結晶が取りうる 2 3 0種類の空間群のうちから可能性の低いものを除
き、 可能性が高い空間群を数種類程度に絞り込むことが行われる。
第四に、 基本構造決定プロセス P 4は、 この結晶の基本構造を初期的に決定し て、この空間群を一つに特定するプロセスである。すなわち、このプロセスでは、 前述の空間群絞り込みプロセスで絞り込まれた空間群の候補の中から、 最も確か らしい空間群が決定され、 単位格子内での分子の位置及び姿勢と三次元的な原子 配列とが、 やや粗めの精度で決定される。
第五に、 構造精密化プロセス P 5は、 この基本構造を精密化して、 この結晶を 構成する物質の構造をより精密に決定するプロセスである。 さらに、 この構造精 密化プロセスでは、 分子内での電子密度の分布をも推定ないし決定することがあ る。 ' .
さて本実施形態は、 粉末試料をガラスキヤビラリ一に封入し、 SPring-8 (固有 名詞) の高エネルギー放射光 X線をこの試料物質に照射して実測された回折環の 強度分布データを入力データ I Nとする ώ 入力データ I Nは、 再ぴ図 1 ( b ) に 示すように、 粉末試料で回折した X癱が形成する回折環がもつ強度分布の実測デ ータであるから、 図 8に示すように、 回折角 2 Θに沿って一次元的に展開した回 折 X線の強度分布データである。 そして、 本実施形態では所定のプロセス P 1〜 P 5を順に経て、 入力データ I Nに適合する物質構造が特定され、 出力結果 O U Tとして出力される。 出力結果 O U Tは、 図 9に示すように、 粉末試料に含まれ る多数の微細な結晶の格子定数と、 その微細な結晶を構成する物質の分子が当該 ,結晶内にもつ三次元的な原子配列とである。 ' そして本実施形態では、 格子定数決定プロセス P 1と基本構造決定プロセス P 4との両方で、 G A (遺伝的アルゴリズム) に局所最適化操作を組み合わせたハ イブリツド G Aを利用した試料物質の構造決定が行われている。
このハイプリッ K G Aでは、 G Aの世代交代過程の間に、 複数の特定世代にお いて、 当該世代のポピュレ一ションのうち一部の個体である特定個体を対象にし て、 前記局所最適化操作が行われている。 また、 この特定個体には、 当該世代の ポピュレーシヨンの中で、 実測データとの一致度を示す適応度が比較的低い劣等 グループからも選定される可能性がある。
前述のように、本実施形態の「放射線回折データに基づく物質構造の推定方法」
では、 格子定数決定プロセス P Iと基本構造決定プロセス P 4との両方で、 G A に局所最適化操作を組み合わせたハイプリ ッド G Aを利用した試料物質の構造 決定が行われている。 そして、 これ bの両プロセス P I , P 5自体も、 本願発明 の中核をなすハイプリシド G Aを用いて処理されていることを条件に、 本発明の 「放射線回折データに基づく物質構造の推定方法」 の一実施形態である。
以上で、 本実施形態のうち 「放射線回折データに基づく物質構造の推定方法」 についてその手順構成の概要を明らかにすることができたので 次に各プロセス P 1〜P 5について具体的に説明する。 .
( 1 ) 格子定数決定プロセス
格子定数決定プロセス P 1は、 前述のように、 格子定数を決定するプロセスで あり、 例えば三斜晶系の結晶であれば、 図 1 0に示すように、 単位格子 U Cの各 辺長 a , b , cと各辺がなす角度 α , ]3 , γとの六つのパラメータからなる格子 定数 L Cが決定ざれる。 '
その手順は、 図 1 1に示すように、 先ず読込ステップ Dで、 SPring- 8 (固有名 詞) で粉末試料から得た X線回折環の実測データをコンピュータ (図略) に読み 込んでから、 前処理ステップ S 0でピーク位置を抽出して回折ピーク位置表を作 成する。 ただし、 実施例 2 ( a ) 〜 ( f ) では、 前述のように実験室レベルの X 線回折装置で測定した回折環データに基づレ、たピーク位置表を用いている。
ここで、 回折ピーク位置表とは、 回折環の強度分布データが図 1 2に示すよう' なものである場合には、 その各ピークに回折角 2 Θの小さい方から順に番号を振 つたもめである。 すなわち、 次の表 3に示すように各ピークの回折角 2 Θを列挙 したピークデータの一覧表が、 回折ピーク位置表である。
[表 3]
そして、 Sび図 1 1に示すように、 ハイプリッド GAステップ S 1で、 そのピ 一クデ—タに対するデータマッチングを行って最適な (つまり正解の) 格子定数 を探索し、.格子定数 (a, b, c, α, ./3, γ) .を決定するに至る。 なお、 ハイ プリ ッ ド GAステップ S 1で行われる格子定数決定の具体的な処理内容につい ては、 後ほど 「ハイブリッド GA」 の節を立てて詳しく説明する。
なお、 このプロセスで用いるピークデータに含まれているのは、 ピーク位置に 関する情報だけであって、 ピーク強度に閧する情報は含まれていない。
なぜならば、 回折線の各ピークの位置だけの情報から、 X線の回折が起こる条 件式 (2 d . s i n 0 =え) に基づいて、 各ピークの面間隔 dの大きさを求める ことができるからである。 このとき、 各ピークの面間隔 dは、 面を示す単位格子 の軸の整数分の 1のべク トルの組み合わせであらわされるミラー指数 (h k 1 )
と格子定数 (a , b , c , a , , y ) とを用いて、 所定の関係式から算出され る。 すなわち、 実測データに含まれる全ての (場合によってはほとんどの) ピー ク位置に対応する dを実現できる格子定数 (a, b , c , α , β , γ ) の組合せ を探り出すことができれば、 それをもって正しい格子定数であると決定すること ができる。 このプロセスでは、 この格子定数の探索にハイブリッド G Aを使用し ている。
( 2 ) 背景散乱除去プロセス
.背景散乱除去プロセス Ρ 2は、 前述のように、 X線回折の強度分布データに含 まれている背景 (バックグラウンド) 散乱の影響を除去ないし低減するプロセス である。
すなわち、図 1 3に模式的に示すように、回折環の X線強度の実測データには、 本当に観測したレ、粉末試料自体からの回折 X線め他に、 様々な原因で生じるバッ クグラウンド散乱による X線が混じっている。 そして、 構造決定を行う試料から の回折強度を正確に見積もるためにはバックグラウンドの強度を取り除く必要 がある。 肴近の粉末 X線回折においては、 必要とされる粉末試料がごく'微量であ ることと、 実験の簡便さから頻繁にデバイシエラー法によるデータ測定が行われ ることとから、 粉末試料をガラス製のキヤビラリ一に封入して実験を行うため、 ガラスのハローパターンのためにバックグラウンドが複雑な形状になりがちで ある。 ' さて-、 このようなバックグラウンドを構成する散乱の因子のうち、 主たるもの は次の四つである。
• X線の発生源から粉末試料を経て検出器に至るまでに存在する空気による散乱 •ガラスキヤビラリ一および粉末試料から発生する蛍光 X線の等方的な散乱 .ガラスキヤビラリーからのハローパターンを作る散乱
•粉末試料からの温度散漫散乱
たとえば、 X線回折試料が C s P b C 1 3 の粉末からなる場合には、 図 1 4 ( a ) に示すような X線強度の実測データが得られるが、 この実測データにもこ れら四つの因子による散乱が含まれている。 すなわち、 ガラスのハローパターン
は図 1 4 (b) に示すように、 空気散乱は図 1 4 (c ) に示すように、 温度散漫 散乱は図 1 4 ( d) に示すように、 それぞれ分布している。 一方、 蛍光 X線は、 等方的に散乱することが予め分かっているから、 その分布パターンも明らかであ る。 そこで、 図 1 4 ( e ) に示すように、 これら四つの因子によるバックグラウ ンド散乱を取り除けば、 ほぼ純粋に粉末試料からの回折 X線だけの強度分布を割 り出すことができる。
(3) 空間群絞り込みプロセス
空間群絞り込みプロセス P 3は、 前述のように、 X線回折環の実測データに基 づいて、.結晶が取りうる 2 3 0種類の空間群のうちから可能性の低いものを除き、 可能性が高い空間群の候補を絞り込むプロセスである。
このプロセスでは、 先ほど構造精密化プロセス P 5で求められている格子定数 (a , b , c , α,' β, γ) 力 ら、 粉末試料に含まれる結晶が七つの結晶系 (三 斜晶、 単斜晶、 斜方晶、 正方晶、 三 晶、 六方晶、 立方晶) のうちどれに属する か 決定する。 なぜならば、 X線回折により構造を決定" Τるためには、 結晶系か ら空間群を決定する必要があるからである。
. ここで、 空間群とは、 結晶の原子配列の対称性を記述した群であり、 全ての結 ―晶は 2 3 0個の空間群のどれかに属している。 ちなみに各結晶系に含まれる空間 群の数は、 三斜晶で 2個、 単斜晶で 1 3個、 斜方晶で 5 9個、 正方晶で 6 8個、 ,三方晶で 2 5個、 六方晶で 2 7個、 立方晶で 3 6個である。 これらのうち同一の' 結晶系に属する空間群の違いは、 X線回折データで見ると、 消滅する反射 決定 する消滅則にあり、 消滅則とは、 結晶系からは出現するはずの反射が、 空間群の 対称操作で周期的に消滅する規則を示す。 例えば b軸方向に軸の 1 2の大きさ の並進操作がある場合には、 ミラー指数 (h k l ) が 0 k 0で表される反射のう ち、 k = 2 n + l (奇数) の反射は消滅する。
発明者らは、 空間群を粉末回折データから、 結晶系に含まれる全ての空間群に 対して LeBail解析 (A.Le Bail et al, Mat. Res. Bull.23, 447, (1988》を適用し、 LeBail 解析の信頼度因子の値 Rwpから可能性のある空間群を絞り込む方法を開発した。 ここで、 信頼度因子 Rwpは次の数 1で定義される数値である。
∑w,[r(2 )。fc, -r(2 )c」' | (2
この数 1中で、 Nは観測点の数、 wは第 i番目の観測点に対する荷重であり、 観 測強度の逆数 W=:K(2 ø ^,を用いる。 また、 : (2 ø ( は計,算プロフアイル強度、 : Κ(2 0 0«*は観測プ ファイル強度である。 この方法では、 最初に各結晶系で消滅側を 持たない空間群により Le Bail解析を行う。 この解析から回折反射の形状を決める 回折プロファイルパラメータを求める。 その後、 このプロファイルパラメータを 用いて; 可能性のある空間群全てに対する Le Bail解析を自動で行う。
そして、 Le Bai懈析の結果として得られた信頼度因子 R w pの数値が低い空間 群が、 すなわち現実の状態に該当する可能性の高い空間群であって、 正しい空間 群の候補と-なる。 (そういう意味では、 R w pには 「信頼度'因子」 という呼称よ りも、 むしろ逆に 「不信度因子」 なレ'、し .「過誤確率指数」 といった呼称の方が相 応しい。 )
ここで、 空間群を決定するうえで従来取られていた方法では、 複数の空間群に 対して一つずつ消滅側を確認しょう.とすると、 多大な手間と時間を必要としてい. た。 なぜならば、 実測データと反射位置,とから消滅側を決定し、 空間群を絞り込 んでいこうとすると、 粉末回折データは単結晶回折データと比較して回折強度が 弱いため、 目視できない反射が実際に消滅しているか判明することが難しかった からである。 その結果、 従来法では、 強度データに反射が見られなければ、 正解 であっても候補から外れてしまうことがあり、 正解の空間群が絞り込んだ空間群 から漏れる可能性があった。
一方、 発明者らが開発した方法では、 前述のように、 Le BaH解析空間群を変化 させながら自動で繰り返すので、 結晶系から対象となる全ての空間群を網羅的に 探索することができる。 その結果、 可能性のある全ての空間群を、 正解の候補と
して漏れなく抽出できるようになった。
その実例として、 1一 F c A q H ( C 1 04) つまり 「1一フエ口センアントラ キノン接合錯体プロ トン付加体 (C 1 04) 」 の解析例を次の表 4に示す。
[表 4】
この表に示すように、 単斜晶の空間群に対して軸の及び原点の取替えを含めて 行った 3 8 4例に試したところ、 可能性のある空間群をわずか数分 (実際には 1 分間程度) で 8種類にまで絞り込むことができた。 ここで、 能性のある空間群 の条件としては、 信頼度因子 R w pが 5 %未満のものであるこどを採用し、 同表 ではそのパーセンテージの前に〇印を付けて示してある。 なお、 この際に X線回 折環のデータ解析に用いたコンヒ。ユータは、 前述の市販 P Cである。
( 4 ) 基本構造決定プロセス
基本構造決定プロセス P 4は、 前述のように、 絞り込まれている空間群の候補 の中から最も確からしい空間群を正解として決定し、 単位格子内での分子の位置 及び姿勢と三次元的な原子配列とを大まかに決定するプロセスである。 すなわち、 結晶系、 空間群が決定されたうえで、 単位格子内の大まかな原子または分子の配. 列を決定することを基本構造の決定という。 X線回折データの回折ピークの強度 は、 結晶内の原子の配列を反映しているため、 回折データの強度関係を満足する 大まかな原子配列を決定することで、 基本構造の決定どなるわけである。
さて、.一娘に単結晶 X線回折の場合には、 各回折ピークの強度を独立に求める ことが容易であるため、 この強度を用いで 1 9 8 5年にノーベル賞に輝いた直接 的に結晶構造を決定する方法により基本構造が決定できる。 し力 し、 粉末試料の 回折データの場合には、 前述のように回折環の強度ピークが重なり合ってしまう ので、 各回折ピークの強度を求めることができない。 iのため、 従来の直接的に . 結晶構造を決定する方法では、本実施形態のように粉末試料から得られた X線回 折環データに基づいて構造決定を行うことはできない。
そこで、 本実施形態の基本構造決定プロセス P 4では、 単位格子の実空間中に おける分子の位置姿勢およびその形状を求める実空間法にハイプリッド G Aを 適用して、 粉末回折データから基本構造を決定することができるようにした。 ここで用いた 「実空間法」 とは、 原子もしくは幾つかの原子を集めた剛体 (つ まり分子) が単位格子中で取る位置および向き (つまり姿勢) を決定し、 その剛 体 (分子) の内部にある回転自由度について解を与えて剛体の形状をも決定する 方法である。 すなわち、 図 1 5 ( a ) 〜 (c ) に示すように、 単位格子中の原子
の配列を原子、 剛体 (分子) の位置 (X , y , z ) 'および向きないし姿勢 (Θ , φ , Φ ) と、 内部回転(τ , ,て 2 , τ a' , · · · · ) 'のパラメータで表すものとす る。 そして、 基本構造決定プロセス Ρ 4では、 これらのパラメータをハイブリツ ド G Αによる実空間法で決定する。 ふつう、 決定すべきパラメータの個数は、 分 子が単位格子内で取る位置姿勢の 6自由度分と内部回転の箇所数との和とレ、う ことになる。
基本構造決定プロセス P 4で使用するハイプリッド G Aは、 前述の構造精密化 プロセス P 5で使用するものと基本的には同じものであり、 最適化すべきパラメ ータと適応度の定義と各種の設定などとが異なるだけである。 発明者らが開発し たハイブリッド G Aの詳細については、 後に節を立てて説明する。
( 5 ) 構造精密化プロセス 、 前述のように、 本実施形態での構造精密化プロセス P 5は、 前述の基本構造決 定プロセス P 4で決定された基本構'造の精度を増して精密化するプロセス あ る。 このプロセスでは、 さらに分子内での電子密度の分布をも決定することも、 やろうと ®えばできる。 ·
ここで、 構造精密化とは、 基本構造決定で求められた構造をもとに個々の原子 の位置を最小自乗最適化により求めることである。 粉末回折の構造最適化の手法 としては、 Rietveld法 (H. M. Rietveld, J. Appl. Cryst. 2(1969), 65)が用いられており、 ふつう原子の位置が O.OOlnhi程度の精度で求められる。発明者らはさらに、基本構 造決定と Rietveld法の精密化の流れを円滑にし、 最終の構造精密化には、 Rietveld 法だけでなく、 マキシマムェント口ピー法 (M.Sakata et al, Acta Cr st.A46, 263,(1990)) を組み合わせ構造の精度を高める方法を開発した。 その結果、 粉末回折データか ら決定した物質構造と回折環データとの一致度は 98%程度にも達し、 原子配列の 誤差も O.OOOlnm程度と、 極めて精密な構造決定が可能になった。 そして、 これだ けの精度をもって物質構造を決定することができれば、 新物質の機能予測や医薬 品の開発にも十分に利用可能である。
すなわち、 構造精密ィヒプロセス P 5では、 前述の基本構造決定プロセスと同様 に、 分子を剛体として取り扱い、 基本構造決定と同様の位置 '向き '内部回転の
パラメータを精密化する。 また、 図 1 6に示すように、 剛体全体の大きさを示す 三軸方向のサィズパラメータ (x-size, y-size, z-size)をも最適化すべきパラメータに 採り入れて、 最小二乗最適化により精密化する。 そしてさらに、 有限温度におけ る結晶中の原子は熱振動を起こしており、 このような熱振動の影響は回折パター ンに比較的大きく寄与するから、 剛体全体の熱振動をも精密化した。 .その結果、 分子を剛体として取り扱ったままで、 回折パターンとの一致度を基本構造決定の 場合よりも高めることができる。 '
構造精密化プロセス P 5の結果として、 Pd(dt の決定された構造による X線回 折の実測データとの一致度を示すフィッティンググラフを図 1 7に示し、 同様に Au(tmdt)2の一致度を示すフィッティンググラフを図 1 8に示す。 ちなみに、 実測 データとの一致度としての信頼度因子 の値は、 Pd(dt では 3.6%であり、 Au(tmdt では 1.1%であり、 どちらも原子間の距離、 角度まで含めた高精度な解析 がなされていることが分かる。
さらに、 Pd(dt)2の構造からバンド言 +算により電子状態を計算したところ、. との 物質が半導体であることが導き出されたので、 その予測を確認すべく実際にその 電気伝導度 測定したところ、 やはり半導体的であった。 ごのことから.も、 この ようにして精密化した構造は、 物質の機能を予測するのに十分な精度を持つこと が分かった。
なお、 Pd(dt>2の正式名称は Pd- tetrathiafulvalenedithiolatoであり、 本実施 :例によるこの物質の構造決定の結果については、 前述の文献のうち後者で報告さ れている。読者の便宜のために、 同文献を重ねて次に記載しておく。 " Structures of a single-component palladium complex with extended TTF - type dithiolate l igands, bis- (tetrathiafulvalenedithiolato) palladium determined by powder X-ray diffraction. ", Suzuki, W. , Fujiwara, E. , Kobayashi, A. , Fujishiro, Y., Ei ji Nishibori. , Masaki Takata. , Makoto Sakata. , Okano, Y., Kobayashi, H. , Chemistry Letters 32 (2003) 1106-1107.
4 . 格子定数決定プロセスでの H G A
( 1 ) HGAの概要
いよいよ、 以上の各プロセス P 1〜P 5のうち、 格子定数決定プロセス P 1と 基本構造決定プロセス P 4とで使用されるハイプリッド GA (HGAと略記する こともある) の構成について説明する。 なお、 両プロセス P I , P 4は、 本 発 明のうち 「ハイブリッド GAによる複数パラメータの最適化方法」 及び 「パター ンマッチングによるデータ解析方法」 並びに 「最適パラメータ探索プログラム」 及び 「物質構造推定プログラム」 の一実施形態でもある。 '
先ずこの節では、 格子定数決定プロセス P 1で用いられる HG Aについて、 具 体的に説明する。
すなわち、 本実施形態の 「ハイブリッド GAによる複数パラメータの最適化方 法」及び「最適パラメータ探索プログラム」等の中核をなすハイプリッド GAは、 図 1 9に示すように、初期世代設定ステップ S 1 1の後、交叉ステップ S 1 0 3 , 淘汰ステップ S 1 0 5 , 突然変異ステップ S 1 0 7 , 局所最適化ステップ 1 0 9 などを繰り返す世代交代ループ Lと 有する。 なお、 各処理手順については: 本 願発明を方法発明として捉えた場合には 「過程」 と呼び、 プログラムとして捉え た場合には 「ステップ」 と呼んでいるが、 処理する内容は寒'質的に同じであるか ら、 以後、 過程とステップとの呼称の区別には拘らないことにする。
この HGAでは、 各個体を構成する記号列は一組の物理量パラメ一タである格 子定数 [例えば (a , b , c , α, β , γ) ] であり、 格子定数の適正な組合せ を広域的に探索することが目的である。 ' 先ず、 初期世代設定ステップ S 1 1では、 格子定数がそれぞれ適度に分 した 所定数の個体からなる初期世代 (第 1世代ともいう) のポピュレーションが生成 される。 そして、 各世代において、 当該世代のポピュレーションを記録しておく 記録ステップ S 1 0.2と、 評価ステップ (図略) と交叉ステップ S 1 0 3と淘汰 ステップ S 1 0 5と、確率的に起こる突然変異ステップ S 1 0 7及び局所最適化 ステップ S 1 0 9とを含む世代交代ループ Lが構成されている。
ここで、 評価ステップ (図略) は、 当該世代のポピュレーションのうち新たに 生成された前記個体である新生個体の適応度を評価する過程である。 評価ステツ プでは、 初期世代設定ステップ S 1 1と交叉ステップ S 1 0 3と突然変異ステツ
プ S 1 0 7とで生成された新生個体の全てについて、 各々の適応度が算出される。 また、 交叉ステップ S 1 0 3は、 このポピュレーションのうち複数の個体を親個 体として選び、 これら親個体の間で所定の仕方で交叉を行って、 新しい子個体を 生成する過程である。 そして、 淘汰ステップ S 1 0 5は、 交叉ステップ S 1 0 3 による新生個体と、 複製ステップ S 1 0 4で第 N世代のポピュレーシヨンから複 製された個体との中から、 次世代に残すべき個体を選択して他の個体を淘汰する 過程である。 、
そして、 突然変異ステップ S 1 0 7は、 それに先立つ判定ステップ S 1 0 6に より所定の確率で実行され、 やはり確率的に選ばれた個体を構成する記号列に対 し、 強制的な変更を加える過程である。
さらに、 局所最適化ステップ S 1 0 9は、 やはりこれに先立つ判定ステップ S 1 0 8によって、 確率的なルールに則って選ばれた一部の世代 (特定世代) にお いて、 やはり所定め確率的なルールで選ばれた個体 (特定個体) に対してだけ、 その適応度に関して格子定数のパラ ータを局所的に最適化する過程である 判 定ステップ S 1 0 6の判定ロジックは調整可能であるが、 特定世代の出現頻度は 例えば 1 世代毎に一回程度であり、 特定個体の指定は、 ぞの特定世代のポピ レーションを擠成する所定数の個体のうちで一つか、 せいぜい数個程度に抑えて いる。
最後に、 収束判定ステップ S 1 1 0で解の収束判定をした結果、 収束していな ければ指定の制限回数の範囲で、 インクリメントステップ S 1 1 1で世代番号を 改めた後、 ステップ S 1 0 2へ戻り、 第 N世代のポピュレーションとして、 再び 世代交代ループ Lが繰り返される。 こうして世代交代ループ Lを幾度も繰り返し つつ、 世代交代を重ねるうちにポピュレーションの中に適応度が十分に良好な個 体が発生することを待ち、 それが正解ないし最良解に収束する至った判定をもつ て格子定数の最適な組合せが探索される。
そして、 収束判定ステップ S 1 1 0で最良の適応度をもつ個体が生成されたこ とが判定されれば (あるいは世代交代が制限値に達したら) 、 世代交代ループ L を終え、 結果出力ステップ S 1 2で、 最適の個体がもつ決定された構造パラメ一 ター式とその適応度等とが出力される。 併せて、 最終世代のポピュレーションを
構成する個体全部の情報も、 記録ステップ S 102と同様に記録される。 (2) HGAの詳細
本実施形態の HG A、 すなわち格子定数決定プロセス P 1でのハイプリッ KG Aは、 以上のようにして格子定数 (a, b, c, α , β , y ) の組み合わせを決 定するが、 その詳細を以下に記す。
(位置ずれパラメータ t) '
本実施形態の HGA (図 1.9参照) において、 初期世代設定ステップ S 1 1、 交叉ステップ S 103、 突然変異ステップ S 1 07及び局所最適化ステップ S 1 09には、 新たに生成ざれた個体の適応度を算出する評価ステップ (図略) が内 包されている。 この評価ステップで、 適応度算出のために基準として参照される 実測データは、 前述のように、 測定された粉末回折データからピーク位置を回折 角 20'で求めたピークデータである (図 1 1、 図 1 2、 表 3参照) 。
ここで、 元になる粉末 X線回折データは、 回折角 2 Θについて等間隔もしくは 非等間隔ステップを持った離散点での強度データとして得られる。 それゆえ、 そ の回折角 2 &の測定値には、 原点 (回折環の中心点) 付近で X線検出器がもつ空 間分解能の範囲で、微細な原点の位置ずれ( t )が生じており、こ.の原点ずれ( t ) の値は、 X線検出器からの実測データからだけでは不明である。
そして、 本実施形態の HG Aで最適解を求めて探索する複数パラメータには、 格子定数 (a, b, c, ά , 0 , y) の他にも、 この位置ずれ tが加えられてお り、 探索パラメータは (a, b, c, α,' ]3, , t ) の七つである。 すなわち、 位置ずれ tを含んだこれら七つのパラメータを探索し、 位置ずれ tをも正しく決 定してこそ、 初めてピークデータとの正確なデータマッチングが行えるようにな る。
(初期世代の発生過程)
先ず初期世代設定ステップ S 1 1 (図 1 9参照) では、 初期世代のポピユレ一 シヨンを形成する第一世代個体は、 最初に使用者が設定した個体数 Np組の格子 定数 (a, b, c, α , β , y ) と原点ずれ (t) とが、 適正な乱数で発生させ られる。
その際、 格子定数 (a , b , c , α, 13 , y ) には、 必ず平行 6面体を形成し なければならないことと、 その単位格子の軸 a , b , cの大きささの最小値は、 原子の大きさから 0. 2 5 nmよりも小さいことなどの制約条件が課せられてい る。 ここで、 平行六面体の条件は、 ct + ]3 + y<3 6 0° , α≤ + γ, ]3≤ α + γ , y≤ a + j3である。 この条件を満たさない場合、 例えば α + /3 + γ = 3 6 0° といった場合には、 単一の平面状に軸 a , b, cの方向が入ってしまい、 単 位格子が平面に収まってしまって平行 6面体ではなくなつてしまう。 また、 格子 は原子のサイズより大きいという制限から、. a , b , c > 0. 2 5 nmの範囲で 発生させる。これらの制限により、乱数により必ず平行 6面体を現す格子定数(a , b, c,. ct, ]3, の組を発生させることができる。
一方、 原点ずれ (t ) に関しては、 データ点のステップ幅 (つまり空間解像度) に相当するずれの範囲を設定し、 その範囲でパラメータ tをランダムに発生させ る。典型的な原点ザれ(t )の値は 0. 0 0 1 ° のオーダーである。さらに、 (a , b, c , α, β, y ) に関しては、 発生させるパラメータに、 以下に示す多数の 制約条件を付加することができる。
さらに、 探索範囲を制限して効率的に解を探索するため 、 パラメータ (a , b, c , α, β , y ) の各値に上限、 下限を設定することができる。 また、 必要 に応じて、 a〉 b〉 c、 a > c , b > c , c〉 a等の制約も与えることができる。 そして、 構成原子や分子からおよその単位格子の体積が予測できる場合には、 体 積の上限値 (Vm a x) と下限値 (Vm i n) を入力することにより、 上限 (V . m a x) と下限 (Vm i n) の範囲内の体積 (V) をもつ平行六面体を形 する 格子定数 (a , b, c , α, β , γ) の組を発生させることができる。
(評価過程)
各個体には、 このような格子定数 (a , b, c , α, β , y) と原点ずれ (t ) とがその記号列にコーディングされており、 各個体は、 評価ステップ (図略) で その格子定数が実験で得られた回折ピークを満足するかどうかで評価される。 すなわち、 適応度の評価は、 その個体が表す格子定数の平行 6面体から次の数 2により得られる dを回折条件式 (2 d · s i η Θ =ぇ) に代入して計算される 回折ピーク位置の仮定データ (2 0 ca l) と、 実験データから抽出した回折ピー
ク位置の実測データ (20。bs) との一致度を用いて行う
[数 2]
—ゾ
なお、 一致度を示す評価関数は、 次の数 3から算出される。 '
[数 3]
_
ここで、 Nは入力した反射の本数である。 そして、 2 。 を中心とした土 d e 1 t a値の範囲を設定し、 その範囲'内に含まれる 2 Θ <: との間で一致度 Rを計 算する。 d e 1 t aの値は、 おおむね回折ピークの半値幅の半分から半値幅の全 体まで程度の値とする。 この数式を用いるにあたり、 もしも 2 Θ。 士 d e l t aの範囲に 2 0 が存在しない場合には、 上記数 3の分子 (に 2 0 bs— 20 c„ の値を 1 とする。 逆に範囲内に存在する場合には、 ( I 2 Θ — 20 ca l I /2 0 s) の値ほ 0. 005前後の値のため、 1となるピークが存 在した場合には、 一致度 Rの値は著しく大きくなる。 ' .
さて.、 説明が前後するが、 前述の初期世代設定ステップ S 1 1では、 生成され る個体の表すパラメータの範囲に、 一致度 Rの値によって制限を加えることもで きる。 すなわち、 一致度 Rが設定した値より大きいパラメータに相当する個体が 生成された場合には、 その個体を破棄して、 改めて別のパラメータに相当する個 体を発生させる。 そして、 使用者が設定した各種の制約条件を満足する Np個の 個体が得られたら、 第一世代人口の発生は終了する。
(交叉過程)
交叉とは、 生物の交配を模した操作である。 交叉ステップ S 1 03で行われる 交叉の操作では、 以下の数 4から求められた 番目の個体の適応度 pを用いて、
交叉を行う親個体 (格子定数パラメータ及び原点ずれの組) を選択する
[数.4 ]
ここで、 Rm s X , R m i nは、 それぞれ第 N世代のポピュレーションに属 する個体の中で、 前述の数 3により算出される評価関数 の最大値と最小値とで ある。
そして、 交叉ステップ S 1 0 3では、 親個体の選択にはルーレツト選択を用い る。 ルーレット選択とは、 特定世代のポピュレーションからランダムに選ばれた 個体がもつ適応度 pが、 0〜 1の範囲で生成される一様乱数の値より大きければ、 親個体として採用するという選択法である。 逆に、 各個体の適応度 pの値が上記 一様乱数よりも小きければ、 他の個体を選んで同じ操作を繰り返し、 選択された 親個体が所定数になるまでこのよう 操作が続けられる。 ' さて、 交叉ステップ S 1 0 3で行う交叉方法には幾つかの種類があり、 交叉の ために選択される親個体の数は交叉方法によって異なる。 すなわち、 パラメータ を交換するタイプの 1点交叉タイプ、 2点交叉タイプ及ぴ一様交叉タイプの三つ のうちいずれかと、 実数値の G Aで使用されるブレンドタイプの交叉との.うち、 どれかを行う.ことができる。 この際、 親個体の選択数は、 1点 · 2点 ·一様交叉 タイプの方式で交叉を行う場合には、 2個体 1組なので、 使用者が設定した 2 N ' m個で N m組となが、 一方、 ブレンド交叉タイプの場合には、 2個〜 N b個とな る 0 '
交叉ステップ S 1 Q 3では、 有機物の分子性結晶の良く見られる単斜晶系と三 斜晶系とに対するパラメータ探索効率を改善するために、 特殊な工夫がなされて いる。 すなわち、 格子定数パラメ一タ (a, b , c , α , β , γ ) をそのまま交 叉させるのではなく、 図 2 0に示すように、 パラメータの性質に応じた遺伝を考 慮して、 パラメータのグループ化を行っている。
たとえば、 三斜晶系のグループ化では、 平行 6面体の 1つの面を保存する。 す なわち、 単位格子のうち互いに並行ではない三つの面は、 それぞれ 2つの軸と一
つの角度であらわすことができるから、 この 3つのパラメータを (a, b , y ) ,
(b , c , a) , (a , c , β ) というふうに三つのグループに分ける。 あるい は、 単斜晶系であれば、 四つ一組の格子定数 (a , b , c, ]3) を、 (b , c ) , (a , b ) , (a , c , β ) というふうに三つのグループに分ける。
このようなグループ化の結果、 親個体の平行六面体の 3種類の面のうち 1種類 は子に遺伝することになる。
逆に、 もしもこのようなグループ化を行わないと、 どうなるかを思考実験して みれば、 このグループ化のもつ意義が理解できる。 たとえば、 粉末試料に含まれ る.物質が三斜晶系であれば、 (a , b , c , a , /3 , ) の 6パラメータのうち、 図 2 1 ( a ) 〜 (b) に示すように、 α, β ' τ/·を抽出してこれらの値を変更し てしまうと、 元の親個体とは全く形状の異なった平行 6面体に相当する子個体と なってしまう。 そして、 この平行 6面体から計算される回折ピーク位置は、 親個 体のそれとは全く真なつてしまい、 たいへん不都合である。
. なぜならば、 一般的に言って GA ' (遺伝的アルゴリズム) では、 親個体の遺伝 子を子個体に伝えることによって解の探索性能を向上させているからである。 し たがって、 の例のように、 形状も回折ピーク位置も、 親個体とは全く異なる平 行, 6面体に相当する子個体が生成されてしまっては、 G Αがもつ長所である探索 効率の良さがすっかり損なわれてしまう。 格子定数決定プロセス P 1では、 この ような理由で交叉過程ではパラメータのグループ化が行われている。
したがって、 交叉方式が 1点 · 2点 ·一様タイプのうちいずれかである場合に は、 交叉ではグループィヒされだパラメータのうち一つのグループは保存され、 そ れ以外グループに属するパラメータだけが、 両親 (2つの親個体) の間で交換さ れる。 このようなグループ化が交叉過程で行われた場合には、 三斜晶系の場合に 可能な交叉の仕方は、 図 2.2 ( a ) 〜 (c ) に示す三つのパターンに限られ、 単 斜晶系の場合にも同様に、 図 2 3 (a ) 〜 (c ) に示す三つのパターンに限られ る。 このような交叉が行われた結果、 Nm組の親個体から 2 Nm個の子個体が生 成される。
一方、 交叉の仕方にブレンド交叉タイプを選んだ場合には、 交叉はグループ化 したパラメータを.保存し、 それ以外のパラメータを 2〜N b個の個体の平均値周
りに一様乱数ノ正規乱数で発生させることにより行う。 すなわち、 子個体のパラ メータ P.cは、 次の数 5に基づいて、 親個体のパラメータ P pと αと舌し数と力、ら 算出される。
[数 5] '
∑Pp,
Pp
Mb
Pc = + (I - x(乱数)
Nb . Nb
さて、 ブレン ド方式の交叉過程では、 上記数 5の操作が 2 Nm回繰り返され、 2 Nm個の子個体が生成される。 '
そして、 交叉の方式に拘わらず、 交叉過程で生成された全ての個体は、 前述の 一致度を示す評価関数 W (数 3 照)' により評価される (評価ステップが行われ る) 。 .
(淘汰過程) '
突然変異ステップ S 1 07では、 当該第 N世代の N p個のパラメータと交叉過 程により新たに生成された 2 Nm個の子個体とを合計した N p + 2 Nm個の個 体から、 次 代に残す Np個の個体を逡択する。 その際の選択戦略としては、 大 きく分けて以下の 2種類がある。 ' ' 先ず一つめの選択戦略は、 各個体の適応度 pを計算し、 適応度の高い順に Np 個を選択するエリート戦略である。
一方、 もう 1つの選択戦略は、 第 N世代の Np個のうち (Np— 2) 個の個体 を残し、 残りの 2個を、 交叉で生成された 2 Nm個と交叉の親として選択した個 体のうちの 2個体とを合わせた 2 Nm+ 2個体の中から選択する。 その際、 1個 体を (2Nm+2) 個の個体の中で適応度が最.も高い個体 (最良個体) とし、 も う 1個体は最良個体を除いた 2 Nm+ 1個体からルーレツ ト選択により選択す るという選択戦略である。
以上の二つの選択法のうちどちらを使用するかについては、 本実施形態の 「最
適パラメータ探索プログラム」 を使用する使用者が選択する。
(突然変異過程)
突然変異過程とは、 生物の進化の過程で起こる突然変異を模した操作を G Aに 取り入れたものである。
本実施形態における格子定数決定プロセス P 1では、 N p個の個体の中から、 一様乱数により N X個の個体を変位対象として選択し、 それらの個体に対して突 然変異の操作を行う。 選択された個体の格子定数と原点のずれパラメータを乱数 で変化させる。
その際に、 格子定数決定プロセス P 1で前述したように、 パラメータの遺伝を 考慮して、 .三斜晶系では (a, b, c , a , j3 , y ) のうち 1つのパラメータ、 単^晶系では (a , b, c, ]3 ) のうち 1つのパラメータを選択し、 その値を乱 数と置き換える。 また、原点のずれパラメータ (t ) は、常に乱数と置き換える。 そして、 このような操作を N x個の個体について繰り返し、 突然変異によって 作成された個体は、 当該世代のポピュレーションのうち変異前の個体と置換され る。 したがって、 この操作では世代の個体数 N pは変化しない。
なお、 突然変異の対象個体の個数 N xの設定は、 使用者が予め行っておく。 . (複製過程) ' '
複製ステップ S 1 0 4では、 第 N世代のポピュレーションについて、 その N p 個の個体がもつ全てのパラメータと評価関数値 Rとを保存し、 次の淘汰ステップ S 1 0 5 (つまり淘汰過程ないし選択過程) の操作に送る。 ' (局所最適化過程) '
局所最適化ステップ S 1 0 9は、 7つのパラメータ (a , b , c , a , j3 , y , t ) の値を非線形制約条件つきの最小自乗法により局所的に最適化する処理ステ ップである。 すなわち、 N p個体のうち N n個の個体を選択し、 適応度 pについ て局所最適化を行うのだが、 これに伴う制約条件は、 前述の第一世代発生時の制 約に従う。
この際、 局所最適化操作の対象とする N n個の個体を選択する方法が特徴的で あって、 ルーレッ ト選択により、 常識とは逆に適応度の低い個体から選択する。 その理由には二つあって、 うち一つは、 前述のように、 既に適応度が高い個体は
多峰性の多次元パラメータ空間中の落とし穴に陥っている可能性が小さくない ことであり、 今ひとつは適応度の低い個体の方が、 以前に局所最適化されていな い可能性が高く、 局所最適化の効果が期待できることである。
もう一つ、 局所最適化を行う個数 Nnには限定があって、 ポピュレーションに 含まれる個体数の 1Z1 00以下とする。 なぜならば、 一回の局所最適化操作に かかる計算時間は、 1回の評価関数計算と比較して、 ふつう 10〜100倍程度 かかるので、 それ以上に局所最適化の対象とする個体の数 Nnを増やしてしまう と、 演算負荷が軽いという GA本来の良さが損なわれてしまうからである。
局所最適化操作によって新たに作成されこ個体は、 元の個体と入れ替られる。 したがって、 この操作でも当該世代のポピュレーションに含まれる個体数 Npは 変化しない。
なお、 局所最適化操作を行う特定世代の頻度と、 局所最適化操作の対象とする 特定個体の個数 Nnとは、 使用者が予め設定しておく。
(収束判定) '
ハイプリッド G Aの収束判定は、 適応度としての評価関数の値が、 使用者によ り入力された値を下回った場合に収束したもの判定とする。 'ただし、 もし何時ま でも収束に至らなかった場合には、使用者が予め設定しておいた世代交代のサイ クル回数で計算は終了し、 その旨のメッセージが出力される。
5. 基本構造決定プロセスでの HGA . '
(1) HGAの概要
次にこの節では、 基本構造決定プロセス P 4で用いられる HGAについて、 具 体的に説明する。
すなわち、 本実施形態の 「ハイプリッド GAによる複数パラメータの最適化方 法」 は、 再び図 1 9に示すように、 大筋においては前述の格子定数決定プロセス P 1で使用される HG Aのプログラムを利用するものである。
ただし、 大きく違う点としては、 正解となる組合せを探索すべき複数パラメ一 タは、 前述のように (図 1 5 (a) 〜 (c) 参照) 、 分子の位置 (x、 y、 z)
および姿勢 ( θ ' φ , φ) ならびに当該分子内部の回転角 (τ ί ) である。 また、 各個体の適応度 Ρには、 前述の数 4中の Rを Rw ρに置き換えた式をもって充て る。 一方、 細部の違いについては、 次の項で明らかにする。
( 2) HGAの詳細
本項では、 再び図 1 9を参照しつつ、 基本構造決定プロセス P 4で用いられる HGAについて、 具体的に説明する。 、
(初期世代生成過程)
先ず初期世代設定ステップ S 1 1では、 初期世代のポピュレーションが、 予め 使用者が設定した個体数 N p個について、 その記号列に相当する構造パラメータ —式を乱数を用いて発生させる。 そして、 発生された構造パラメータから個体数 N p個相当の構造モデルが作成されると、 作成された構造モデルと、 格子定数、 空間群及び先に求められたプロファイルパラメータとを用いて、 計算回折パター ンが計算される。 この計算回折バタ ンは、 実験で得られた回折パターンとの信 頼度因子 Rw p (数 1参照) により評価される。 すなわち、 初期世代設定ステツ プ S I 1でほ、 生成された個体数 N p個分の構造パラメータとそれらに対する信 頼度因子 Rw pとが計算される。 '
(交叉過程および評価過程)
交叉ステップ S 1 0 3では、 前述のように、 数 4の右辺のうち一致度 Rを信頼 : 度因子 Rw pに置き換えた式から求められた適応度 pを用いて、 交叉を行う親個 体を選択する。 ここで、 Rma X, はそれぞれ、 N世代の個体の中で評 価関数め最大と最小の値である。
親個体の選択戦略には、 前述の格子定数決定プロセス P 1と同様のルーレツト 選択法を用いている。 一方、 交叉の方式は、 前述の 1点交叉と一様交叉と、 実数 値の GAで使用されるブレンドタイプの交叉とのうちから、 使用者によって予め 指定されている。 これらの交叉方式のそれぞれについては、 格子定数決定プロセ ス P 1の項で説明したものと同様である。
(淘汰過程、 突然変異過程、 局所最適化過程および収束判定)
淘汰ステップ S 1 0 5、 淘汰ステップ S 1 0 5、 局所最適化ステップ S 1 0 9
および収束判定ステップ S 1 1 0は、 それぞれ前述の格子定数決定プロセス P 1 の各ステップと同様のやり方で処理を行うステップである。
6. その他の実施例
本発明のその他の実施例として、 本実施形態の 「放射線回折データに基づく物 質構造の推定方法」 の格子定数決定プロセス P 1によって、 P d ( t m d t ) 2の 粉末試料からその棬子定数 (a, b , c , α, β , y ) を決定した。 その結果、 次の表 5に例示するように、 局所最適化がない普通の G Aによる格子定数決定方 法に比べて、 本発明の中核となる HG Aを用いた格子定数決定プロセス P 1では、 格子定数決定の成功確率とそれに要した平均サイクル数 (世代交代数) とにおい て、 顕著な効果が確認された。
¾5
この表のうち左端近くの項目に 「Nn= 100 (.1 0%) の場合」 とあるは、 本実施例による解析結果を示す。 ただし、 本実施例では前述の逆ルーレッ ト選択 はしておらず、 特定世代のポピュレーシヨンから特定個体を選択するには、 ラン ダム方式で選択している。
本実施例での解析は、 HGAでのサイクル数の制限値 = 5000回、 ポピユレ ーションの個体数 N p = 1 000、 交叉の数 Nm= 500、 突然変異の数 N x = 500 (つまり十世代毎に一回の突然変異) 、 特定世代の出現頻度は世代交代毎. に各世代で、 局所最適化数 (つまり特定個体の数) Nn= 1 00 (すなわちポピ ユレーシヨンのうち 1 0%に局所梟適化をがける) の条件下で行った。 このよう な HG Aによる格子定数の決定用プログラムにおいては、 その成否が初期乱数、 DE LTAの値に依存するために、 その値を変化させてそれぞれの実測データに 対して 1 0例の解析を行った。
その右隣に 「Nn = 0場合 (最小二乗なし) 」 とあるは、 上記設定の HG Aか ら局所最適化操作をなく してしまった単純な GAではどうなるか計算してみた 比較例である。 GAによるこの比較例では、 前述の HGAによる実施例よりも二 倍半ほど多 サイクル数 (世代交代回数) で最適値への収束を見た。
さらにその右隣に 「D I CVOL^¾否」' とあるは、 物質構造決定用の定番とも 言えるフリープログラムによる解析結果を、 先ほどとは別の比較例として提示し たものである。 すなわち、 三斜晶でも適用可能な L o u e r &L o u e r (固有 ;人名) により開発されて公開されているプログラム D I CVOL 04 (固有のプ ログラム名) を用いて同じデータを解析した結果、 格子定数を決定することはで きなかった。 なお、 このフリープログラムによる回折データの解析方法は、 いわ ゆる一定体積内での絨毯爆撃方式である。
その結果、 本実施形態での格子定数決定プロセス P 1によれば、 全ての場合で 解析に成功しているだけでなく、 P d ( t md t) 2の例のように、 既存の D I C VOLプログラムでは得られない場合にも解が得られている。 また、 この二つ の例では、 パラメータのグループ化を行わない場合には、 HG Aでも解が得られ なかった。 さらに、 局所最適化操作を行わなかった場合には、 成功確率が落ちて いたり収束に要したサイクル数 (つまり世代交代数) が倍以上に増えていたりす
る。
このような比較から、 本実施例の 「物質構造推定プログラム」 によれば、 格子 定数決定プロセス P 1においても、 只の G Aや定番のフリ一プログラムに比べて 明瞭に良好な計算結果が得られていることが分かる。
発明の効果 本発明の 「放射線回折データに基づく物寳構造の推定方法」 や 「物質構造推定 プログラム j 等によれば、 単結晶を作ることが難しい物質であっても、 その粉末 試料に X線を照射して得た回折環の強度分布データから、 その物質構造を決定す ることができるという効果がある。 その結果、 ;の方法によって医薬や素材など の新物質の構造が達やかに特定できるようになり、 新物質の開発が飛躍的に加速 されるので、 各種産業や医療に関す 研究開発に大きな福音がもたらされるもの と期待される。
また、.本 明の「ハイプリッド G Aによる複数パラメ タの最適化方法」や「パ ターンマッチングによるデータ解析方法」'及び「最適パラメータ探索プログラム」 等によれば、 多峰性の多次元空間に於いて極めて強力な広域探索能力と精密な最 適化能力とが発揮される。 すなわち、 本発明の各種プログラムやその搭載コンビ ユータ等によれば、 実測データに対するパターンマッチングによって、 従来より も多数のパラメータをより精密かつ効率良く最適化または特定ないし推定する ことができるようになる。 その結果、 実測データに含まれる情報量が少なすぎた り、 推定すべきパラメータの数が多すぎたり、 複数パラメータの最適化に要求さ れる精度が高すぎたりして、 従来は実際上できなかった最適値決定やデータ解析 に基づく判定までが可能になるという効果がある。
産業上の利用可能性
(新物質の研究開発)
本発明の 「放射線回折データに基づく物質構造の推定方法」 等は、 前述のよう に放射線回折環から物質構造を決定する能力が大幅に向上しているので、 物質設 計、 医薬品開発、 ナノテクノロジー、 液晶技術などの多くの産業分野で利用可能 である。. しかしながら、 本願発明の中核的な技術的特徴をもつ 「ハイプリッ K G A」 は、 以下に例示するように、 さらに広い産業分野で利用可能である。
(データ解析) 、 .
すなわち、 本発明の 「ハイプリッド G Aによる複数パラメータの最適化方法」 や 「最適パラメータ探索プログラム」 およ^ 「パターンマッチングによるデータ 解析方法」 等は、 前述のように実測データを解析する技術だけではなく、 逆に最 適設計を行う設計技術にも利用が可能である。
先ず、 データマッチングによる実測データの解析技術としては、 前述の実施形 態のように、 多数の物理量を精密に推定ないし决定することが代表的である。 そ して、 その応用分野は、 ソナ一の音 解析、 レーダーの反射像解析、 地震波め伝 搬による地殻構造解析や鉱脈操査など、 極めて広いものと考えられる。
(最適設計) '
逆に、 これらの本発明を逆問題を解くレゾルバとして利用し、 極めて多数の設 計パラメータについて最適ないし適正な組合せを探索する設計技術 (設計パラメ ータの最適化) に適用することも可能である。 このような最適設計の技術分野と : しては、 例えば航空機の翼型設計および主翼を含む機体の構造設計や、 多段ロケ ットの最適設計問題、 通信ネットヮ一久の最適設計、 打上ロケットゃ人工衛星な どの宇宙機の軌道設計、 空港騒音問題に考慮した航空機の最適経路問題などがあ る。 ,
ここで、 逆問題やそのレゾルバとはどういうものであるか具体的なィメ一ジが 湧くように、 翼型設計を例にとって説明しょう。 翼型設計における逆問題とは、 所与の形状の翼型が二次元流中に置かれた場合に周囲の空気流を求めてその翼 型の特性を求めるという順方向の問題ではなく、 逆に希望する空力特性を発揮す るためには翼型の形状をどう設計すれば良いかという問題である。 これを解くた めには、 先ず適当な形状の翼型を初期形状として与えておき、 その翼型の周囲の
流れ場を算出したうえで、 望みの空力特性に近づくように翼型の形状を変えてい くという試行錯誤を繰り返して、 徐々に翼型の形状を修正していく。 そして、 こ のような演算を行って解を求める演算手段のことを、 逆問題のレゾルバという。 こうして、 最終的に最も望ましい形状の翼型が得られるまで、 何度でも翼型の 形状を修正しては改めてその空力特性を求めるので、 その演算量は膨大になる。 それゆえ、 このような逆問題においては、 問題の設定が適当でなかったりそのレ ゾルバの能力が十分でないと、 要求を満たす解としての翼型は現実的なコス卜や 時間では求まらない。 そこで、 本発明の 「最適パラメータ探索プログラム」 をこ のような逆問題のレゾルバに利用すれば、 レゾルバの大幅な能力向上が見込める ので、 従来は現実的な範囲で解けなかった逆問題を解くことができるようになる 可能性がある。 その結果、 本発明の技術によって、 最適設計の技術分野にも発展 をもたらすことができるであろう。
(最適経営問題など)
さらに、 本発明の中核をなすハイクリッド G Aは、 物理量に対応するか否かに 拘わらず多数のパラメータを最適化に調整するうえで、 計算負荷を劇的に低減す ることができるという効果がある。
それゆえ、 現象のモデル化や適応度設定など克服すべき難しさは多いが、 調整 すべきパラメータが極めて多い最適瘙営問題にも、 本発明の 「最適パラメータ探 索プログラム」 などを適用することができる可能性がある。 なお、 ここでいぅ最 適経営問題とは、 たとえば会社が持つ各種の経営資源を如何に配分すると良いか と力、 あるいは国家の各種資源をどう配分したら良いかといつた一種の最適設計 問題である。
(人工知能)
また、 本発明の技術によれば、 同様の理由で人工知能 (A I ) の一分野として の G Aが発揮する処理速度を加速し、 その収束時間ないし学習時間を短縮するこ とができるから、 人工知能としての G Aにも新たな実用範囲が開ける可能性が生 じる。
たとえば、 幾つかの惑星をかすめて探査機を飛行 (フライバイまたはスウィン グバイ) させ、 その惑星の重力を利用して軌道エネルギーを稼ぎ、 併せて軌道要
素を変えながら、 次々に幾つもの惑星やその衛星の観測するという宇宙探査ミッ シヨンがある。 し力 し、 その軌道設計には極めて多くの試行錯誤を要し、 研究者 に非人間的な努力を強いる場合が少なくない。 そこで、 G A.を使った人工知能に よって最適パラメータ探索を行い、 自動的に軌道設計させようというアイディァ は既にあるが、 本発明によればその探索時間を節約してミッション設計を容易に することができる可能性がある。 特に、 惑星の衛星をも次々に観測していくミツ シヨンでは、 衛星重力の影響をも受けるうえに、 さらに制約 件が多くなって軌 道設計の困難が予想されるので、 本発明を利用して初めて設計可能になるミッシ ヨンもあるものと想像される。 '
あるいは、 理論的には G Aで解くことが可能でありながら、 事象を表現" Tるモ デルが複雑になりパラメータが増えるなどして、 その計算時間の制約から実用に ならなかった問題に対しては、 本発明の H G Aが有効な解決手段になる可能性が ある。 'このような利用分野としては、 例えば天気予報や株価予測などがある。 す なわち、 一週間後のことを予測するのにーケ月間の計算時間がかかっていては用 をなざないが、 1時間で解けるようになってしまえば有用だという場合があるか らである。.'■' ■ 本発明のハイブリッド G A技術を応用すれば、 多峰性の強い広大なパラメータ 空間内でも強力な広域探索能力を発揮することができるので、 従来技術 1や従来 技術 2などでは解けなかった問題をも解くことができるようになる。 その結果、 本発明は前述の実施形態で詳述した粉末試料の X線回折による物質構造の決定 ばかり ^はなく、 極めて広い産業分野でも利用可能であり、 様々な分野で強力な 最適値探索ツールとなり うる。
Claims
1 . 各個体を構成する記号列のうち少なくとも一部は、 所定の物理量に対応 した複数のパラメータであり、 これらのパラメータの適正な組合せを探索す こ とを目的として、
これらのパラメータがそれぞれ適度に分布した複数の前記個体を初期世代の ポピュレーションとし、 '
各世代において、 当該世代のポピュレーションのうち少なくとも新たに生成さ れた前記個体である新生個体の適応度を評価する評価過程と、 このポピユレーシ ヨンのうち複数の前記個体を親個体としてこれら親個体の間で行う交叉により 新しい子個体を生成する交叉過程と、 次世代に残すべき複数の前記個体を選択し て他の前記個体を淘汰する淘汰過程とを繰り返すうちに、
これらの個体の ち一部に変更を加える突然変異過程を適宜交えながら、 世代 交代を重ねて前記適応度がより良好な前記個体の発生を待ち、 もって前記複 icの パラメータの最適な組合せを探索する、
G A (¾伝的アルゴリズム) による複数パラメ タの最適化方法において、 . 全世代のうち一部にあたる複数の特定世代において、 当該世代の前記ポピユレ ーシヨンのうち少なくとも一部にあたる特定個体を対象に、 局所最適化操作が行 われることと,、
全世代のうち少なくとも一部にあたる複数の特定世代において、'当該世代の前' 記ポピュレーションのうち一部にあたる特定個体を対象に、 局所最適化操作が行 われるごととのうち、
少なくとも一方である局所最適化過程を有することを特徴とする、
ハイプリッド G Aによる複数パラメータの最適化方法。
2 . 前記局所最適化過程は、 前記全世代のうち一部にあたる前記複数の特定 世代において、 当該世代の前記ポピュレーシヨンのうち一部にあたる前記特定個 . 体を対象に、 前記局所最適化操作を行う過程である、
請求項 1に記載されたハイプリッド G Aによる複数パラメータの最適化方法。
3 . 前記局所最適化操作の対象たる前記特定個体は、 当該世代の前記ポピュ レーションのうち一つの前記個体である、
請求項 1に記載されたハイプリッド G Aによる複数パラメータの最適化方法。
4 . 前記局所最適化過程が行われる前記特定世代は、 前記全世代のう.ち少な くとも一部に散在している、 '
請求項 1に記載されたハイプリッド G Aによる複数パラメータの最適化方法。
5 . 前記特定世代が各前記世代のうちに出現する頻度は、 前記全世代のうち 前記世代が下る方が高く設定されている、
請求項 1に記載されたハイブリツド G Aによる複数パラメータの最適化方法。
6 . 前記特定世代は、 前記全世 のうち少なくとも後半部で、 所定の複数世 代毎に周期的に出現する、
請求項 1に記載されたハイプリッド G Aによる複数パラメータの最適化方法。
7 . 前記特定個体は、 当該特定世代の前記ポピュレーションのうち前記適応 度が比較的低い前記個体の中からも指定される可能性がある、
請求項 1に記載されたハイプリッド G Aによる複数パラメータの最適化方法。'
8 . 前記特定世代の前記ポピュレーシヨンのうち、 前記適応度が比較的低い 複数個の前記個体からなるグループをもって、 劣等グループと呼ぶことにし、 前記特定個体は、 この劣等グループの中から指定される、
請求項 7に記載されたハイプリッド G Aによる複数パラメータの最適化方法。
9 . 前記劣等グループは、 前記ポピュレーションのうち前記適応度が低い方 の所定数および所定割合のうち少なくとも一方に属する複数の前記個体からな るグループである、
請求項 8に記載されたハイプリッド G Aによる複数パラメータの最適化方法
1 0 . 前記特定個体は、 当該世代め前記劣等グループの中からルーレッ ト選択 法およびランダム選択法のうち一方により選択される、
請求項 8に記載されたハイブリツド G Aによる複数パラメータの最適化方法。
1 1 . 前記局所最適化過程は、 前記特定世代の前記ポピュレーションの一部を 前記特定個体として選び出して前記局所最適化操作を施す過程であり、
前記特定個体の選定に当たっては、 前記適応度がより低い前記個体の方がより 高い確率で選定されるという弱者優先の傾向を持つ、
請求項 1に記載されたハイプリッド G Aによる複数パラメータの最適化方法。
1 2 . 前記淘汰 程では、 当該世代のポピュレーションのうち前記適応度が比 較的低い前記個体であっても次世代'に生き残る可能性がある選択戦略が採 れ る、
請求項 1に記載されたハイプリッド G Aによる複数パラメータの最適化方法。
1 3 . 前記淘汰過程で前記選択の際に採られるルールのことを選択戦略と呼ぶ ことにし、 ,
この選択戦略は、 ' この適応度とは関わりなく無作為に前記個体が選択されるランダム戦略、と、 この適応度が比較的低い前記個体が優先的に選択される逆ェリ一ト戦略と、 この適応度が比較的低い前記個体の方が選択される確率が高くなる逆ルーレ ット戦略と、
この適応度が比較的低い前記個体の方が優先的に選択されるようにした逆期 待値方式、 逆ランク方式および逆トーナメント方式とのうち何れかと、 のうちいずれかである、
請求項 1に記載されたハイプリッド G Aによる複数パラメータの最適化方法。
1 4 . 当該世代の前記ポピュレーションのうち前記適応度が最高である前記個 体をトップ個体と呼ぶことにし、
当該世代からその次世代に世代交代する際に、 このトップ個体は必ず生き残る という トップ保存戦略が併用される、
請求項 1 2および請求項 1 3のうち少なくとも一方に記載されたハイプリッ ド G Aによる複数パラメータの最適化方法。
1 5 . 各世代のポピュレーションを形成する個体のそれぞれは、 所定の物理量 に対応した複数のパラメータを含む記号列 らなり、 これらのパラメータがある 程度の多様性をもって分布した初期世代から所定のルールで世代交代を重ねる うちに、 より高い適応度をもつ前記個体が生成されることをもって、 前記複数の パラメータの最適化を図る G A (遺伝的ァルゴ.リズム) による複数パラメータの 最適化方法において、
全世代のうち一部にあたる複数の 定世代において、 当該世代の前記ポピュレ ーシヨンのうち少なくとも一部にあたる特定個体を対象に、 局所最適化操作が行 われることと、
世代のうち少なくとも一部にあたる複数の特定世代において、 当該世代の前 記ポピュレーションのうち一部にあたる特定個体を対象に、 局所最適化操作が行 われることとのうち、 少なくとも一方であることを特徴とする、
ハイプリッド G Aによる複数パラメータの最適化方法。 '
1 6 . 請求項 1〜請求項 1 5のうちいずれかに記載された 「ハイブリッド G A による複数パラメータの最適化方法」 において、
各前記個体がもつ前記適応度は、 当該個体の前記記号列に含まれる前記複数の パラメータに対応する前記物理量を仮定すると数値演算により決まる仮想デー タのパターンが、 実測データのパターンとどの程度一致しているかを示す指標で あり、
この適応度が高い前記個体を生成することによって、 当該個体の前記仮想デー
タと前記実測データとの間でパターンマッチングを行い、 前記物理量を推定する ことを目的として前記実測データの解析を行うことを特徴とする、
パターンマッチングによるデータ解析方法。
1 7 . 請求項 1〜請求項 1 5のうちいずれかに記載された 「ハイブリッド G A による複数パラメータの最適化方法」 を、 所定の試料物質に照射された放射線が 形成する回折パターンに基づいてこの試料物貧の構造を推定する物質構造の推 定方法に応用し、
前記物理量のうち少なくとも一部は、 この試料物質の物質構造を決定する構造 パラメータであって、
各前記個体の前記適応度は、 この試料物質が当該個体に相当するこれらの構造 パラメータをもっと仮定すると生じる回折パターンが、 実測された前記回折バタ ーンに対してどの程度一致している を示す指標であることを特徴とする、 放射線回折データに基づく物質構造の推定方法。
1 8 . 前記構造パラメータとは、
前記試料物質の結晶構造を規定する格子定数と、
この試料物質を構成する分子内における三次元的な原子配列を規定する分子 構造パラメータと、
この分子内での確率的な電子密度分布を規定する電子密度分布パラメータと、 この試料物質の結晶内での三次元的な原子配列を規定する結晶学的構造パラ メータと、
のうち少なくとも一つである、
請求項 1 7に記載された放射線回折データに基づく物質構造の推定方法。
1 9 . 前記回折パターンは、 その回折強度が同心円状に拡がって分布する回折 環である、
請求項 1 7に記載された放射線回折データに基づく物質構造の推定方法。
2 0 . 前記適応度は、前記回折環がもつ半径方向べの強度分布の実測データと、 仮定された前記構造パラメータに基づいて生成される仮定データとが、 どの程度 一致しているかを示す評価関数である、
請求項 1 9に記載された放射線回折データに基づく物質構造の推定方法。
2 1 . 複数の結晶を含む粉末試料、多結晶集合体である多結晶試料、非晶質(ァ モルファス)試料および溶液試料のうち少なくとも一つである試料物質の構造を 特定するために、
この試料物質に照射された放射線の回折によってもたらされる回折環の強度 分布を示す回折データに基づき、 この試料物質がもつ物質構造を示すいずれかの 構造パラメータをデータマッチングにより推定するアルゴリズムとして、
前記構造パラメータがコーディングざれた個体を、 ある程度の多様性を持たせ て複数個発生させ、 初期世代のポピュレーションとする発生過程の後に、 これら の個体の交叉および複製と、前記データマッチングの程度を示す適応度を評価し てこれらの個体を淘汰する選択と、確率的に起こる突然変異とを繰り返す世代交 代過程を行う G A (遺伝的アルゴリズム)' を使用する、
放射線回折データに基づく物質構造の推定方法において、
前記 G Aでは、 前記世代交代過程の間に複数の世代において、 当該ポピユレ一 ションの一部である前記個体に対して局所最適化操作が行われ、 この局所最適化 操作の対象には、 当該ポピュレーシヨンのうち前記適応度が比較的低い前記個体 もなる可能性があることを特徴とする、
放射線回折データに基づく物質構造の推定方法。
2 2 . 放射線を試料物質に照射して得られた回折環の強度分布データに基づき、 この強度分布データに適合する物質構造を特定するために、
この試料物質に含まれる結晶の格子定数を決定する格子定数決定プロセスと、 この強度分布データに含まれているバックグラウンド散乱の影響を除去ない し低減する背景散乱除去プロセスと、
この結晶が属する空間群の候補を絞り込む空間群絞り込みプロセスと、 この結晶の基本構造を初期的に決定して、 この空間群を一つに特定する基本構 造決定プロセスと、
この基本構造を精密化して、 この結晶を構成する物質の構造をより精密に ¾定 する構造精密化プロセスとのうち、
少なくとも、 この格子定数決定プロセスと、 この空間群絞り込みプロセスと、 この基本構造決定プロセスとを有し、 '
この格子定数決定プロセスおよびこの基本構造決定プロセスのうち少なくと も一方で、 G A (遺伝的アルゴリズム) に局所最適化操作を組み合わせたハイブ リツド G Aを利用した物質構造決定が行われる.、
放射線回折データに基づく物質構造の推定方法であることを特徴とし、 前記ハイプリッド G Aでは、 世代交代の間に複数の特定世代で、 当該世代のポ ピュレーションの ち一部の個体である特定個体を対象にして前記局所最適化 操作が行われ、 ' この特定個体には、 当該世代のポピュレーションのうちでは実測データとの一 致度を示す適応度が比較的低い劣等グループからも選定される可能性があるこ と.を、 さらに特徴とする、
放射線回折データに基づく物質構造の推定方法。
2 3 . 所定の物理量に対応した複数のパラメータの適正な組合せを探索する機 能を、所定のコンピュータに発揮させるべきコンピュータ 'プログラムにおいて、 請求項 1〜請求項 1 4のうちいずれかの請求項に記載された 「ハイプリッ KG Aによる複数パラメータの最適化方法」 を実行するために、
当該請求項に記載された前記初期世代の前記ポピュレ一ションの生成および 読込のうち一方を行う初期世代設定ステップと、
当該請求項に記載された前記評価過程、 前記淘汰過程、 前記交叉過程、 前記突 然変異過程および前記局所最適化過程のそれぞれに対応する各演算ステップ (す なわち、 評価ステップ、 淘汰ステップ、 交叉ステップ、 突然変異ステップおよび
局所最適化ステップ) とを有することを特徴とする、
コンピュータにより実行可能な最適パラメータ探索プログラム。
2 4 . 所定の物理量に対応した複数のパラメータの適正な組合せを探索する機 能を、所定のコンピュータに発揮させるべきコンピュータ 'プログラムにおいて、 各世代のポピュレ一ションを形成する個体のそれぞれは、 前記所定の物理量に 対応した前記複数のパラメータを含む記号列からなり、 これらのパラメータがあ る程度の多様性をもって分布した初期世代から所定のルールで世代交代を重ね る.うちに、 より高い適応度をもつ前記個体が生成されることをもって、 前記複数 のパラメータの最適化を図る G A (遺伝的アルゴリズム) の中に、
前記適応度に関する局所最適化操作を所定の前記個体に対して行う局所最適 化ステップが組み込まれており、
この局所最適化ステップは、
前記 G Aで生成される全世代のうち一部にあたる複数の特定世代において: 当 該世代の前記ポピュレーシヨンのうち少なくとも一部にあたる特定個体を対象 にする演算ステップであることと、'
前記 G Aで生成される全世代のうち少なくとも一部にあたる複数の特定世代 において、 当該世代の前記ポピュレーションのうち一部にあたる特定個体を対象 にする演算ステップであることとのうち、
少なくとも一方であることを特徴とする、 .
コンピュータにより実行可能な最適パラメータ探索プログラム。
2 5 . 複数のパラメータの適正な組合せを探索する機能を、 所定のコンビユー タに発揮させるべきコンピュータ ·プログラムにおいて、
各世代のポピュレーションを形成する個体のそれぞれは、 前記複数のパラメ一 タに対応した記号列を含んでおり、 これらのパラメータがある程度の多様性をも つて分布した初期世代のポピュレーシヨンから始めて、 所定のルールで世代交代 を重ねるうちに、 より高レ、適応度をもつ前記個体が生成されることによって前記 複数のパラメータの最適化を図る G A (遺伝的アルゴリズム) の中に、
前記適応度に関する局所最適化操作を所定の前記個体に対して行う局所最適 化ステップが組み込まれており、
この局所最適化ステップは、
前記 G Aで生成される全世代のうち一部にあたる複数の特定世代において、 当 該世代の前記ポピュレーションのうち少なくとも一部にあたる特定個体を対象 にする演算ステップであることと、
前記 G Aで生成される全世代のうち少なくとも一部にあたる複数の特定世代 において、 当該世代の前記ポピュレーションのうち一部にあたる特定個体を対象 にする演算ステップであることとのうち、 ' .
少なぐとも一方であることを特徴とする、
コンピュータにより実行可能な最適パラメータ探索プログラム。
2 6 . 所定の試^に照射された放射線が形成する回折パターンに基づいて当該 試料を構成する物質の構造を推定す 機能を、 所定のコンピュータに発揮させる べきコンピュータ 'プログラムにおいて、
前記回折 ターンの実測データを数値的に読み込む実測データ読込ステップ と、
請求項 2 3に記載された 「最適パラメータ探索プログラム」 が有する前 初期 世代設定ステップ、 前記評価ステップ、 前記淘汰ステップ、 前記交叉ステップ、 前記突然変異ステップぉよび前記局所最適化ステップを有し、
前記適応度は、 前記各個体の前記記号列に相当する仮定された前記構造パラメ —タから算出される前記回折パターンの予想値が、 前記回折パターンの実測値に 対してどの程度一致するかを示す指数であることを特徴とする、
コンピュータにより実行可能な放射線回折データに基づく物質構造推定プロ グラム。
2 7 . 所定の試料に照射された放射線が形成する回折パターンに基づいて、 当 該試料を構成している物質の構造を規定する構造パラメータを推定する機能を、 所定のコンピュータに発揮させるべきコンピュータ ·プログラムにおいて、
各世代のポピュレーシヨンを形成する複数個の個体のそれぞれは、 前記構造パ ラメータに対応する記号列を含んでおり、
これらの個体のそれぞれがもつ適応度は、 当該個体に対応したこの構造パラメ ータから算出される回折パターンの予想値が、 前記回折パターンの実測値とどの 程度一致するかを示す指標であって、
この構造パラメータの各要素がある程度の多様性をもって分布するように、 こ れらの個体を生成して初期世代ポピュレーシヨンとする生成ズテツプをもち、 この初期世代ポピュレーシヨンから淘汰ス ップ、 交叉ステップおよび突然変 異ステップを含む所定の手順に従って世代交代を重ねるうちに、 当該世代ポピュ レーションの中にこの適応度がより高い前記個体が生成されることを待ち、 もつ て前記構造パラメータの最適化を図る G A (遺伝的アルゴリズム) の中に、 前記適応度に関する局所最適化操作を所定の前記個体に対して行う、局所最適 化ステップが組み込まれており、
この局所最適化ステップは、 · 前記 G Aで生成される全世代のうち一部にあたる複数の特定世代において、 当 該世代の前記ポピュレーシヨンのうち少なくとも一部にあたる特定個体を対象 にする演算ステップであることと、
前記 G Aで生成される全世代のうち少なく とも一部にあたる複数の特定世代 において、 当該世代の前記ポピュレーションのうち一部にあたる特定個体を対象 にする演算ステップであることとのうち、 ' 少なくとも一方であることを特徴とする、
コンピュータにより実行可能な放射線回折データに基づく物質構造推定プロ グラム。
2 8 . 請求項 2 3〜請求項 2 5のうちいずれかに記載された 「最適パラメータ 探索プログラム」 と、
請求項 2 6〜請求項 2 7のうち一方に記載された 「放射線回折データに基づく 物質構造推定プログラム」 とのうち、
少なくとも一方が記録されていることを特徴とする、
コンピュータ読み取り可能な記録媒体。
2 9 . 請求項 2 3〜請求項 2 5のうちいずれかに記載された 「最適パラメ一タ 探索プログラム」 と、
請求項 2 6および請求項 2 7のうち一方に記載された 「放射線回折データに基 づく物質構造推定プログラム」 とのうち、 、
少なくとも一方がインストールされているごとを特徴とする、
ハイブリッド G A搭載コンピュータ。 ' .
3 0 . 請求項 2 3〜請求項 2 5のうちいずれかに記載された 「最適パラメータ 探索プログラム」 と、
請求項 2 6およ ΐ 請求項 2 7のうち一方に記載された 「放射線回折データに基 づく物質構造推定プログラム」 との ち、 ' 少なくとも一方を実行可能なことを特徴とする、
ハイプリ:、シド G Αを搭載した解析装置。
3 1 . 所定の試料物質に放射線を照射して、 この試料物質から生じる回折バタ —ンを測定する測定装置と、
, この回折パターンから得られた実測データに基づいた解析を行うことにより、 当該試料物質の構造を推定する請求項 2 9記載のコンピュータおよび請求項 3 0記載め解析装置のうち一方と、
を有することを特徴とする、
放射線回折パターンによる物質構造推定装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/096,256 US20090210366A1 (en) | 2005-12-05 | 2006-12-04 | Method of optimizing multiple parameters by hybrid ga, method of data analysys by pattern matching, method of estimating structure of materials based on radiation diffraction data, programs, recording medium, and various apparatus related thereto |
JP2007549201A JP5055556B2 (ja) | 2005-12-05 | 2006-12-04 | ハイブリッドgaによる複数パラメータの最適化方法、パターンマッチングによるデータ解析方法、放射線回折データに基づく物質構造の推定方法、ならびに関連するプログラム、記録媒体および各種装置 |
EP06834369A EP1962234A4 (en) | 2005-12-05 | 2006-12-04 | METHOD FOR OPTIMIZING MULTIPLE PARAMETERS THROUGH HYBRID-GA, METHOD FOR ANALYZING DATA THROUGH PATTERN COMPARISON, METHOD OF SUBSTANCE ESTIMATION BASED ON RADIATION DEFRAKTOMETRIC DATA AND PROGRAM, RECORDING MEDIUM AND VARIOUS DEVICES RELATED THEREFROM |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005-350770 | 2005-12-05 | ||
JP2005350770 | 2005-12-05 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2007066787A1 true WO2007066787A1 (ja) | 2007-06-14 |
Family
ID=38122930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2006/324614 WO2007066787A1 (ja) | 2005-12-05 | 2006-12-04 | ハイブリッドgaによる複数パラメータの最適化方法、パターンマッチングによるデータ解析方法、放射線回折データに基づく物質構造の推定方法、ならびに関連するプログラム、記録媒体および各種装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20090210366A1 (ja) |
EP (1) | EP1962234A4 (ja) |
JP (1) | JP5055556B2 (ja) |
WO (1) | WO2007066787A1 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012194074A (ja) * | 2011-03-16 | 2012-10-11 | High Energy Accelerator Research Organization | 情報処理装置、情報処理方法及びプログラム |
CN111461911A (zh) * | 2020-01-17 | 2020-07-28 | 华中科技大学 | 一种基于混合nsga-ii的加工工件虚拟单元构建方法 |
WO2020218462A1 (ja) * | 2019-04-26 | 2020-10-29 | 株式会社日立製作所 | 粒子線実験データ解析装置 |
CN112380018A (zh) * | 2020-11-30 | 2021-02-19 | 海光信息技术股份有限公司 | 基于遗传算法的确定用于矩阵乘法的矩阵分块参数的方法 |
CN118937939A (zh) * | 2024-10-14 | 2024-11-12 | 常州顺创电气科技有限公司 | 高压设备局部放电定位方法、装置、计算机设备及存储介质 |
JP7594282B2 (ja) | 2021-02-15 | 2024-12-04 | 国立大学法人金沢大学 | 結晶性材料の評価方法 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5080146B2 (ja) * | 2007-06-19 | 2012-11-21 | 株式会社小野測器 | エンジンの設計変数の最適解を計算する方法、コンピュータ、及びプログラム |
JP4928484B2 (ja) * | 2008-02-29 | 2012-05-09 | 株式会社小野測器 | エンジンの設計変数を計算する方法、コンピュータ、及びプログラム |
WO2012015053A1 (ja) * | 2010-07-30 | 2012-02-02 | 株式会社リガク | X線回折方法及びその装置 |
US9009009B2 (en) | 2011-06-27 | 2015-04-14 | The Research Foundation For The State University Of New York | Method for predicting optimized crystal structures |
CN103093010B (zh) * | 2011-10-31 | 2016-01-27 | 深圳光启高等理工研究院 | 超材料单元结构体的设计方法及设计系统 |
CN103164554B (zh) * | 2011-12-14 | 2016-03-02 | 深圳光启高等理工研究院 | 一种确定超材料单元结构的方法 |
WO2014004370A1 (en) * | 2012-06-25 | 2014-01-03 | The Research Foundation For The State University Of New York | Method and apparatus for crystal structure optimization |
US10811908B2 (en) | 2014-09-25 | 2020-10-20 | Supply, Inc. | System and method for wireless power reception |
US9851313B2 (en) * | 2015-03-03 | 2017-12-26 | Panalytical B.V. | Quantitative X-ray analysis—ratio correction |
US10489713B1 (en) | 2015-08-26 | 2019-11-26 | Psibernetix, Inc. | Self-optimized system and method using a fuzzy genetic algorithm |
JP6630640B2 (ja) * | 2016-07-12 | 2020-01-15 | 株式会社日立製作所 | 材料創成装置、および材料創成方法 |
US10798665B2 (en) | 2017-06-06 | 2020-10-06 | Supply, Inc. | Method and system for wireless power delivery |
US10778044B2 (en) | 2018-11-30 | 2020-09-15 | Supply, Inc. | Methods and systems for multi-objective optimization and/or wireless power delivery |
US10341967B2 (en) | 2017-06-06 | 2019-07-02 | Supply, Inc. | Method and system for wireless power delivery |
US11178625B2 (en) | 2017-06-06 | 2021-11-16 | Supply, Inc. | Method and system for wireless power delivery |
EP3763015A4 (en) | 2018-03-08 | 2021-12-29 | Supply, Inc. | Method and system for wireless power delivery |
WO2020113096A1 (en) | 2018-11-28 | 2020-06-04 | Supply, Inc. | System and method for wireless power delivery |
KR102252062B1 (ko) * | 2019-12-31 | 2021-05-14 | 한국항공우주연구원 | 안테나의 구동을 최적화하는 방법, 장치 및 컴퓨터 프로그램 |
CN113366511B (zh) * | 2020-01-07 | 2022-03-25 | 支付宝(杭州)信息技术有限公司 | 利用遗传编程的命名实体识别和提取 |
WO2020143857A2 (en) | 2020-04-24 | 2020-07-16 | Alipay (Hangzhou) Information Technology Co., Ltd. | Named entity recognition and extraction using genetic programming |
US11580358B1 (en) | 2020-05-12 | 2023-02-14 | Thales, S.A. | Optimization with behavioral evaluation and rule base coverage |
US11530913B2 (en) * | 2020-09-24 | 2022-12-20 | Kla Corporation | Methods and systems for determining quality of semiconductor measurements |
CN112508481A (zh) * | 2020-12-03 | 2021-03-16 | 重庆邮智机器人研究院有限公司 | 一种智能仓储多agv调度方法 |
EP4324071A4 (en) | 2021-04-14 | 2025-05-07 | Reach Power Inc | WIRELESS ELECTRICAL NETWORKING SYSTEM AND METHOD |
CN114972185B (zh) * | 2022-04-19 | 2025-04-11 | 上海大学 | 一种基于统计建模的粉末x光衍射图期望最大化算法全谱线拟合方法 |
CN117892559B (zh) * | 2024-03-14 | 2024-06-14 | 西安现代控制技术研究所 | 一种超远程制导火箭总体协调多学科分级优化方法 |
CN119048811B (zh) * | 2024-08-08 | 2025-04-04 | 中江立江电子有限公司 | 基于玻璃绝缘子的壳体类型智能识别方法及装置 |
CN118628553B (zh) * | 2024-08-15 | 2024-11-22 | 泉州装备制造研究所 | 不规则晶体生长截面半径的实时估计方法和系统 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000086696A (ja) | 1998-09-08 | 2000-03-28 | Akira Kaji | リボソームリサイクリング因子(rrf)タンパクの結晶及び該結晶から得られる三次元構造情報に基づくラシヨナルドラグデザインへの応用 |
JP2001083106A (ja) | 1999-09-10 | 2001-03-30 | Rigaku Corp | 物質構造解析方法およびその装置 |
JP2001117901A (ja) | 1999-10-22 | 2001-04-27 | Fujitsu Ltd | ハイブリッド型遺伝的アルゴリズムの島モデルによる最適化問題処理方法およびその処理プログラム記録媒体 |
JP2001249953A (ja) * | 2000-03-03 | 2001-09-14 | Canon Inc | 光学薄膜の設計方法、光学薄膜の設計装置 |
JP2002071589A (ja) | 2000-08-31 | 2002-03-08 | Rigaku Corp | X線回折計測装置 |
JP2003149180A (ja) | 2001-11-13 | 2003-05-21 | Japan Synchrotron Radiation Research Inst | 1次元または2次元検出器を用いた粉末x線回折データ測定方法 |
JP2003219558A (ja) * | 2002-01-24 | 2003-07-31 | Hitachi Ltd | 配電系統制御装置および配電系統構成作成装置 |
JP2003248809A (ja) * | 1993-12-16 | 2003-09-05 | Fujitsu Ltd | 状態遷移の概念を導入した問題解決演算装置および方法 |
JP2003288579A (ja) | 2001-07-27 | 2003-10-10 | National Institute Of Advanced Industrial & Technology | 最適フィッティングパラメータ決定方法および装置、並びに最適フィッティングパラメータ決定プログラム |
JP2004037345A (ja) | 2002-07-05 | 2004-02-05 | Rigaku Corp | 試料ホルダ及びx線装置 |
JP2005500844A (ja) | 2001-08-14 | 2005-01-13 | ノバルティス・フォルシュングスシュティフトゥング・ツヴァイクニーダーラッスング・フリードリッヒ・ミーシェー・インスティトゥート・フォー・バイオメディカル・リサーチ | キナーゼ結晶構造ならびにキナーゼ活性化のための物質及び方法 |
JP2005190372A (ja) * | 2003-12-26 | 2005-07-14 | Shinka System Sogo Kenkyusho:Kk | パラメータ調整装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6052678A (en) * | 1993-12-16 | 2000-04-18 | Fujitsu Limited | Problem solving operation apparatus using a state transition |
US5510454A (en) * | 1995-01-20 | 1996-04-23 | E. I. Du Pont De Nemours And Company | Production of poly(ethylene terephthalate) |
-
2006
- 2006-12-04 WO PCT/JP2006/324614 patent/WO2007066787A1/ja active Application Filing
- 2006-12-04 EP EP06834369A patent/EP1962234A4/en not_active Withdrawn
- 2006-12-04 US US12/096,256 patent/US20090210366A1/en not_active Abandoned
- 2006-12-04 JP JP2007549201A patent/JP5055556B2/ja active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003248809A (ja) * | 1993-12-16 | 2003-09-05 | Fujitsu Ltd | 状態遷移の概念を導入した問題解決演算装置および方法 |
JP2000086696A (ja) | 1998-09-08 | 2000-03-28 | Akira Kaji | リボソームリサイクリング因子(rrf)タンパクの結晶及び該結晶から得られる三次元構造情報に基づくラシヨナルドラグデザインへの応用 |
JP2001083106A (ja) | 1999-09-10 | 2001-03-30 | Rigaku Corp | 物質構造解析方法およびその装置 |
JP2001117901A (ja) | 1999-10-22 | 2001-04-27 | Fujitsu Ltd | ハイブリッド型遺伝的アルゴリズムの島モデルによる最適化問題処理方法およびその処理プログラム記録媒体 |
JP2001249953A (ja) * | 2000-03-03 | 2001-09-14 | Canon Inc | 光学薄膜の設計方法、光学薄膜の設計装置 |
JP2002071589A (ja) | 2000-08-31 | 2002-03-08 | Rigaku Corp | X線回折計測装置 |
JP2003288579A (ja) | 2001-07-27 | 2003-10-10 | National Institute Of Advanced Industrial & Technology | 最適フィッティングパラメータ決定方法および装置、並びに最適フィッティングパラメータ決定プログラム |
JP2005500844A (ja) | 2001-08-14 | 2005-01-13 | ノバルティス・フォルシュングスシュティフトゥング・ツヴァイクニーダーラッスング・フリードリッヒ・ミーシェー・インスティトゥート・フォー・バイオメディカル・リサーチ | キナーゼ結晶構造ならびにキナーゼ活性化のための物質及び方法 |
JP2003149180A (ja) | 2001-11-13 | 2003-05-21 | Japan Synchrotron Radiation Research Inst | 1次元または2次元検出器を用いた粉末x線回折データ測定方法 |
JP2003219558A (ja) * | 2002-01-24 | 2003-07-31 | Hitachi Ltd | 配電系統制御装置および配電系統構成作成装置 |
JP2004037345A (ja) | 2002-07-05 | 2004-02-05 | Rigaku Corp | 試料ホルダ及びx線装置 |
JP2005190372A (ja) * | 2003-12-26 | 2005-07-14 | Shinka System Sogo Kenkyusho:Kk | パラメータ調整装置 |
Non-Patent Citations (22)
Title |
---|
B. KURIUKI ET AL.: "A new approach for indexing powder diffraction data based on whole-profile fitting and global optimization using a genetic algorithm", JOURNAL OF SYNCHROTRON RADIATION, vol. 6, 1999, pages 87 - 92, XP009047154, DOI: doi:10.1107/S0909049598017932 |
D. HARKER; J. S. KASPER: "Phases of Fourier Coefficients directly from Crystal Diffraction Data", ACTA CRYST., vol. 1, 1948, pages 70 |
D. SAYRE: "The Squaring Method: a New Method for Phase Determination", ACTA CRYST., vol. 5, 1952, pages 60 |
FUJITA KIKUO; AKAGI SHINSUKE; HIROKAWA NORIYASU: "Approach for Optimal Nesting Using Genetic Algorithm and Local Minimization Algorithm", TRANSACTIONS OF THE JAPAN SOCIETY OF MECHANICAL ENGINEERS (C, vol. 59, no. 564, 1993, pages 2576 - 2583 |
FUJITA KIKUO; AKAGI SHINSUKE; HIROKAWA NORIYASU: "Hybrid Approach for Optimal Nesting Using a Genetic Algorithm and a Local Minimization Algorithm", PROCEEDINGS OF THE 1993 ASME DESIGN AUTOMATION CONFERENCE, vol. 65-1, September 1993 (1993-09-01), pages 477 - 484 |
G. TURNER ET AL.: "Implementation of Lamarckian Concepts in a Genetic Algorithm for Structure Solution from Powder Diffraction Data", CHEMICAL PHYSICS LETTERS, vol. 321, 2000, pages 183 - 190, XP002583363, DOI: doi:10.1016/S0009-2614(00)00318-3 |
H. M. RIETVELD, J. APPL. CRYST., vol. 2, 1969, pages 65 |
HIROYASU TOMOYUKI: "Intelligent Information Science (AFIIS) Symposium", 2002, DOSHISHA UNIVERSITY ACADEMIC FRONTIER, article "Development and Parallization of Intelligent Optimization by Evolutionary Computation", pages: 2001 |
J. KARLE; H. A. HAUPTMAN, NOBEL PRIZE, 1985 |
K. HARRIS; R. JHONSTON; B. KARIUKI: "The Genetic Algorithm: Foundation and Applications in Structure Solution from Powder Diffraction Data", ACTA CRYST., vol. A54, 1998, pages 632 - 645 |
KAWANISHI H. ET AL: "Gyaku Elite Senryaku o Mochiita Kairyo Identeki Algorithm", THE TRANSACTIONS OF THE INSTITUTE OF ELECTRICAL ENGINEERS OF JAPAN C, vol. 118-C, no. 5, 1 May 1998 (1998-05-01), pages 707 - 713, XP003013690 * |
KOBAYASHI A. ET AL.: "Recent progress in development of single-component molecular metals", JOURNAL DE PHYSIQUE IV, vol. 114, 2004, pages 419 - 424 |
L. J. ESHELMAN; J. D. SCHAFFER: "Real-Coded Genetic Algorithm and Interval Schemata", FOUNDATION OF GENETIC ALGORITHM, vol. 2, 1993, pages 187 - 202 |
LE BAIL ET AL., MAT. RES. BULL., vol. 23, 1988, pages 447 |
M. SAKATA ET AL., ACTA CRYST., vol. A46, 1990, pages 263 |
MASANORI YOSHIDA ET AL.: "Crystal Structure of Large Ferrocene-Anthraquinone Complex Added with Benzene", DEPT. OF APPLIED PHYSICS, NAGOYA UNIV., DEPT. OF CHEMISTRY, SCHOOL OF SCIENCE, 6 December 2005 (2005-12-06) |
NISHIBORI EIJI: "The Development of a Method for an Accurate Structural Analysis by Synchrotron X-ray Powder Diffraction", JOURNAL OF THE CRYSTALLOGRAPHIC SOCIETY OF JAPAN, vol. 48, no. 3, 2006, pages 216 - 223 |
OMURA S. ET AL: "Heiretsuka ni Tekishita Identeki Local Search ni yoru Hisenkei Kansu Saitekika", TRANSACTIONS OF THE SOCIETY OF INSTRUMENT AND CONTROL ENGINEERS, vol. 40, no. 4, 30 April 2004 (2004-04-30), pages 448 - 457, XP003013689 * |
See also references of EP1962234A4 * |
SUZUKI W. ET AL.: "Structures of a single-component palladium complex with extended TTF-type dithiolate ligands, bis-(tetrathiafulvalenedithiolato) palladium determined by powder X-ray diffraction", CHEMISTRY LETTERS, vol. 32, 2003, pages 1106 - 1107 |
W. COCHRAN: "Relation between the Phases of Structures", ACTA CRYST., vol. 8, 1955, pages 473 |
YUICHI FUJISHIRO ET AL.: "MEM Electron Density Distribution of Ni(tmdt)2 and Au(tmdt)2 of Neutral Single-component Molecular Metal", THE CRYSTALLOGRAPHIC SOCIETY OF JAPAN ANNUAL MEETING 2003, 1 December 2003 (2003-12-01) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012194074A (ja) * | 2011-03-16 | 2012-10-11 | High Energy Accelerator Research Organization | 情報処理装置、情報処理方法及びプログラム |
WO2020218462A1 (ja) * | 2019-04-26 | 2020-10-29 | 株式会社日立製作所 | 粒子線実験データ解析装置 |
JP2020180922A (ja) * | 2019-04-26 | 2020-11-05 | 株式会社日立製作所 | 粒子線実験データ解析装置 |
JP7149532B2 (ja) | 2019-04-26 | 2022-10-07 | 株式会社日立製作所 | 粒子線実験データ解析装置 |
US11994454B2 (en) | 2019-04-26 | 2024-05-28 | Hitachi, Ltd. | Particle beam experiment data analysis device |
CN111461911A (zh) * | 2020-01-17 | 2020-07-28 | 华中科技大学 | 一种基于混合nsga-ii的加工工件虚拟单元构建方法 |
CN111461911B (zh) * | 2020-01-17 | 2022-08-16 | 华中科技大学 | 一种基于混合nsga-ii的加工工件虚拟单元构建方法 |
CN112380018A (zh) * | 2020-11-30 | 2021-02-19 | 海光信息技术股份有限公司 | 基于遗传算法的确定用于矩阵乘法的矩阵分块参数的方法 |
JP7594282B2 (ja) | 2021-02-15 | 2024-12-04 | 国立大学法人金沢大学 | 結晶性材料の評価方法 |
CN118937939A (zh) * | 2024-10-14 | 2024-11-12 | 常州顺创电气科技有限公司 | 高压设备局部放电定位方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
EP1962234A1 (en) | 2008-08-27 |
JPWO2007066787A1 (ja) | 2009-05-21 |
JP5055556B2 (ja) | 2012-10-24 |
EP1962234A4 (en) | 2010-07-07 |
US20090210366A1 (en) | 2009-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2007066787A1 (ja) | ハイブリッドgaによる複数パラメータの最適化方法、パターンマッチングによるデータ解析方法、放射線回折データに基づく物質構造の推定方法、ならびに関連するプログラム、記録媒体および各種装置 | |
Feng et al. | Introduction To Condensed Matter Physics, Volume 1 | |
Koniakhin et al. | Raman spectra of crystalline nanoparticles: replacement for the phonon confinement model | |
Iadonisi et al. | Introduction to solid state physics and crystalline nanostructures | |
Woolfson | The development of structural x-ray crystallography | |
Henderson et al. | Characterization of a disordered above room temperature skyrmion material Co8Zn8Mn4 | |
Badala Viswanatha et al. | Vectorial electron spin filtering by an all-chiral metal–molecule heterostructure | |
Lyubimov et al. | Micromechanisms of friction and wear: Introduction to relativistic tribology | |
Holtgrewe et al. | Evolution of topological surface states following Sb layer adsorption on Bi2Se3 | |
Hořava | Surprises with nonrelativistic naturalness | |
Mainzer | Symmetry and Complexity | |
Fredriksson et al. | Physics of functional materials | |
Ikeda et al. | A new direction in mathematics for materials science | |
Kochetkova et al. | Mn Interstitials in Layered Mn1+ x Sb2–2/3 x Te4: Structural Modification and Curie Temperature Boost | |
Schöpe et al. | Frustration of structural fluctuations upon equilibration of shear melts | |
Krumwiede et al. | Dendritic growth shapes in kinetic Monte Carlo models | |
Axe | Neutron scattering: Progress and prospects | |
Cabrera-Trujillo et al. | Amorphicity and structural changes in binary clusters | |
Antlanger | Ordered equilibrium structures in systems with long-range interactions | |
Sayle et al. | The atomistic structure of an MgO cluster, supported on BaO, synthesized using simulated amorphization and recrystallization | |
Beljin-Čavić et al. | Random sequential adsorption of polydisperse mixtures on a cubic lattice | |
Matyszczak et al. | Mathematical Modeling of Properties and Structures of Crystals: From Quantum Approach to Machine Learning | |
Kerscher et al. | Surface properties of alloys | |
Dujak et al. | Random sequential adsorption and percolation on discrete substrates | |
Jones | Towards high throughput single crystal neutron diffraction of hydrogen bonded molecular complexes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application | ||
DPE1 | Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101) | ||
WWE | Wipo information: entry into national phase |
Ref document number: 2007549201 Country of ref document: JP |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
WWE | Wipo information: entry into national phase |
Ref document number: 2006834369 Country of ref document: EP |
|
WWE | Wipo information: entry into national phase |
Ref document number: 12096256 Country of ref document: US |