论文摘要
化学是一门实验性的科学,积累了大量的文献和数据,这些文献和数据对化学及同化学有关研究领域有巨大的参考、应用价值。由于种种原因,在化学数据库所收集的文摘里,每种化合物名称并不一定附有它的化学结构式。如果需要获得某化合物相应化学结构式,就必须进行二次查阅,这对科研工作者带来了不便利的地方。 有机化合物由于结构复杂,命名是一件很麻烦的事情,不少有机化合物又有各种俗名,叫法不一,容易造成混乱。为此,国际纯粹与应用化学联合会(International Union of Pure and Applied Chemistry,简称IUPAC)制定了一系列的规则,用来规范有机化合物的命名。IUPAC命名法的特点是把结构与名称联系起来。知道了一个有机化合物的结构,根据命名法就能写出它的名称;反之,根据名称也可以知道这个有机化合物的机构。 美国《化学文摘》是世界六大检索系统之一,它出版的《化学物质索引》之中使用的化合物命名规则是在IUPAC系统命名法上发展起来的,它采用了一物一名的原则,让文献使用者在检索的时候不会产生混淆。 本文通过分析CA化学物质索引的命名规则,总结了CA索引名的特点,建立起名字中各个组分的识别方法,并设计了相应的识别流程。最后,还就化学结构片段组配的一些问题进行试验性的探讨。本论文创新之处,在于提出了分隔逗号与虚拟基团的概念,简化了识别规则,在此基础上对CA化学索引名进行分析,由此建立的初步识别方法,将有助于对CA索引名的深入研究和进一步发展实用的化学物质索引名分析方法。 本文分五部分内容:第一章,介绍本文的相关研究背景。第二章,介绍有机化合物的命名规则发展,IUPAC命名规则的特点,并列举了一些化合物的名字来说明。第三章,介绍CA所采用的索引种类,并对其采用的索引名字的特点作了初步的分析。第四章:从识别的角度上,详细分析了化学物质索引名字的命名规则,并从系统的角度探讨了识别的思路,以及对应的识别方法。第五章,举例说明识别规则的应用,并进行了讨论。