论文摘要
伴随世界旅游业的持续发展,北京迎来了良好的发展机遇,然而存在的问题也很突出。比如北京16个区和2个县都有其各自的旅游资源、发展条件和地理位置,由于这些自然因素和各个区县间的旅游发展政策等等,这些人为因素的不同使得旅游行业的发展出现了一定的差异性和不平衡现象,从而使得旅游的经济收入的发展差异问题越来越明显。因此,对北京旅游行业进行详细的分析和数据挖掘,从分析和挖掘结果中发现问题,并找到相应的整改措施,提高旅游经济收益,这对增加北京市旅游行业的外汇收入和就业机会的扩大提供了保障,同时也对带动相关产业的发展起了十分重要的作用。本文在收集整理北京旅游数据的基础上,使用建模方法和数据挖掘方法对北京旅游进行了详细的分析,首先研究了北京旅游的发展现状,对旅游的优点和缺点进行了分析,同时还详细研究了数据挖掘的发展现状和未来的发展方向及趋势,并且通过从大量的、模糊的、有噪声的、随机的但具有实际应用的数据中,提取隐含在其中的有用信息和知识,在此基础上,还针对北京旅游的发展现状,收集相关数据,建立北京旅游数据库,从海量的北京旅游信息中进行数据挖掘,进一步形成北京旅游产业经济指导,并使用数据应用SQL Server数据挖掘功能进行了数据挖掘建模,对建模结果进行了分析,本文尽量从量和型的侧面去考查现实中实际问题,尽最大可能通过简化或抽象确定出主要的参数和参量,并应用与各学科有关联的定律和原理建立它们之间的某种关系。最后,利用2001年至2009年北京市旅游数据,应用预测模型和聚类等数据挖掘技术进行了研究和分析,并编制代码实现了相关算法,挖掘结果证明了北京各个区县间旅游发展的不均衡现象和影响各区县旅游收入的综合因素。为了使北京旅游市场更好地发展,根据数据挖掘结果,提出了相关建议和研究方向,从而推动北京旅游业的整体发展。