一、基于语义的生物学专业搜索引擎设计(论文文献综述)
吴爽[1](2021)在《网络时代科学活动的变革研究》文中研究说明随着互联网技术的进步,科学交流不断获得新的工具和平台,传统的科学活动正面临更开放的环境,并可能引发整个科学系统的变革。Science 2.0让个体研究走向在线协作,使成果交流变成互动探索,成果刊布也由纸媒传播走向即时在线,全面提升了科学交流的时效性和广泛性。科学活动因互联网的发展正在发生一系列重大变革,传统的科学运行机制也逐步面临新的挑战,包括:科学活动过程出现新变化、科学成果发布呈现新趋势、科学成果传播面临新问题,科学评价机制迎接新挑战。进入互联网时代,科研主体走向了多元化的线上研究模式。一方面,网络时代开创了基于大数据的协同研发的新模式。大小科学的在线重构使得知识和信息实现广泛的交融,网络所搭建的共建和共享平台不仅实现了大科学项目资源和平台的共享,同时,分散在各地的小科学实验装置和数据也被系统地集成和聚合。此外,专门的数字馆藏还有云存储的出现不仅有助于解决海量数据存储的新难题,云计算管理技术与深度学习相关软件的开发也为大数据的在线并行分析和智能处理提供了新路径。这一科研模式的转变促使在线协作成为常态,有利于在海量数据中发现和挖掘新的知识和规律,有利于科学研究从部分走向整体,同时加强了学科的交叉和融合。另一方面,网络时代引领人类科学活动走向即时交流与全面协作的新时代。多元化的网络互动式平台将促使科学走向广泛而密集的合作,尤其是在线平台使众多学者的即时交互成为可能,这就意味着科学家可以通力合作,潜能得到最大的发挥,从而更高效地推动科学的进步。同时,在线科研的众包模式将最大化激发公众全面参与科研创新的热情。总之,网络实现人与人、人与信息、人与仪器的相互关联使科学活动走向全面开放与合作。在网络时代,科学成果发布平台的多样性和发布内容的丰富性逐渐推动学术出版走向开放、高质、高效,基于网络本体的成果发布方式将成为未来科学交流的核心。首先,网络预发布平台已在一些学科渐成新规,不仅对论文成果发表的时效性有质的提升,同时解决了纸质预印本的众多技术难题,对传统首发权的确认机制发起了挑战。其次,开放获取期刊打破了传统科技期刊的垄断僵局,将在实践模式和运营机制上推动出版体系的变革和重塑。社交网络平台的盛行和盗版网站的搅局更是扰乱了现有发表规则和格局,倒逼出版商积极适应开放获取的新形势。这些都将促成所有学术成果实现免费开放与共享,从而进一步突破传统交流体系的障碍。最后,网络技术的提升会促使科学交流体系的各个功能的在线重构,网络本体发布的新模式不仅意味着科研全程的在线呈现,人人皆可随时随地发表,同时,也要时时都能得到评论和反馈,又有精准、迅速的过滤机制和个性化的推荐服务。基于网络的发表模式和传播方式仍在摸索当中,但我们已经遇到了开放获取的路径偏差、优先权的判定疑难、评审机制的频频失效等难题。第一,开放获取在实践知识共享的理念过程中更着重于免费阅读文献导致其在制度设计、服务路径和运营模式方面都面临着困难,所以有必要重新审视科学出版体系的各个功能及其价值,包括:权威的筛选机制、持续的认证过程,和对读者提供个性化的搜索引擎服务,从而在技术变迁中实现这些功能和服务的优化升级,构筑更加合理、高效、健康的学术出版体系。第二,科学活动全面开放、即时共享,由此必将引发科学发现优先权和知识产权的一系列新问题。首先是优先权的判定将由以科研成果为主转向关注整个研究过程,随着科研主体的不断变化、科研过程的全面开放,优先权归属面临新的判定难题,需要重新考虑划分标准和判定规则;其次是优先权确认机制的变化,由于科研成果发布方式从传统媒介向在线网络转移,传统的以纸质媒介为主要依据的优先权确认机制亟待更新。第三,科学信息的自由发布和科研的全程在线必然导致现有过滤机制遭受全面危机。一方面,网络同行评审机制依然作为评判在线科研成果价值的主要手段,但要充分利用网络的即时性和有效性对其改造升级。另一方面,科学信息呈现多元化已经超过了传统过滤器的范围。实现信息流聚合和过滤的前提是面向整个科研流程的生态系统的构建,在此基础上,结合替代指标体系和定性化评论,从而提供个性化的搜索引擎服务,使得科学信息得到高效地利用。基于传统出版体系所构建的科学评价体系和奖励机制使科学难以实现媒体转换历史惯性的突破。传统学术评价体系依然局限在对论文的成果鉴定方面,不仅如此,正以一种扭曲的科研生态价值导向阻碍着科学朝向更开放、更多元的交流文化而发展。所以打造一个适应网络环境的评价体系势在必行。替代计量学旨在多元科学度量标准的开发和应用,不仅评价对象多元化,可以识别并衡量学术成果的新形式,同时影响力的范围也被拓展了,除了全面衡量学术影响力,还包括科学成果对整个社会影响的潜力。不过作为促进开放科学的关键因素,现阶段的发展依然还集中在论文级别的影响力的架构,并未真正开启向开放科学的过渡评价指标的构建,还需要以开放科学愿景和框架进行补充。随着替代指标的开发和成熟,势必就要改变激励结构,纠正失调的激励机制。通过全面地考虑研究人员的产出,我们将走向一个更有用和更灵活的学术交流系统,这也是未来科学活动走向更加开放、进行全程协作的基础。
刘培[2](2020)在《基于大数据的网络空间主流意识形态传播研究》文中提出信息技术、互联网与计算机等技术建构的网络空间成为与现实社会空间并存的第二空间。但网络空间不是一成不变的,而是在技术发展中不断演进的。随着大数据技术在互联网领域应用的广泛推进,借助于大数据可以量化一切的强大计算能力,网络空间确已进入到一个高度依赖数据和算法的阶段,形成了新型的“大数据-网络空间”。“大数据-网络空间”是在大数据技术深度介入下形成、以数据生态为核心、以算法为主导的、虚实深度交融的网络空间。它不仅是世界的数据化再现,而且是大数据算法与人的意向性协同敞开的网络空间。作为大数据技术形塑的空间,“大数据-网络空间”不是固态的、稳定的、不可更改的,而是可以被技术发展与各类媒体、政党、国家等主体意愿建造、编制和构筑,即“大数据-网络空间”具有可塑造性。“大数据-网络空间”作为各种意识形态和社会思潮的传播载体和场域,同样也为主流意识形态传播带来了机遇与挑战。一方面,“大数据-网络空间”为主流意识形态的传播带来了受众、传播内容、传播方式与传播效果的可量化与可计算,实现了精准化和个性化传播。另一方面,“大数据-网络空间”亦为主流意识形态传播带来挑战,主要包括:大数据技术理性张扬下传播者经验的下降与自身的隐匿、数据化传播受众画像的失真、假新闻深度转向与传播生态的后真相化、资本逻辑与算法逻辑对主流意识形态传播逻辑的干扰。面对这些挑战,已有相关研究往往集中在大数据技术薄弱、西方的数据霸权和意识形态渗透方式的多样化等方面进行探讨,而忽视了“大数据-网络空间”自身的可塑造性。“大数据-网络空间”与主流意识形态传播的关系不仅仅是大数据以工具性载体助推网络空间主流意识形态的传播,更重要的是“大数据-网络空间”是被技术和各种意识形态共同塑造与建构的。由此,主流意识形态的传播必然要求塑造“大数据-网络空间”,以提升主流意识形态的传播能力。如何塑造“大数据-网络空间”以提升主流意识形态传播能力成为一个重要问题。首先,要规避算法主导的传播方式,建构基于传播者与受众能动性的个性化传播,从而积极地影响、修正甚至改变算法推荐主导的传播内容,以塑造主流意识形态在“大数据-网络空间”的核心地位。其次,以主流价值导向驾驭算法从而建构“主流价值算法”。主流价值算法通过纠正流量至上的价值导向以消解各种社会思潮和意识形态对主流意识形态传播空间的挤压,从根本上塑造一个正能量的“大数据-网络空间”。再次,展开数据素养和政治素养的双维教育。通过数据素养教育提升传播者和传播受众的数据素养,同时强化大数据技术人员的意识形态教育。最后,推动大数据检测技术与平台监管齐头并进。积极研发大数据检测技术,以检测、识别和过滤虚假信息。且按照精细化、区别化的原则进行分类分级地监管各类传播媒体与平台,健全法律与行业规范的双重规制,从而有力推进“大数据-网络空间”主流意识形态的传播。
王维佳[3](2020)在《学术信息聚合系统的特点和发展趋势》文中认为调研国内外医学文献学术信息聚合系统,剖析了现有系统的资源组织原理和特点,梳理了资源聚合的主要方法和模式。从用户需求理论的基本观点出发,探讨了学术信息聚合系统未来的发展趋势,旨在为学术信息聚合平台的聚合方法提供可靠的引导和参考。
陈露[4](2020)在《面向智慧医疗的文本规范化研究》文中认为随着智慧医疗的兴起,以好大夫在线、丁香医生、春雨医生为代表的医疗健康移动终端成为医疗界最大的医疗健康信息产生与交换的渠道,同时也为智慧医疗方面的科学研究提供了丰富的数据资源。用户使用医疗健康移动终端常常以自我诊断、医疗健康知识问答为目的,但是由于缺乏专业的医学背景知识,对健康状况的描述往往比较口语化,导致自我诊断和医疗健康知识问答的目的难以实现。若是用户发表的医疗健康文本或问题能得到有效的规范化,可以更好地提升智慧医疗的服务效果,这在医疗健康领域具有较大的社会与现实意义。因此,本文面向不同的智慧医疗场景,对医疗健康文本展开了规范化研究,创新点如下:一是针对智慧医疗中的智能分诊,提出了基于双通道网络的文本规范模型。智能分诊包括自我诊断、辅助挂号和辅助寻医等场景,模型对文本的规范化旨在提高文本分类的准确率,因此,考虑选择医疗健康文本的语义作为要规范的要素。模型首先设计了两个通道,用来学习并提取医疗健康文本的特征;接着设计了对抗机制,通过来源判别和科室分类两个任务相互对抗实现用户健康术语的提取;然后基于提取的词语,利用双通道结构进行编码校正,实现文本语义的规范化;最后将规范后的语义编码输入分类器进行科室分类,从而实现智能分诊。实验结果证明,基于双通道网络的文本规范化模型能够有效规范医疗健康文本的语义,并且能够显着提升智能分诊的准确率。二是针对智慧医疗中的智能问答,提出了基于词语填空策略的文本规范模型。智能问答是指用户在搜索引擎、医疗健康在线平台上提出医疗健康问题的场景。在智能问答场景中,用户健康术语作为问题的关键词,成为需要规范的要素,以期通过用户健康术语的规范,使获取的答案更准确。模型的输入包括三种文本,不规范问题、相关的规范问题、隐藏了一个用户健康术语的不规范问题;模型的核心思想是从规范的问题中提取词语填充到被隐藏用户健康术语的位置,使得重构后的问题能够得到与原始不规范问题一致的序列标注结果。模型首先使用GRU网络对输入进行特征提取;然后将规范的问题文本输入CNN网络学习权重分布W,并基于W提取词语,接着根据设计的函数将词语准确填充到被隐藏用户健康术语的位置;最后将不规范问题文本和重构后的不规范问题文本分别输入CNN-CRF结构,用于序列标注和损失计算。模型对两个CNN-CRF结构设置了参数共享,从而使得第一个CNN-CRF结构对第二个CNN-CRF结构产生正则化效果,同时也使得第二个CNN-CRF结构的序列标注结果更多地依赖于词语填空的准确度。实验在百度阅读理解数据集Du-Reader上展开,通过比对实验证明了基于词语填空策略的文本规范模型能够有效规范用户健康术语。
刘建平[5](2020)在《科学数据用户相关性判断模型研究》文中指出在开放科学环境和“数据密集型”科学研究范式的驱动下,科学数据的重要性持续提升。在FAIR原则和关联数据技术的影响下,更多的科学数据以富含语义的形式进入网络传播。然而,我们对科学数据用户如何做出某条科学数据相关与否的判断过程知之甚少。因此,本研究以科学数据用户相关性判断行为及其认知机理为研究切入点,理解和建模科学数据用户相关性判断过程,以期丰富和拓展信息科学领域相关性研究,同时为科学数据专属的搜索技术研发提供理论基础。相关性是信息科学的基础概念之一,理解用户对特定类型信息对象做出相关性判断的过程、原理、影响因素以及作用效果,始终是信息科学特别是信息检索学者们的关注点。学者们先后研究了科技论文、文本文档、网页、多媒体、社交媒体等多种类型的相关性,大数据以及科学数据的相关性是最近的关注,并且因其区别于其他信息类型的认知和技术特点而吸引了越来越多的研究兴趣。本论文尝试以实证的方式构建科学数据用户相关性判断模型。通过对用户相关性判断过程的描述、核心认知过程量化验证和模型的算法化设计,进而为科学数据搜索与推荐提供理论基础。为此,本研究在综述已有研究的基础上提出了认知导向的相关性判断假设性概念模型和相应的研究目标。并基于此,顺次开展了三个层次的实证研究:1)科学数据用户相关性判断描述性概念模型研究;2)科学数据用户相关性判断实证性量化模型研究;3)多标准相关性排序(Multi-Criteria Relevance Ranking,MCRR)算法及其应用框架设计。本研究共得出以下研究结论:首先,论文通过静态要素识别验证了科学数据用户相关性判断描述性概念模型。模型中识别了24个科学数据信息元(Scientific Data Information Elements,SDIEs)、3类决策规则、12个一级相关性标准、4类相关性标准维度。基于此,论文提出了TAQA-U(Topicality,Availibility,Quality,Authority and Usefulness)科学数据用户相关性标准结构,为用户导向的科学数据查询与检索实践提供了“静态”指导原则。其次,基于偏最小二乘结构方程模型(Partial Least Squares Structural Equation Modeling,PLS-SEM)量化方法,实证验证了科学数据查询与检索交互过程中科学数据相关性标准使用结构模型,即科学数据用户相关性判断实证性量化模型。论文验证了主题相关性标准在用户相关性判断中的先决条件作用,验证了可用性、质量和权威性的中介作用,验证了有用性作为科学数据用户判断数据对象的结果变量。同时,研究实证验证了科学数据用户相关性判断的个性化认知模式主要体现在相关性标准动态组合使用的差异上。最后,基于描述性概念模型和实证性量化模型研究发现与结果,研究设计了多标准相关性排序(MCRR)算法及其应用框架。该算法综合考虑了用户多标准相关性判断的认知本质:1)综合计算多标准得分,而非主题词匹配模式下的单一维度相关性;2)引入优先级算子计算不同标准(集)之间的等级关系。同时,研究提出了认知导向的科学数据检索与推荐框架以支撑个性化科学数据检索与推荐实践。综合以上研究结果与发现,论文的主要学术贡献与创新体现在:1)论文从三个水平(描述性概念模型/实证性量化模型/算法化表达)创新地提出并验证了科学数据用户相关性判断模型。同时,将用户相关性判断研究对象拓展到科学数据及其用户,在理论上丰富和发展了用户相关性研究进程。2)探索了从描述性概念模型到量化模型到算法表达的连续性用户相关性判断研究路径;3)提出了认知导向的科学数据检索与推荐框架,为智能、个性化科学数据检索与推荐提供了理论基础。未来研究将在理论和实践上进一步丰富和发展认知导向的科学数据查询与检索研究。在理论上,扩大研究情境(如科学数据与科技文献的关联搜索)和用户类型(如专门针对科学数据领域专家),完善和发展已有理论模型;在实践上,以个性化科学数据检索与推荐为切入点,开发认知导向的科学数据查询与推荐系统,提升科学数据的复用率和价值,支撑开放科学背景下的科研创新。
李洁[6](2019)在《数据驱动下数字图书馆知识发现服务创新模式与策略研究》文中提出我们已经从信息时代走进了数据驱动的“智能时代”,数据成为人们认识和解决问题的新的逻辑起点。“数据驱动”打破了基于知识解决问题的思维桎梏,形成了从问题到数据又回归问题的新方法论认识——基于数据解决问题。这一研究范式将数字图书馆知识发现服务从对问题本源的探索推向知识服务的本真,可以说,从数据直面用户、管理和服务为大数据环境下的数字图书馆知识发现服务供给侧的改革提供了一种新思路:知识发现服务要改变的不只是管理技术、管理规则或服务形式,而要涉及整个管理理念和服务体系。而大数据环境中,数字图书馆信息发生源越来越多,数据产出量越来越大,数字资源增长速率越来越快,数据异构性越来越明显,数据老化节奏越来越快,低价值密度隐患的知识饥渴和数据海啸的矛盾越来越突出,用户对发现服务的需求越来越多元,数字图书馆数据资源正面临着重新被发现的挑战。迎面变化和挑战,数字图书馆的知识发现服务不单要完成从文献数字化到内容数据化的知识组织转型,更应实现数字资源从内容数据化到数据智能化的价值开发和智慧洞见。数据驱动的科研范式开辟了知识发现的新路径,开启了数字图书馆知识服务的时代新转型。探索数据驱动理念下的数字图书馆知识发现服务模式的新形态,需要学习、内化数据科学相关理论,需要剖析知识发现的驱动要素和作用机制,需要打破传统的资源发现固化模式,创建知识发现服务的创新生态功能圈。融合数据驱动和知识发现的双重技术优势,数字图书馆知识发现服务创新模式应趋从数据化、数据向知识转化的语义关联、可视化和智能化驱动维度寻求用户数据、内容资源数据、专家数据、业务数据的新协同,开发用户画像、研究设计指纹、精准文献推荐等的新应用,强化数据的集群整合、提升平台的绿色联通、实现用户界面的友好交互,使数字图书馆成为支持用户知识探索与发现创造的智能服务系统,使数据资源最大化的进行价值开发与知识转化,使用户随时随地都能受益于数字图书馆高效、便捷、友好与智能的知识发现服务体验。基于此,本文通过对数据驱动、知识发现研究成果的追本溯源,界定数据驱动下的数字图书馆知识发现服务的核心理念;通过文献分析、调查访谈、仿真实验、模型训练等方法的综合运用,分析数字图书馆知识发现服务创新的数据环境、驱动机制、创新模式、模式应用以及创新策略制定。围绕主要研究内容,本文第三章从数据环境特征、数据环境变化和数据环境开发分析数据驱动下的数字图书馆知识发现服务的机遇与挑战;第四章结合数据要素、数据驱动过程、数据驱动维度探讨数字图书馆知识发现服务的数据驱动动力机制、流机制、协同驱动机制和数据驱动控制机制;第五章通过对数字图书馆知识发现服务模式创新衍变的内在使命分析,指出数字图书馆知识发现服务创新模式的构建依据、构建基础和构建过程;第六章对数字图书馆知识发现服务创新模式进行具体的用户画像、研究设计指纹、文本推荐和多粒度检索决策应用;第七章针对数字图书馆知识发现服务创新模式的具体瓶颈给出各驱动维度的应对策略。具体内容阐述如下:第3章数据驱动下数字图书馆知识发现服务的数据环境分析本章是对大数据驱动环境下的数字图书馆知识发现服务场域的情境解构。首先,基于大数据的4V特征,面向全数据,分析数字图书馆知识发现服务在数据形态、存在方式、存储模式、存储内容、数据价值等方面的特性。其次,探讨数据化、新一代信息技术、数据分析思维、数据密集型科学发现范式影响下的数字图书馆知识发现服务革新的优劣利弊。最后,基于环境特性和环境变化的双向作用状态定位数字图书馆知识发现服务发展的开发方向。明确本文研究目的的同时,引出4、5、6、7章节的主要研究任务。第4章数字图书馆知识发现服务创新的数据驱动机制分析本章作为第5章的铺垫,详细解析数字图书馆知识发现服务平台的数据要素和驱动作用形式。通过用户数据、资源内容数据、专家数据的分类界定,为第6章科研用户画像、研究设计指纹、精准文献推荐等的服务模式应用提供数据基础;通过数据化、语义关联、可视化、智能化的数据驱动维面的层级解构,为第7章的创新策略制定奠定优化主线;基于数据要素、驱动过程和驱动维面,从内外力作用的动力机制、输入-输出的流机制、数据融合的协同驱动机制以及数据驱动控制机制具体呈现数据驱动与知识发现服务交互融合的催化反应。第5章数据驱动下数字图书馆知识发现服务创新模式研究在前文研究的基础上,本章首先对数据驱动下数字图书馆知识发现服务创新模式的构建进行内在逻辑分析;其次,从资源发现既有模式、知识产品和技术支持方面阐述实现数字图书馆知识发现服务创新的外在基础;最后,综合内在逻辑和外在基础,进行创新模式的基础框架和平台架构的初步解构,并在此基础上进行数据驱动下的数字图书馆知识发现服务创新功能圈构建。第6章数据驱动下数字图书馆知识发现服务创新模式应用研究本章在第5章提出的创新模式的基础上,分别利用科研用户数据进行数字图书馆百度发现的科研用户画像构建,利用文献数据进行以研究对象、研究问题与研究方法为核心要素的研究设计指纹构造,结合用户画像和研究设计指纹实现精准文献推荐,并通过用户检索实验验证多粒度检索决策的优势。第7章数据驱动下数字图书馆知识发现服务创新策略研究基于第4章对数据驱动维度和驱动机制的分析,本章旨在明确数据化、语义化、关联化、可视化和智能化驱动的创新方向并进行相应的优化路径设计,针对数字图书馆知识发现服务创新的制约因素,给出切实可行的解决方案与对策建议。大数据环境下,重新界定数据驱动下的数字图书馆知识发现服务的内涵、探讨数字图书馆知识发现服务的数据驱动机制、创新数字图书馆既有的资源发现服务模式,有利于从方法论认识层面为数字图书馆知识发现服务的供给侧改革提供理论支持。数字图书馆知识发现服务的意义不仅在于它的统一检索及其延伸功能,更在于此基础上辅助科学发现的循证决策、智能管理和知识再造的服务价值。在人类不断探索未知与努力认识未知的道路上,数据驱动+知识发现的催化反应为科学发现的方法探索提供了一个可行参考,推动着数字图书馆知识发现服务在不断革新的历程中惠及更多的求知受众。
朱明奇[7](2019)在《基于垂直搜索的意图识别算法的设计与实现》文中研究表明垂直搜索是一种专业领域内的搜索,与通用搜索不同,垂直搜索需要深度理解用户意图并返回特定领域内的信息。由于垂直搜索引擎中需要针对不同领域训练多个意图识别模型,同时训练模型需要大量的标注,所以在垂直搜索场景下训练意图识别模型的代价是较高的。本文主要解决在垂直搜索场景下训练意图识别模型成本大的问题。作者的主要工作包括基于SimNet的语义向量预训练和基于迁移学习的意图识别模型训练。(1)基于SimNet的语义向量预训练,主要利用搜索引擎积累的海量数据,预训练基于语义的句向量。作者利用本文首创的QUQ(Query to Url to Query)游走算法获取大量的弱标注样本,通过海量样本训练SimNet模型,最终根据SimNet模型生成语义向量。经过实验验证,语义向量可以很好的表达句子语义,并具有一定的泛化性。(2)基于迁移学习训练意图识别模型,主要利用预训练的语义向量迁移到意图识别模型中,并且利用主动学习与迁移学习减少标注成本。首先将样本转化为语义向量并利用种子样本初始化意图识别模型,然后利用改进后的最优标号与次优标号(Best vs Second-best,BvSB)算法,降低了样本冗余并且挑选出信息量较高的样本,最后利用该样本训练意图识别模型。经过实验验证,利用迁移学习训练意图识别模型,可以减少一半以上的标注成本;利用改进的BvSB算法挑选样本,可以进一步降低标注成本,并提高模型的准确率。百度垂直搜索已经有大小十余个领域利用本文工作训练意图识别模型,训练成本有很大幅度的减少。相关模型已经应用到百度搜索中,提升了上亿搜索用户的搜索体验。
郝世博[8](2015)在《数字资源互操作及服务融合中的信任管理机制研究》文中研究表明现代信息技术的飞速发展对世界各国政治、经济、社会等领域产生了全面而深刻的影响。当前时期,全面推进我国信息化和数字信息资源建设已经成为我国经济社会发展新阶段重要而紧迫的战略任务。图书馆、博物馆、档案馆等机构作为当今社会重要的公共文化服务基础设施有力推动了数字信息资源的建设与共享。众多学者开始在以图博档为代表的公共文化服务机构中探索数字资源整合及服务融合等方面的研究,并取得了阶段性成果。伴随互联网环境的形成与数字信息技术的发展普及,大量馆藏资源通过网络为用户提供超越时空的服务。如何为用户提供深层次、一体化的信息资源服务,形成知识资源的无缝集成与协同共享环境,成为近年来国内外图情领域十分关注的研究课题。当前基于开放网络的新兴分布式计算模式越来越多地出现在人们日常生活中,并开始应用于图博档等公共文化服务机构。高度自治的参与主体、复杂灵活的交互协作和多变异构的网络环境已经成为当前数字信息资源共享与服务融合过程中呈现出的典型特征。基于上述网络环境,实现充分的数字信息资源共享和安全的交互协作面临若干新的问题。信任管理机制作为当前能够有效解决分布式、开放网络环境中安全问题的核心支撑技术之一,有助于在没有足够先验知识的参与实体之间进行有效、健康协作关系的构建与维护。针对信任管理领域的相关问题,国内与国外研究人员都进行了较为广泛的研究工作,多种专用或通用信任管理模型被先后提出。然而,当前已经存在的信任管理机制或模型在应对不断涌现的新需求、新环境和新应用时,还是在信任表征、信任获取、反馈信任聚合以及信任度评估等方面表现出种种不足。本文拟从数字资源互操作和数字化服务融合用户交互的双重视角出发,为满足分布式开放环境中数字资源互操作和服务融合的安全及信任需要,在深入分析国内外现有研究成果的基础上,进行数字资源互操作信任管理机制、数字化服务融合信任协商机制等相关研究,为图博档数字资源互操作与服务融合提供安全可靠、方便快捷的网络环境。本文首先对选题意义及研究背景进行简要介绍,探析国内外相关领域的研究进展,详细阐述本研究工作中涉及的相关核心概念和基础理论,为本研究的顺利进行寻找理论依据。然后对当前信任管理和自动信任协商存在的系统架构与典型模型进行论述,深入分析现阶段信任管理机制存在的多种应用模式;针对数字资源互操作及服务融合这一研究主题,分析国内外典型的应用实践,论述数字资源互操作存在的典型应用系统,从可行性、广度和深度等方面探析数字化服务融合模式;针对当前开放、动态网络环境下数字资源互操作、数字化服务融合用户交互过程中存在的信任问题和安全需求,分别构建数字资源互操作的信任管理模型和数字化服务融合的自动信任协商模型;在数字资源互操作信任管理模型的研究中详细设计各个功能模块,并给出其中动态信任评估模型的设计原则,针对反馈信任聚合机制存在的问题进行新型反馈信任聚合机制的研究,通过仿真实验验证该机制的有效性;在数字化服务融合自动信任协商模型的研究中详细设计各个功能模块,具体论述自适应自动信任协商流程及其实例、访问控制策略描述方式、一致性校验算法、改进的策略语言逻辑结构等。最后系统归纳本文相关的研究工作,总结研究结论和研究贡献,指出本文研究工作的局限并探讨后续还需努力的研究方向。
陈鹏飞[9](2011)在《基于个性化本体的语义搜索引擎技术的研究与设计》文中研究指明随着网络的普及和飞速发展,网上信息以指数的形式增长。这些海量信息在给人们带来丰富资源的同时,也给人们对如何有效地获取和使用这些信息带来了巨大的挑战。传统搜索引擎在一定程度上缓解了这一矛盾,然而,由于其无法理解这些信息的语义,导致它的检索质量和效果远远无法令人满意,其查全率和查准率还有待提高。语义搜索引擎将检索策略从传统的关键词层面上升到语义层面,结合智能推理技术,改善搜索的性能。语义搜索技术实现了信息的语义表示,知识推理,语义相关度计算,可以有效地解决当前检索技术所面临的困境。本文首先介绍了搜索引擎的工作原理,分类和评价标准。接着详细研究了搜索引擎的现状,并分析了存在的问题。进而引出了语义搜索引擎,介绍了语义搜索引擎的相关术语,研究了其关键技术、工作原理及其发展和应用现状。针对传统搜索引擎存在的不能理解语义的缺陷,本文提出了基于个性化本体的语义搜索引擎,并结合传统搜索引擎的技术和优势设计了一个可以增加语义理解功能的搜索引擎Sendu。Sendu引擎采用Heritrix作为爬虫在网络上抓取信息资源,以Lucene框架构建传统的搜索引擎作为基础,为了增加语义理解能力,使用本体编辑工具protégé来创建领域本体。Sendu引擎通过使用本体将用户查询关键词转换成可识别领域语义的术语。Sendu使用RDF API——jena来进行推理,得到与用户搜索关键词有语义关系的词汇,比如同义词、上位词等。这些扩展的术语将会提高搜索引擎的查全率,比如当搜索“计算机”这个词的时候,jena根据本体知识库,将会推导出它的同义词“电脑”,这样就将最终的查询扩展了查询“计算机”和“电脑”相关的网页。本体将以一种灵活的方式对术语进行组织。Sendu引擎还提出了增加三个语义搜索过滤器来过滤掉一些用户不想获得的网页,在原型系统实现时,可以让用户采取定制的方式来实现,比如,如果用户不考虑网上的一些PDF资源,那么语义搜索过滤器将会把这种格式的文档过滤,解决了当前搜索引擎忽略一些格式的文档资源。最后,本文实现了Sendu引擎原型系统,获得了较好的查全率和查准率。通过对这个系统性能的评估,对系统的改善提出了进一步意见,并对语义搜索引擎的应用前景进行了展望。
王镠璞[10](2010)在《基于用户体验的互联网搜索引擎医学信息检索可用性评估研究》文中研究说明伴随着互联网迅猛的发展,世界已经进入了互联网时代,一个重要的标志就是爆炸性的信息共享。如今互联网已经成为人们获取所需信息的主要途径之一,越来越多的人使用互联网这种便捷的信息获取途径来查找自己所需的卫生保健信息和医疗医药知识。对于从互联网上获取所需信息的众多方法来说,信息搜索引擎无疑是最主要的一种,它往往成为人们查询有关健康卫生信息以及疾病和药物基础知识的首选方式。于是,通过搜索引擎所获得的信息的可用性和准确性,以及如何高效和便捷的获取所需信息就成了众多用户所经常遇到的问题。本文正是以此为研究的切入点,首次从软件工程的角度,将产品(服务)的可用性评估中可量化的可用性测试的相关方法应用于互联网的医学健康信息获取的可用性研究中。对当下搜索引擎服务行业市场份额占有率最高的Google, Yahoo!, Bing, Ask.com四种主流搜索引擎在用户获取医学健康信息方面的表现,以及各搜索引擎之间的侧重和异同进行了深入的比较和评估。我们采用由实际用户对互联网搜索引擎所检索到的有关医学健康信息内容的搜索返回结果内容进行评分的数据量化方式,来体现搜索引擎用户的真实用户体验。应用软件工程可用性评估中的可用性测试方法对搜索引擎医学健康信息检索进行基于用户体验的可用性评估研究。本研究对于提升互联网医学健康信息相关搜索的可用性以及用户如何更高效快捷的获取所需信息方面提出了建议和借鉴。
二、基于语义的生物学专业搜索引擎设计(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于语义的生物学专业搜索引擎设计(论文提纲范文)
(1)网络时代科学活动的变革研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景和意义 |
1.2 文献综述及研究问题 |
1.2.1 网络时代科学活动整体的变革 |
1.2.2 网络时代科研模式的变革 |
1.2.3 网络时代基于大数据科研方式的变革 |
1.2.4 网络时代出版模式趋势分析 |
1.2.5 开放共享背景下科学活动面临系列问题 |
1.3 研究内容、方法与可能的创新点 |
1.3.1 研究内容 |
1.3.2 研究方法 |
1.3.3 可能的创新之处 |
第2章 从Science 1.0到Science 2.0 |
2.1 小科学与大科学 |
2.1.1 从小科学时代到大科学时代 |
2.1.2 科学发展对信息载体需求的变化 |
2.2 信息载体变革与Science 2.0的提出 |
2.2.1 纸媒到Web 2.0: 载体发展过程存在阶段性质变 |
2.2.2 载体的质变对科学活动产生重要的影响 |
2.2.3 网络逐渐已经成为科学活动的主流载体 |
2.3 Science 2.0时代科学活动新特征 |
2.3.1 使个体研究走向在线协作 |
2.3.2 使成果交流走向全程探索 |
2.3.3 由纸媒传播走向即时在线 |
2.4 小结 |
第3章 网络时代科学活动过程的新变化 |
3.1 网络时代科研主体的新变化 |
3.1.1 独立主体内涵的丰富 |
3.1.2 不同主体联系的增强 |
3.1.3 协作主体交流的拓展 |
3.1.4 创造主体格局的突破 |
3.2 网络时代数据处理的新演化 |
3.2.1 数据采集走向自动化 |
3.2.2 数据存取实现即时化 |
3.2.3 数据分析呈现协同化 |
3.2.4 数据处理尝试智能化 |
3.3 小结 |
第4章 网络时代科学成果发布的新趋向 |
4.1 科学成果发布的新舞台:网络预发布平台的建立与推广 |
4.1.1 纸媒预发表的瓶颈 |
4.1.2 网络预发布平台的建立——以物理学arXiv为例 |
4.1.3 网络预发布平台的推广——以PeerJ Preprints和bioRxiv为例 |
4.1.4 网络预发布平台与期刊共存 |
4.2 科学成果发布的新途径: 开放获取期刊的出现和发展 |
4.2.1 开放获取期刊旨在打破访问权限 |
4.2.2 开放获取期刊的发展步履维艰 |
4.2.3 开放获取期刊是新希望还是乌托邦? |
4.2.4 开放获取期刊的未来: 资本和价值的共生 |
4.3 科学成果发布的新模式: 基于网络本体成果发布的探索 |
4.3.1 去中心化: 人人皆可随时发表 |
4.3.2 去期刊化: 随时随地皆可发表 |
4.3.3 未来: 一条微博可能就是你的学术成果 |
4.3.4 科学评价和认可机制的再造 |
4.4 小结 |
第5章 网络时代科学成果传播的新问题 |
5.1 开放获取的功与过 |
5.1.1 需与传统商业期刊出版体系相抗衡 |
5.1.2 在与资本不断斡旋中出现偏差 |
5.1.3 在对传统功能地解构中不断重构 |
5.2 传播方式的“是”与“非” |
5.2.1 在网上分享自己的论文也算侵权? |
5.2.2 Sci-Hub存在本身就是价值 |
5.2.3 出版商的权利比分享研究的利益更重要? |
5.3 谁来确认优先权 |
5.3.1 科研主体多元化所导致的优先权归属难题 |
5.3.2 科研过程开放化所造成的优先权判定疑难 |
5.3.3 信息载体的升级导致科学创意及成果发布方式的变化 |
5.3.4 成果发布渠道的多样化导致优先权确认机制的变化 |
5.4 在线科学信息价值的判定疑难 |
5.4.1 传统同行评审机制频繁失效导致判定失真 |
5.4.2 传播方式多样化导致依据出版的评判标准失效 |
5.4.3 传播内容多样性亟待建立新的过滤机制 |
5.4.4 网络时代的过滤机制由谁重构: 从同行评审走向全面过滤 |
5.5 小结 |
第6章 网络时代科学评价机制的新挑战 |
6.1 默顿理想的背离 |
6.1.1 “普遍主义”遭破坏 |
6.1.2 “公有性”被侵犯 |
6.1.3 “无私利性”的缺失 |
6.2 科学计量评价的新机遇: 替代计量学 |
6.2.1 矫正传统评价机制带来的“马太效应” |
6.2.2 推动论文评价指标走向“多元即时透明” |
6.2.3 构建面向科研全程的个人学术影响力评价体系 |
6.3 科学奖励机制的新内容: 基于科研产品的全面认定 |
6.3.1 从科研成果走向科研产品 |
6.3.2 最大限度地激发集体在科研全程地全面合作 |
6.3.3 从个体成果认定到产品认证集成 |
6.4 小结 |
第7章 网络时代科学活动的变革与应对 |
7.1 科学活动在线化与科学协作创新的演变 |
7.2 成果发布网络化与在线交流系统的构建 |
7.3 信息动态交互与优先权和过滤机制的再造 |
7.4 评价方式变化与科学社会运行机制的调整 |
7.5 在危机与变革中走向科学活动新常态 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的其他研究成果 |
(2)基于大数据的网络空间主流意识形态传播研究(论文提纲范文)
致谢 |
摘要 |
abstract |
1 绪论 |
1.1 问题的缘由与研究价值 |
1.2 国内外研究动态与文献评析 |
1.3 研究思路与研究方法 |
1.4 研究创新点与难点 |
2 主流意识形态传播与网络空间的内在关联 |
2.1 意识形态概念的演变 |
2.2 主流意识形态传播方式的变迁 |
2.3 网络空间及其可塑性 |
2.4 网络空间与主流意识形态传播的内在关联维度 |
3 大数据技术对网络空间的形塑 |
3.1 大数据技术:网络空间变革的技术基础 |
3.2 大数据技术的生产力属性与功能 |
3.3 “大数据-网络空间”的界定 |
3.4 “大数据-网络空间”的本质 |
3.5 “大数据-网络空间”的主要特征 |
4 “大数据-网络空间”主流意识形态传播的机遇与挑战 |
4.1 “大数据-网络空间”主流意识形态传播的机遇 |
4.2 技术理性的张扬与传播者的遮蔽 |
4.3 数据化受众画像的失真 |
4.4 假新闻扰乱主流意识形态传播环境 |
4.5 政治逻辑、算法逻辑与资本逻辑的博弈 |
5 掌握主流意识形态传播的主动权:提升塑造“大数据-网络空间”的能力 |
5.1 建构基于传播者与受众能动性的个性化传播 |
5.2 设计主流价值算法 |
5.3 展开数据素养与政治素养双维度教育 |
5.4 大数据检测技术与监管齐头并进 |
6 结论 |
参考文献 |
作者简介 |
学位论文数据集 |
(3)学术信息聚合系统的特点和发展趋势(论文提纲范文)
1 研究设计 |
1.1 研究对象与研究目的 |
1.2 研究方法 |
2 学术信息语义聚合系统实例 |
2.1 Semantic Scholar平台 |
2.2 Coremine Medical平台 |
2.3 Chilibot平台 |
2.4 String平台 |
2.5 Pubstract Helper |
3 医学学术信息聚合的模式 |
3.1 基于任务的语义聚合模式 |
3.2 基于语义概念的医学信息资源聚合 |
3.3 基于语义关系的医学信息资源聚合 |
4 医学信息聚合系统的特征 |
4.1 以元搜索为数据采集基础 |
4.2 以知识网络为表现型的文档网络 |
4.3 以共现为关联的基本原理 |
5 学术信息聚合系统发展趋势 |
5.1 拓宽学术信息语义聚合的维度 |
5.2 提升学术信息语义聚合的需求匹配度 |
6 结语 |
(4)面向智慧医疗的文本规范化研究(论文提纲范文)
摘要 |
ABSTRACT |
绪论 |
一、研究背景及意义 |
二、相关研究综述 |
三、本文的创新点与结构 |
第一章 文本规范化的相关技术 |
第一节 文本规范化的要素 |
一、一般文本规范化的要素 |
二、医疗健康文本规范化的要素 |
第二节 文本规范化的经典模型 |
一、一般文本规范化的经典模型 |
二、医疗健康文本规范化的经典模型 |
第二章 面向智能分诊的文本规范化模型 |
第一节 智能分诊的场景分析 |
一、智能分诊的场景 |
二、医疗健康文本与电子病历文本的差异 |
第二节 基于双通道网络的文本规范化模型 |
一、基本思路 |
二、特征提取 |
三、用户健康术语提取 |
四、语义规范 |
五、目标函数 |
第三节 实验设计与分析 |
一、数据采集与预处理 |
二、实验设置 |
三、实验结果分析 |
第三章 面向智能问答的文本规范化模型 |
第一节 智能问答的场景分析 |
一、医疗健康问答的场景 |
二、面向智能问答的文本规范 |
第二节 基于词语填空策略的文本规范化模型 |
一、基本思路 |
二、特征提取 |
三、序列标注 |
四、词语填空策略 |
五、目标函数 |
第三节 实验设计与分析 |
一、数据准备与划分 |
二、实验设置 |
三、评估指标 |
四、超参数选择 |
五、模型结构评估 |
六、规范化效果的衡量 |
第四章 总结与展望 |
第一节 总结 |
第二节 展望 |
参考文献 |
在学期间发表的研究成果 |
致谢 |
(5)科学数据用户相关性判断模型研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 研究目标与内容 |
1.3 研究设计 |
第二章 用户相关性研究综述 |
2.1 信息科学中的相关性 |
2.1.1 相关性理论 |
2.1.2 相关性研究视角 |
2.1.3 相关性概念 |
2.2 用户相关性判断 |
2.2.1 相关性判断的驱动力——信息需求 |
2.2.2 相关性判断发生的情境——信息交互过程 |
2.2.3 用户相关性判断模型 |
2.3 用户相关性标准 |
2.3.1 相关性标准的定义与功能 |
2.3.2 用户相关性标准识别研究 |
2.3.3 相关性标准使用研究 |
2.4 本章小结 |
第三章 科学数据及其查询与检索研究 |
3.1 科学数据的重要性分析 |
3.1.1 社会信息中的科学数据 |
3.1.2 科学研究中的科学数据 |
3.2 数据以及科学数据概念与特征 |
3.2.1 数据的基本概念与特征 |
3.2.2 科学数据的概念与特征 |
3.3 科学数据认知与期望 |
3.4 科学数据发现与检索 |
3.4.1 系统导向的科学数据检索实践 |
3.4.2 用户导向科学数据查询与检索探索 |
3.4.3 科学数据查询与检索面临的问题 |
3.5 科学数据相关性判断模型研究必要性与意义 |
3.5.1 科学数据相关性判断研究的必要性 |
3.5.2 科学数据相关性判断研究的意义 |
3.6 本章小结 |
第四章 科学数据用户相关性判断模型研究设计 |
4.1 概念假设模型 |
4.1.1 概述 |
4.1.2 理论依据 |
4.1.3 认识导向的相关性判断假设性概念模型 |
4.2 研究目的、目标与科学问题 |
4.3 研究设计 |
4.3.1 研究方法论 |
4.3.2 技术路线 |
4.3.3 研究策略 |
4.4 本章小结 |
第五章 科学数据用户相关性判断描述性概念模型研究 |
5.1 概述 |
5.2 研究设计 |
5.2.1 概念模型与科学问题 |
5.2.2 研究过程 |
5.3 被试遴选 |
5.4 数据收集 |
5.4.1 检索前访谈 |
5.4.2 相关性判断行为测量与数据采集 |
5.4.3 检索后访谈—情境再入式半结构化访谈 |
5.5 数据处理与分析 |
5.5.1 编码与内容分析 |
5.5.2 眼动数据处理 |
5.6 研究结果与分析 |
5.6.1 科学数据相关性标准识别 |
5.6.2 科学数据信息元(SDIEs)及其与标准之间的关系 |
5.6.3 科学数据用户相关性/有用性 |
5.6.4 相关性判断的认知加工特征分析 |
5.6.5 决策规则识别 |
5.6.6 科学数据用户相关性判断描述性概念模型总结 |
5.7 研究发现与结论 |
5.7.1 科学数据相关性判断的认知整合/透镜过程 |
5.7.2 科学数据相关性标准结构TAQA-U及其价值 |
5.7.3 科学数据相关性标准特征分析 |
5.7.4 科学数据相关性判断的多标准决策认知本质 |
5.8 本章小结 |
第六章 科学数据用户相关性判断实证性量化模型研究 |
6.1 概述 |
6.2 研究设计 |
6.2.1 研究问题 |
6.2.2 研究过程 |
6.3 第一阶段:描述性验证 |
6.3.1 被试遴选 |
6.3.2 数据收集 |
6.3.3 数据分析 |
6.3.4 研究结果 |
6.4 第二阶段:实证性量化研究 |
6.4.1 概念模型与研究假设 |
6.4.2 数据收集与处理 |
6.4.3 研究结果与分析 |
6.5 研究发现与结论 |
6.5.1 科学数据用户相关性标准使用特征分析 |
6.5.2 基于相关性标准结构的科学数据用户相关性判断模式分析 |
6.6 本章小结 |
第七章 多标准相关性排序(MCRR)算法及其应用框架设计 |
7.1 概述 |
7.2 MCRR多标准相关性排序算法 |
7.2.1 算法需求 |
7.2.2 算法设计 |
7.2.3 MCRR算法流程 |
7.2.4 算法功能与价值 |
7.3 应用框架设计 |
7.3.1 用户导向的科学数据查询与检索模型 |
7.3.2 基于MCRR算法的科学数据查询与推荐系统框架 |
7.3.3 框架特色介绍 |
7.4 本章小结 |
第八章 结论与展望 |
8.1 研究结论 |
8.1.1 提出并验证了科学数据用户相关性判断模型 |
8.1.2 探索了多标准相关性性排序算法及其应用框架 |
8.2 创新性分析 |
8.2.1 理论创新 |
8.2.2 研究方法创新 |
8.3 研究不足与未来研究 |
8.3.1 研究不足 |
8.3.2 未来研究与展望 |
参考文献 |
附录 A |
附录 B |
附录 C |
附录 D |
致谢 |
作者简历 |
(6)数据驱动下数字图书馆知识发现服务创新模式与策略研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 数据驱动研究现状 |
1.2.2 知识发现研究现状 |
1.2.3 研究现状评析 |
1.3 研究内容、方法与技术路线 |
1.3.1 研究内容 |
1.3.2 研究方法 |
1.3.3 研究技术路线 |
1.4 创新点 |
第2章 相关概念与理论基础 |
2.1 相关概念 |
2.1.1 数据驱动 |
2.1.2 知识发现 |
2.1.3 Web级资源发现 |
2.1.4 数字图书馆知识发现服务 |
2.2 理论基础 |
2.2.1 数据密集型科学发现理论 |
2.2.2 数据驱动控制理论 |
2.2.3 数据挖掘与知识发现理论 |
2.3 本章小结 |
第3章 数据驱动下数字图书馆知识发现服务的数据环境分析 |
3.1 数字图书馆知识发现服务的数据环境特征 |
3.1.1 馆藏数据来源的广泛性及数据形态和存在方式的多样性 |
3.1.2 数据存储模式多样化及存储内容的非结构化和碎片化 |
3.1.3 数据资源价值的低密度和高变现潜能 |
3.2 数字图书馆知识发现服务的数据环境变化 |
3.2.1 从“数字化”到“数据化”的演化 |
3.2.2 新一代信息技术的涌现 |
3.2.3 数据分析思维模式的形成 |
3.2.4 数据密集型科学发现应用趋势 |
3.3 数字图书馆知识发现服务的数据环境开发与应用 |
3.3.1 数字图书馆知识发现服务在大数据环境中的新定位 |
3.3.2 开发数字图书馆知识发现服务数据驱动的新机制 |
3.3.3 创新数据驱动下数字图书馆知识发现服务的新模式 |
3.3.4 开发数据驱动下数字图书馆知识发现服务的新业态 |
3.4 本章小结 |
第4章 数字图书馆知识发现服务创新的数据驱动机制分析 |
4.1 数字图书馆知识发现服务创新数据驱动机制的数据要素 |
4.1.1 用户数据要素 |
4.1.2 内容资源要素 |
4.1.3 专家数据要素 |
4.2 数字图书馆知识发现服务创新的数据驱动过程与维度 |
4.2.1 数字图书馆知识发现服务创新的数据驱动过程 |
4.2.2 数字图书馆知识发现服务创新的数据驱动维度 |
4.3 数字图书馆知识发现服务创新的数据驱动动力机制 |
4.3.1 数字图书馆知识发现服务创新的数据驱动动力类型 |
4.3.2 数字图书馆知识发现服务创新的数据驱动动力关系分析 |
4.3.3 数字图书馆知识发现服务创新的数据驱动动力仿真模型 |
4.4 数字图书馆知识发现服务创新的流驱动机制 |
4.4.1 数字图书馆知识发现服务创新的流驱动特征 |
4.4.2 数字图书馆知识发现服务创新的流驱动过程 |
4.4.3 数字图书馆知识发现服务创新的流驱动机制模型 |
4.5 数字图书馆知识发现服务创新的数据协同驱动机制 |
4.5.1 数字图书馆知识发现服务创新的数据协同驱动内涵 |
4.5.2 数字图书馆知识发现服务创新的数据协同驱动目标 |
4.5.3 数字图书馆知识发现服务创新的数据协同驱动机制模型 |
4.6 数字图书馆知识发现服务创新的数据驱动控制机制 |
4.6.1 数字图书馆知识发现服务创新的数据驱动控制内涵 |
4.6.2 数字图书馆知识发现服务创新的数据驱动控制方法 |
4.6.3 数字图书馆知识发现服务创新的数据驱动控制模型 |
4.7 本章小结 |
第5章 数据驱动下数字图书馆知识发现服务创新模式研究 |
5.1 数字图书馆知识发现服务创新模式问题的提出 |
5.2 数字图书馆知识发现服务创新模式构建基础 |
5.2.1 数字图书馆知识发现服务创新的模式基础 |
5.2.2 数字图书馆知识发现服务创新的产品基础 |
5.2.3 数字图书馆知识发现服务创新的技术基础 |
5.3 数字图书馆知识发现服务创新功能圈构建 |
5.3.1 数字图书馆知识发现服务创新功能圈的框架设计 |
5.3.2 数字图书馆知识发现服务创新功能圈的架构分析 |
5.3.3 数字图书馆知识发现服务创新功能圈的建立 |
5.4 本章小结 |
第6章 数据驱动下数字图书馆知识发现服务创新模式应用研究 |
6.1 数字图书馆知识发现服务科研用户画像应用 |
6.1.1 用户画像数据收集 |
6.1.2 用户画像模型构建 |
6.1.3 用户画像实验分析 |
6.2 数字图书馆文献资源研究设计指纹识别应用 |
6.2.1 研究设计指纹识别基础 |
6.2.2 数据标注 |
6.2.3 研究设计指纹生成模型训练 |
6.2.4 结果与讨论 |
6.3 融合用户画像和研究设计指纹的文献推荐应用 |
6.3.1 文献推荐模型构建 |
6.3.2 文献推荐仿真实验 |
6.3.3 结果与讨论 |
6.4 数字图书馆知识发现服务多粒度检索决策应用 |
6.4.1 实验准备 |
6.4.2 实验描述 |
6.4.3 实验结果及讨论 |
6.5 本章小结 |
第7章 数据驱动下数字图书馆知识发现服务创新策略研究 |
7.1 数字图书馆知识发现服务创新的优化方向与路径 |
7.1.1 数字图书馆知识发现服务创新的优化方向 |
7.1.2 数字图书馆知识发现服务创新的优化路径 |
7.2 数字图书馆知识发现服务创新的数据化优化 |
7.2.1 数据化优化阻碍 |
7.2.2 数据化优化策略 |
7.3 数字图书馆知识发现服务创新的语义关联优化 |
7.3.1 语义关联优化阻碍 |
7.3.2 语义关联优化策略 |
7.4 数字图书馆知识发现服务创新的可视化优化 |
7.4.1 可视化优化阻碍 |
7.4.2 可视化优化策略 |
7.5 数字图书馆知识发现服务创新的智能化优化 |
7.5.1 智能化优化阻碍 |
7.5.2 智能化优化策略 |
7.6 本章小结 |
第8章 研究结论与展望 |
8.1 研究结论 |
8.2 研究局限 |
8.3 研究展望 |
参考文献 |
作者简介与研究成果 |
致谢 |
(7)基于垂直搜索的意图识别算法的设计与实现(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 引言 |
1.1 研究背景与意义 |
1.2 国内外研究发展现状 |
1.2.1 垂直搜索发展现状 |
1.2.2 主动学习发展现状 |
1.2.3 迁移学习发展现状 |
1.3 论文的主要工作以创新点 |
1.4 论文的组织结构 |
2 相关理论与关键技术 |
2.1 SimNet框架 |
2.2 长短期记忆网络 |
2.3 迁移学习 |
2.4 主动学习 |
2.5 开发平台 |
2.6 本章小节 |
3 基于SimNet语义向量预训练 |
3.1 数据预处理 |
3.1.1 数据清洗 |
3.1.2 利用QUQ产出弱标注样本 |
3.1.3 QUQ算法流程 |
3.2 利用SimNet模型训练语义向量 |
3.2.1 样本向量化 |
3.2.2 利用LSTM构建表示层 |
3.2.3 利用余弦相似度构建匹配层 |
3.2.4 语义向量训练流程 |
3.3 实验与验证 |
3.3.1 数据集介绍 |
3.3.2 实验结果分析 |
3.4 本章小结 |
4 基于迁移学习的意图识别模型 |
4.1 利用预训练模型向量化样本 |
4.2 意图识别模型训练 |
4.2.1 多层感知机器模型结构 |
4.2.2 多层感知机器模型训练 |
4.3 利用主动学习减少标注成本 |
4.3.1 利用主动学习挑选训练样本 |
4.3.2 利用迁移学习降低训练样本冗余 |
4.3.3 完整的训练样本筛选流程 |
4.4 实验与验证 |
4.4.1 数据集介绍 |
4.4.2 实验结果分析 |
4.4.3 意图识别模型应用 |
4.5 本章小结 |
5 结论 |
5.1 工作总结 |
5.2 展望 |
参考文献 |
作者简历及攻读硕士/博士学位期间取得的研究成果 |
学位论文数据集 |
(8)数字资源互操作及服务融合中的信任管理机制研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景 |
1.2 研究综述 |
1.2.1 数字资源建设、共享与整合 |
1.2.2 国内外LAM研究 |
1.2.3 信任管理研究 |
1.2.4 总结 |
1.3 研究内容与方法 |
1.3.1 研究内容 |
1.3.2 研究方法 |
1.3.3 框架结构 |
第2章 相关概念及理论基础 |
2.1 相关概念阐述 |
2.1.1 互操作 |
2.1.2 服务融合 |
2.1.3 信任的定义 |
2.1.4 信任的属性 |
2.2 理论基础 |
2.2.1 系统论 |
2.2.2 协同论 |
2.2.3 知识组织理论 |
2.3 本章小结 |
第3章 信任管理机制及应用模式分析 |
3.1 信任管理 |
3.1.1 定义 |
3.1.2 信任管理模型 |
3.1.3 凭证信任管理系统 |
3.1.4 行为信任管理模型 |
3.2 自动信任协商 |
3.2.1 定义 |
3.2.2 自动信任协商基本概念 |
3.2.3 现有自动信任协商系统 |
3.3 信任管理机制应用模式分析 |
3.3.1 P2P网络信任管理 |
3.3.2 普适计算信任管理 |
3.3.3 网格计算信任管理 |
3.3.4 Ad hoc网络信任管理 |
3.3.5 电子商务信任管理 |
3.4 本章小结 |
第4章 数字资源互操作及服务融合模式分析 |
4.1 国内外应用实践分析 |
4.1.1 Europeana |
4.1.2 世界数字图书馆 |
4.1.3 美国IMLS支持项目实践 |
4.1.4 CALIS |
4.2 数字资源互操作模式探析 |
4.2.1 数字资源整合原则与方法 |
4.2.2 Metalib with SFX系统 |
4.2.3 MAP系统 |
4.2.4 TPI系统及USP平台 |
4.2.5 数字资源互操作典型系统总结 |
4.3 数字化服务融合模式探析 |
4.3.1 数字化服务融合的可行性分析 |
4.3.2 数字化服务融合的广度分析 |
4.3.3 数字化服务融合的深度分析 |
4.4 跨域环境下安全互操作的实践分析 |
4.4.1 安全检测实施维度下的互操作 |
4.4.2 协作架构维度下的互操作 |
4.4.3 建模辅助维度下的互操作 |
4.5 本章小结 |
第5章数字资源互操作中的信任管理研究 |
5.1 OAI-PMH协议 |
5.2 数字化协作模式构建 |
5.3 数字化协作模式面临的问题 |
5.4 数字资源互操作信任管理模型构建 |
5.4.1 动态信任管理的内涵 |
5.4.2 LAM信任管理模型构建 |
5.4.3 动态信任评估模型的设计原则 |
5.5 动态信任评估算法设计 |
5.5.1 传统反馈信任聚合机制研究 |
5.5.2 新型反馈信任聚合机制研究 |
5.5.3 仿真实验及结果分析 |
5.6 本章小结 |
第6章 数字化服务融合的信任协商研究 |
6.1 信任协商策略需求 |
6.2 LAM-AATN模型构建 |
6.3 LAM-AATN信任协商流程 |
6.4 LAM-AATN信任协商实例研究 |
6.5 LAM-AATN一致性校验研究 |
6.5.1 访问控制策略描述研究 |
6.5.2 一致性校验算法研究 |
6.6 LAM-AATN策略语言研究 |
6.6.1 策略语言功能需求 |
6.6.2 LAM-AATN-Jess策略语言 |
6.6.3 LAM-AATN-Jess语法结构 |
6.7 本章小结 |
第7章 总结与展望 |
7.1 研究结论与贡献 |
7.1.1 研究结论 |
7.1.2 研究贡献 |
7.2 研究不足与展望 |
7.2.1 研究不足 |
7.2.2 研究展望 |
参考文献 |
攻读博士学位期间科研成果 |
致谢 |
(9)基于个性化本体的语义搜索引擎技术的研究与设计(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
§1-1 研究背景 |
§1-2 研究内容 |
§1-3 论文工作安排 |
第二章 搜索引擎原理及现状分析 |
§2-1 搜索引擎概述 |
§2-2 搜索引擎原理和结构 |
2-2-1 页面收录模块 |
2-2-2 页面分析和索引建立模块 |
2-2-3 检索模块 |
2-2-4 用户接口模块 |
§2-3 搜索引擎的分类 |
2-3-1 按照工作原理分类 |
2-3-2 按照领域范围分类 |
2-3-3 按照信息类型分类 |
§2-4 搜索引擎评价标准 |
§2-5 搜索引擎现状和发展方向 |
第三章 基于语义的搜索引擎技术 |
§3-1 语义网概念 |
§3-2 XML 介绍 |
3-2-1 XML 发展 |
3-2-2 XML Schema 规范及其组成部分 |
§3-3 RDF、RDFS 介绍 |
3-3-1 RDF 简介 |
3-3-2 RDF Schema |
§3-4 本体(Ontology)介绍 |
3-4-1 本体的概念和分类 |
3-4-2 本体的构建 |
3-4-3 本体在语义搜索中的应用 |
第四章 基于个性化本体的语义搜索引擎的研究与设计 |
§4-1 Sendu 语义搜索引擎体系和过程 |
§4-2 个性化本体的结构与创建 |
4-2-1 个性化本体的灵活结构 |
4-2-2 个性化本体的构建 |
§4-3 语义搜索过滤器 |
4-3-1 可读性过滤器 |
4-3-2 文档结构输出过滤器 |
4-3-3 语义范围过滤器 |
§4-4 Sendu 引擎原型系统实现及分析 |
第五章 总结与展望 |
参考文献 |
致谢 |
(10)基于用户体验的互联网搜索引擎医学信息检索可用性评估研究(论文提纲范文)
提要 |
第一章 绪论 |
1.1 研究的意义和目的 |
1.2 研究的选题来源 |
1.3 研究的主要工作 |
1.4 本文的结构 |
第二章 研究背景介绍 |
2.1 生物信息学 |
2.1.1 生物信息学的产生和发展 |
2.1.2 生物信息学的主要研究方向 |
2.2 互联网 |
2.2.1 互联网的定义 |
2.2.2 互联网的产生历史 |
2.2.3 互联网的发展状况 |
第三章 可用性评估 |
3.1 可用性和可用性评估 |
3.1.1 可用性的概念 |
3.1.2 可用性评估的定义 |
3.1.3 可用性评估的作用 |
3.2 用户体验 |
3.2.1 用户中心设计思想 |
3.2.2 用户体验的相关知识 |
3.3 可用性评估的主要方法 |
3.3.1 行为分析 |
3.3.2 启发式评估 |
3.3.3 认知过程走查 |
3.3.4 可用性测试 |
第四章 SNOMED CT的相关研究 |
4.1 SNOMED CT简介 |
4.1.1 SNOMED的发展过程 |
4.1.2 SNOMED CT的特点和功能 |
4.2 SNOMED CT的组成和结构 |
4.2.1 SNOMED CT标准数据包 |
4.2.2 概念表 |
4.2.3 描述表 |
4.2.4 关系表 |
4.3 SNOMED CT的应用 |
4.3.1 临床信息系统 |
4.3.2 电子化医学辞典 |
4.3.3 药物信息管理 |
4.3.4 中医临床标准术语集 |
第五章 互联网搜索引擎 |
5.1 搜索引擎的产生和历史 |
5.1.1 搜索引擎的概念 |
5.1.2 搜索引擎的发展历程 |
5.2 搜索引擎的分类 |
5.2.1 全文搜索引擎 |
5.2.2 目录索引搜索引擎 |
5.2.3 元搜索引擎 |
5.2.4 非主流搜索引擎 |
5.3 搜索引擎的性能评估 |
5.3.1 评估指标的演变 |
5.3.2 查全率 |
5.3.3 查准率 |
5.3.4 响应时间和用户负担 |
5.3.5 用户体验 |
5.4 搜索结果的排序技术 |
5.4.1 依据网站排名的网页排序 |
5.4.2 网页排序算法 |
5.4.3 关键字竞价排序 |
第六章 互联网医学信息资源 |
6.1 互联网信息资源 |
6.1.1 信息资源状况 |
6.1.2 信息资源获取途径 |
6.1.3 信息搜索概况 |
6.2 互联网医学信息资源 |
6.2.1 医学信息资源概况 |
6.2.2 医学信息资源的可用性 |
6.2.3 Google搜索引擎的应用 |
第七章 研究方法的设计与实现 |
7.1 Google在医学信息检索中的用户体验评估 |
7.1.1 评估方法的设计 |
7.1.2 评估方法的实现 |
7.2 多搜索引擎在医学信息检索中的用户体验评估 |
7.2.1 评估方法的设计 |
7.2.2 评估方法的实现 |
第八章 Google搜索引擎的可用性评估 |
8.1 搜索结果样本分析 |
8.1.1 搜索结果有效性分析 |
8.1.2 搜索结果样本PR值分析 |
8.1.3 专家推荐网页的检索情况 |
8.2 受测用户评分结果分析 |
8.2.1 专家推荐网页的受测用户评分情况 |
8.2.2 用户排序与Google排序的比较 |
8.2.3 受测用户的评分差异 |
8.3 搜索结果样本网页信息量分析 |
8.3.1 样本网页信息量分布 |
8.3.2 网页信息量与Google搜索结果的分析 |
8.3.3 网页信息量与受测用户评分结果的分析 |
8.4 Google搜索引擎的可用性评估结果 |
第九章 多搜索引擎的可用性评估 |
9.1 搜索结果样本分析 |
9.1.1 搜索结果有效性分析 |
9.1.2 搜索结果样本PR值分析 |
9.1.3 专家推荐网页的检索情况 |
9.2 多引擎搜索结果的相似性分析 |
9.2.1 搜索结果完全相同 |
9.2.2 搜索结果末级域名相同 |
9.3 搜索结果样本网页类型的分析 |
9.3.1 四种网页类型的总体分布 |
9.3.2 各搜索结果样本组中网页类型的分布 |
9.3.3 四种类型样本网页的PR值分析 |
9.4 受测用户评分结果分析 |
9.4.1 专家推荐网页的受测用户评分情况 |
9.4.2 各搜索结果样本组的受测用户评分情况 |
9.4.3 四种类型样本网页的受测用户评分情况 |
9.4.4 受测用户的评分差异 |
9.5 搜索结果样本网页信息量分析 |
9.5.1 样本网页信息量分布 |
9.5.2 网页信息量与多引擎搜索结果分析 |
9.5.3 网页信息量与受测用户评分结果分析 |
9.6 多搜索引擎的可用性评估结果 |
第十章 总结和展望 |
10.1 本文工作总结 |
10.2 发展与展望 |
参考文献 |
作者博士期间发表的论文和参与的项目 |
致谢 |
学位论文摘要 |
Abstract |
四、基于语义的生物学专业搜索引擎设计(论文参考文献)
- [1]网络时代科学活动的变革研究[D]. 吴爽. 中国科学技术大学, 2021(09)
- [2]基于大数据的网络空间主流意识形态传播研究[D]. 刘培. 中国矿业大学, 2020(07)
- [3]学术信息聚合系统的特点和发展趋势[J]. 王维佳. 中华医学图书情报杂志, 2020(08)
- [4]面向智慧医疗的文本规范化研究[D]. 陈露. 中南财经政法大学, 2020(07)
- [5]科学数据用户相关性判断模型研究[D]. 刘建平. 中国农业科学院, 2020(01)
- [6]数据驱动下数字图书馆知识发现服务创新模式与策略研究[D]. 李洁. 吉林大学, 2019(02)
- [7]基于垂直搜索的意图识别算法的设计与实现[D]. 朱明奇. 北京交通大学, 2019(01)
- [8]数字资源互操作及服务融合中的信任管理机制研究[D]. 郝世博. 南京大学, 2015
- [9]基于个性化本体的语义搜索引擎技术的研究与设计[D]. 陈鹏飞. 河北工业大学, 2011(05)
- [10]基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D]. 王镠璞. 吉林大学, 2010(08)