一、搜索引擎中的广告关键字(论文文献综述)
杨广召[1](2021)在《面向红枣信息资源的爬虫技术研究》文中指出在现代互联网技术迅猛发展的时代,互联网上的各类资源呈现出爆炸式增长,网络上积累了丰富的红枣相关信息。传统主题网络爬虫会爬取与红枣主题相关性高的页面,但不能满足用户想要快速、精准、有效获取所需红枣信息的需求。传统主题网络爬虫在页面检索时能够做到只爬取与主题相关性高的页面,但现有传统主题网络爬虫的算法也存在缺点,如容易产生“主题漂移”、对新页面忽视和红枣链接去重效率低等问题。针对红枣类相关页面,结合不同算法的优点对HITS(Hyperlink-Induced Topic Search)算法和链接去重算法进行改进,以使改进后的算法在爬取页面时展现更好的性能。本文的主要研究内容如下:首先,对通用网络爬虫中相关理论和技术进行研究,主要对主题网络爬虫实现中用到的相关技术进行分析,并对页面处理,主题相关度计算等进行分析。其次,在对传统主题网络爬虫技术的研究中发现存在一些问题:1.HITS算法存在对新页面忽视问题和“主题漂移”现象。2.传统内存去重方法对红枣链接去重效率低。针对以上问题对红枣主题网络爬虫中的算法展开研究,结合不同算法的优点对红枣主题网络爬虫算法进行改进,使改进后的算法在爬取红枣页面时展现出更好的性能。再次,对传统主题网络爬虫算法的深入研究,发现现有主题网络爬虫算法的不足并对其进行改进,提出引入时间因素的HITS算法与Shark-Search算法相结合,使得结合后的算法在页面爬取时与红枣主题密切相关,解决传统算法中对新页面忽视问题和消除“主题漂移”现象,提高红枣主题网络爬虫算法查准率和查全率。针对传统内存去重效率低的问题,提出基于Redis的Bloom Filters去重方法,Bloom Filters将红枣链接表示成二进制向量并存储在内存数据库Redis中,提高了红枣链接的去重效率。最后,实现红枣主题网络爬虫系统整体爬取功能,将改进算法应用于关键功能模块的实现。实验结果表明,改进算法在提高红枣主题相关计算和红枣链接去重效率方面是可行有效的。
杨昊天[2](2020)在《基于粒子群优化算法的卷积神经网络解决在谷歌广告关键字搜索中的应用》文中研究说明Google Ads是一种通过使用Google关键字广告或者Google遍布全球的内容联盟网络来推广网站的付费网络推广方式。人们可以选择包括文字、图片及视频广告在内的多种广告形式。广告商选择的广告是否能为自己的广告带来最大利益,很大程度上取决于与广告相关的关键字的选择。因此,广告优化的成败与否就要靠关键字的选择去进行实现。毕竟好的关键字不仅可以帮助商家降低广告成本,而且可以提升广告效果,帮助商家增加收益。然而,在实际操作中由于各种原因使得关键字的选择遭遇重重困难。首先需要面对自然语言处理的困难,因为关键字中同时包含中文和英文、关键字的文本特征少、数据质量不平衡的问题。其次深度学习中的分类模型不容易与本应用进行良好的适用。最为重要的是在应用中要求模型的分类速度快并且分类准确度较高,这对于深度学习中的模型来讲无疑是一件非常棘手的问题。为了解决这些问题,首先研究如何更好地提取出文本信息并对分类模型进行改进。因此,本文通过选择语料库解决中英文混合现象,使用词嵌入解决关键字文本特征少的问题,通过重采样处理数据质量不平衡的问题。经过实验验证,最终证明了所选数据处理方法确实行之有效。随后选用卷积神经网络作为挑选优质关键字的分类器。但是为了更好地适用于本次应用的场景,本文通过将关键字中对应的如点击量,排名和转化率等行为信息作为特征,并将特征在卷积神经网络的最后一层增加嵌入,从而使得改进的卷积神经网络更加适用于本次应用场景。随后考虑到卷积神经网络参数巨大,对于如何从众多参数中选出最为合适的神经网络结构这个问题进行研究。通过实验与理论研究发现,将进化计算与深度学习结合,将精度作为目标,利用单目标粒子群优化算法优化卷积神经网络结构。能够在不需要人为大量调整网络结构的情况下得出一个合适的神经网络结构。最后在研究中发现,仅仅得到一个精度高的网络结构并不能满足本次应用的需求。因为在工业应用中,不只是对于精度有要求,更重要的是要考虑时间成本。因此本文通过进一步研究后,发现可以利用多目标粒子群优化算法,将精度和速度作为两个目标来共同优化网络结构,从而能够得到同时优化这两个目标的结果。通过实验验证可以发现本次研究的算法不仅能够很好地解决此次应用,而且又具有应用到更多实际问题的可能性。
姜野[3](2020)在《算法的法律规制研究》文中进行了进一步梳理算法在广义上讲就是解决问题的程序,但是由于数据和算力的不断发展,基础数学理论的演进,作为人工智能本质的算法取得了突破性进展,以机器学习为主的多类型算法在新闻推送、搜索引擎、电子商务、信用评分以及司法裁判领域等多个场景当中得到应用。算法性能的提升以及应用的普及提高了社会的运行效率,却又因内部不透明性、有限自主性和难以问责性而可能导致诸多风险。这些特性将算法区别于普通的技术,也为我们带来了规制难题,当自我规制、市场规制和伦理规制并不能够有效应对算法带来的风险与影响,法律规制便成为了最为直接和有效的规制手段。有必要以算法技术的迭代更新为背景,将算法的法律规制作为主要研究对象,突出当前算法呈现出的有限自主性特征,建构符合我国算法应用现状的法律规制体系。伴随互联网络的发展,线上活动在人们日常生活中所占的比重越来越大,算法在为我们提供更加迅捷高效的推送结果的同时也会对我们的视域、判断甚至最终选择产生影响。可以说,网络对于其发展中形成的自生自发的扩展秩序已经形成了路径依赖。显然,算法使用者秉持的技术中立与技术无罪观念已经形成了强大惯性,这种惯性带来的后果不可避免地与公民的权利及社会的有序发展发生抵牾。在此过程中,会形成算法歧视、算法统治甚至消解社会信任等风险,而个人在算法面前逐渐演变成为数据的汇总,难免会被算法规训,隐私保护的难度逐步增大,算法的学习特性还将导致数字鸿沟加剧发展。这些社会风险以及对个人产生的不利影响都需要来自法律的有力回应。在法律规制算法的理论基础方面,需要明确算法只能成为法律规制的对象而不能成为法律本身,应当认清算法的法律属性,将其定位为具有有限自主性的人造物。现阶段,我国对于算法的规制模式仍属于回应型的,重视结果的规制而忽略过程的控制。具体表现为个人数据保护立法较为分散,平台责任规定不够明晰以及规制算法的法律体系性不足。当前,欧盟与美国分别形成了以数据保护和算法责任为中心的算法规制模式,二者能够在一定程度上提供可借鉴的经验却也都存在一定的局限性。因此,我国需要构建系统的法律规制体系。进而以法律治理归化技术治理,将防范风险定位为制度设计所要达到的目标,以科技伦理作为内在指引。法律规制体系的系统建构,覆盖算法应用的全过程,主要包括算法应用前的审查监督,应用过程中的数据保护以及应用后产生后果时的法律问责。首先,在算法审查监督具体规制措施的研究当中,要完善算法的分级分类制度,当前算法的主要应用场景集中在两个领域之中,一个是商业领域一个是公共决策领域。在确定算法的风险等级之后,根据不同等级确定相应的透明度边界,完全不透明的算法会形成黑箱,而完全公开的算法则无法保护算法开发者的创新热情。因此,通过明确算法的透明度建立健全的监督机制能够在算法应用前的阶段有效防止问题的产生。其次,通过对于数据权利体系的研究加强算法应用过程当中的法律保障。明晰数据权属的界定对于限制算法至关重要,没有数据的算法将无法发挥作用。而我国法律对于日益多元的数据形式并未作出明确的界分,数据控制者和数据主体在数据的收集和使用上存在着矛盾。由此,在强调互联网企业对于数据利用的同时,也不能忽略对于个人数据权的保护。赋予数据主体数据可携权以及加强对被遗忘权的保护能够有效应对算法应用带来的数据失控。最后,研究算法应用之后产生的法律后果,以及如何问责的问题。加强算法的可解释性并保护数据主体的算法解释权,能够复盘算法运行的过程,找出法律后果产生的具体原因,合理分配责任完成法律问责。针对算法应用的全过程分别设计的法律规制手段只能解决短期和中期所呈现出的问题,而数字人权的提出能够从更加宏观的角度影响算法,从而达到在源头上规制算法的目的并实现算法规制的长期目标。数字人权要求在数字科技发展的过程当中坚持以人为本,一方面,数字人权保护机制所倡导的价值就是科技发展应当遵循的价值。另一方面,数字人权的覆盖范围极其宽广,面对以算法为代表的数字技术的广泛应用场景都可以通过数字人权进行约束。保护数字人权,要求增强算法开发者的人权理念,强化算法的道德习得能力,提升数字弱势群体的参与以及在全社会培育数字素养和算法认知。数字人权的提出能够引领法律规制体系的构建,引领算法设计的理念。更进一步,结合我国正在推行的人类命运共同体,数字人权可以增强我国在科技立法和数据治理领域的话语权。
万珊珊[4](2020)在《搜索引擎伦理失范评价研究》文中研究说明搜索引擎在海量网络信息中为用户筛选出所需信息并将结果呈现给用户,因而,搜索引擎在一定程度上影响着人们的判断和决策,甚至引导整个社会的舆论走向,对整个社会产生影响。但随着搜索引擎技术的快速发展,以及我国法律法规建设相对滞后等原因,搜索引擎伦理失范行为也随之出现。搜索引擎伦理失范行为既会对用户利益造成损害,又会对搜索引擎规范经营者甚至部分网站的利益造成损害,最终可能会使社会的道德环境受到不良影响。因此搜索引擎伦理失范行为需要被规范,以保证所提供信息的真实性和客观性等。在这样的背景下,本文开启了相关研究。本研究将理论与实证的方法、定性与定量的方法结合,保证了整个研究过程的系统性和科学性。首先,本文将搜索引擎的内涵、与搜索引擎伦理相关的基础理论、搜索引擎的社会责任等进行了归纳、整理。其次,本文总结概括搜索引擎伦理失范的现象并分析了问题产生的原因。再次,本文研究了如何对搜索引擎伦理失范进行评价,初步构建了评价指标体系,通过层次分析法计算指标权重,再用模糊综合评价法验证了该体系的可用性。最后针对搜索引擎出现的伦理失范问题提出具体建议。以期为识别搜索引擎伦理失范行为,评价搜索引擎伦理失范程度以及规范搜索引擎提供一定的依据。
张彪[5](2019)在《搜索竞价广告关键字的选择及匹配方式优化策略》文中研究指明搜索竞价广告作为互联网在线广告最主要的形式之一,一直受到众多广告主的青睐。关键字的选择和匹配方式决策是广告主管理搜索竞价广告过程中,不可逾越的难题。因此,本文针对关键字的选择与匹配方式优化问题进行研究。本文研究在有限预算的条件下,广告主如何选择关键字并进行匹配方式决策,以实现广告利润的最大化。本文将关键字的选择与匹配方式决策问题构建成一个整数规划模型,并给出了基于分支定界的优化算法。然后,本文采用来自不同搜索平台上搜索竞价广告活动中的真实数据集DS1和数据集DS2,分别对本文所提出的关键字选择及匹配方式优化模型和所提出的基于分支定界的优化算法进行了对比实验分析。实验结果显示:在不同广告预算约束下,本文所提出的基于分支定界的优化算法相较于其他三种基准优化策略均取得了更高的利润。这也验证了本文所构建的关键字选择及匹配方式优化模型和相应优化算法的有效性。
李延鑫[6](2019)在《针对计算机学科资源的垂直搜索引擎的设计与实现》文中研究说明随着互联网的发展和数据量的指数型增长,各个领域充斥着大量信息。增加网络检索的可靠性和专业性成为了各领域的重要任务。因此,本文把结合垂直搜索引擎的技术开发出针对计算机学科资源的搜索引擎平台作为研究目的。本文首先从用户需求、爬虫结构、分词索引等角度分析了现存的各大搜索引擎的研究现状,结合本设计的需求提出新的要求,对搜索引擎的核心组件数据采集(网络爬虫)、数据处理、索引、检索器等功能和原理进行研究和描述。针对计算机领域的知识进行结构化处理,改善了其搜索功能,在设计搜索引擎时对以下几项技术在实现时进行了优化:一是对爬虫算法进行了优化,引入了爬虫对URL的判别机制,减少了爬虫的爬取次数,从而提高了搜索引擎的运行效率;二是针对计算机学科资源对文本分类和分词方法进行优化,让搜索引擎对这一领域信息判断更加准确;三是根据目前对搜索引擎结果页的研究对系统的用户友好度进行优化。本文主要工作分为以下几个方面:(1)设计爬虫程序和爬虫策略以取得结构化的计算机学科资源数据,对网页代码构造结构树,实现网页分块,根据网页元素信息xpath找到所在的文档对象,获取结构化数据。(2)面对获取数据重复,数据损坏等情况,将Jaccard算法引入到搜索引擎领域,提出通过两步编码的方式用于数据预处理。Jaccard的思想是将两个集合的交集与并集的比例作为两个集合的相似度。结合以上内容本文提出一种重复信息筛选方法,对结构化数据信息进行筛选处理。(3)研究了搜索结果页面要素分布对搜索体验的影响。一方面嵌入新型页面元素,使搜索结果页面呈现垂直化、多样化特征;另一方面结合用户的搜索行为数据,包括眼球、光标、手势、声学等各类数据,实现对用户意图的预测。在以上工作的基础上,对实现的针对计算机学科资源的垂直搜索引擎中的检索功能和网络爬虫进行功能测试,保证系统数据的信息准确性。
王露[7](2017)在《垂直搜索引擎中PageRank改进算法的研究与应用》文中研究表明随着信息技术不断向前发展,互联网早已成为全球最大的信息资源库,它不仅为人们提供了良好的信息共享技术,而且也实现了资源共享服务。但是互联网中的信息量急剧增长也带来了很多冗余信息和垃圾资源,使用户难以在其中找到自己需要的信息资源,如何有效检索信息就成了亟待解决的问题。针对特定的人群和领域的垂直搜索可以解决这种困境。论文一开始介绍了搜索引擎的发展过程和垂直搜索引擎的工作原理,具体分析了垂直搜索引擎的索引技术以及实现排序的相关技术。分析了传统PageRank算法基本原理和在垂直搜索引擎中适用的前提条件。为后面对PageRank算法改进奠定理论基础。文中重点从PageRank算法出现的“主题漂移”问题入手,分析产生的原因。并介绍了国内外对于该问题所取得的研究成果。针对这个问题,本文一方面从查询主题关键字与页面内容相似度入手,分析得出它们的相似度算法因子;另一方面对查询关键字与本地主题数据库中已存在关键字的相似性进行分析,通过模糊数据集推导出二者的相识度算法因子。将两个算法因子导入PageRank算法中,并通过模拟实验,对比原有算法结果,得出改进后的算法在一定程度上降低了算法“主题漂移”的可能,提高了算法结果的正确性。最后,本文以农业领域为例,将改进后的PageRank算法应用到垂直搜索引擎中,通过实际应用,对比其他主流网站的搜索结果,可以得出改进后的PageRank算法具有一定的优越性,搜索结果更准确,搜索系统也更加稳定,可以满足用户的搜索请求。
杨彩云[8](2017)在《消费者角度下竞价排名模式对百度品牌的影响》文中研究表明百度搜索引擎是世界上最大的中文搜索引擎,在中国大陆互联网行业中处于垄断地位,在国际上也具有举足轻重的地位。其中,百度竞价排名模式为百度品牌发展发挥了重要作用。但竞价排名在盈利的同时,常有一些负面报道显示其存在问题,亟需百度解决。本文运用调查问卷研究方法,参考既有的理论研究,分析了消费者眼中竞价排名模式存在的问题,探讨这些问题对百度品牌造成的一些负面影响和导致这些问题的原因,并向百度提出一些对策建议。百度竞价排名的问题也是搜索引擎行业整体的问题,这些建议希望能够为整个互联网行业提供参考价值。通过调查得出:百度竞价排名模式在运营过程中出现了以下问题,导致了用户对百度企业的非议,由于竞价排名广告链接所占比例过多,与普通链接区别度低,与搜索要求不关联,一些虚假和钓鱼网站存在,影响用户使用体验;竞价排名产品的价格和质量问题可能误导消费者错误消费;同时存在假冒伪劣和网络欺诈可能性;这些问题对百度用户的品牌满意度、品牌美誉度、品牌形象等造成一定的负面影响,但是由于百度搜索引擎目前没有可靠的替代产品,其对百度品牌忠诚度的影响暂时不明显。针对这些问题建议如下:减少竞价排名广告数量和比例,对竞价排名链接设立明显的区别标识,加强对竞价排名链接内容的审核,严格审查竞价排名客户的资质,完善用户的追责机制。已有的竞价排名相关研究多数从法律角度、营销角度、技术角度、社会制度的方面研究,从消费者角度研究竞价排名模式的较少,百度搜索引擎是中国互联网市场上最重要的企业,其用户占据了中国网民大部分比例,研究百度搜索引擎的竞价排名模式具有重要的意义,并能促进互联网行业健康发展。
高俊[9](2017)在《预算约束条件下亚马逊关键字投资组合研究》文中研究指明电商平台的关键字广告已经成为各大电商卖家的主要广告形式。目前,关于关键字广告竞价策略方面的研究已经取得显着成果,而具体到电商平台关键字层面的投资组合研究却鲜有涉及。在广告活动预算约束条件下,电商卖家如何在不同的关键字之间进行合理的投资组合成为广告主面临的关键问题。科学地进行关键字投资组合可以充分地利用广告资源,增加商品的曝光量,最大化关键字广告的收益,使广告主在日趋激烈的广告营销中迅速占领市场。本文结合Amazon电商平台广告的实际情况和特点,利用马科维茨投资组合理论,提出了一种新的思路来解决关键字投资组合问题。特别是,我们将关键字广告的分配过程作为一个不能卖空的投资组合问题,在总预算约束条件下,最大化广告的期望收益率和最小化关键字的出价风险,并通过模型求解来得到一个关键字的最优投资组合方案。本文选取了亚马逊电子商务平台的关键字竞价广告日志数据,结合数据设计了关键字广告投资组合的相关实验,并且对实验结果进行了评估。实验结果表明,在同一预算条件下,本文提出的关键字广告投资组合的方案能够使得亚马逊广告主在更低的风险水平下获取更高的收益。
赵相儒[10](2016)在《元搜索技术在涉藏舆情监控系统中的应用研究》文中认为涉藏舆情是社会管理部门了解藏区民众对社会政治态度等更为直接途径,同时也是制定舆情管控策略、引导舆情导向的重要依据。随着互联网尤其是境外网站中所包含大量的涉藏舆情信息呈几何级数子增长时,涉藏舆情信息收集、筛选的难度和复杂度也随之增加,同时涉藏舆情信息采集具有时效性和针对性的特殊要求,导致互联网涉藏舆情管控工作显得较为被动。涉藏舆情监控作为对我省藏区互联网信息导向的重要监管方式,其搜集信息的时效性和准确性成为了当前研究的热点。如何全面、高效地从这些海量信息中搜集到需要的涉藏舆情信息并加以分析和研判,已经成为了“涉藏舆情监控系统”所要面临的首要问题。论文从实际工程化的角度出发,将元搜索技术应用于“涉藏舆情监控系统”之中,实现对互联网中涉藏舆情信息采集的可行性。论文结合甘肃省甘南维稳工程中的“涉藏舆情监控系统”,对研究的相关技术进行了概要描述,对元搜索技术和文本聚类、向量空间模型等技术进行了研究分析,设计了完整的涉藏舆情信息采集系统。同时,探讨了通过对元搜索引擎结果的聚类方法,以便为更加准确、高效地采集到符合主题的涉藏舆情信息。主要研究内容有:(1)对现有的舆情采集技术、元搜索引擎进行了全面系统的研究;(2)针对当前元搜索引擎方法在搜索结果去重时忽略了文本内容等问题,分析研究了元搜索引擎查询结果的聚类方法,提出通过对搜索页面摘要、标题的向量空间模型VSM(Vector Space Model)的表示来计算文本相似度,并采用凝聚层次聚类对网页文档进行聚类,来达到去重的目的;(3)设计并实现了一个基于B/S架构的元搜索引擎结果聚类系统涉藏舆情采集器,给出了系统模块设计原理、构架以及各模块的实际功能,并通过实测证明了系统运行的效果和有效性;实践表明该采集器具有较好的动态适应性,能够对涉藏舆情信息进行全面的采集。论文中研究的成果在实际工作中得到了初步验证,最后对课题中研究的不足和未来研究的方向进行了展望。
二、搜索引擎中的广告关键字(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、搜索引擎中的广告关键字(论文提纲范文)
(1)面向红枣信息资源的爬虫技术研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景 |
1.2 研究意义 |
1.3 爬虫的研究现状 |
1.3.1 国外研究现状 |
1.3.2 国内研究现状 |
1.4 网络爬虫研究概述 |
1.4.1 网络爬虫体系结构 |
1.4.2 主题网络爬虫与通用网络爬虫的区别 |
1.5 研究内容 |
第2章 网络爬虫相关技术研究 |
2.1 网页处理 |
2.1.1 HTML网页结构 |
2.1.2 内容提取 |
2.1.3 中文分词 |
2.1.4 去停用词 |
2.2 主题相关度计算 |
2.2.1 信息检索模型 |
2.2.2 主题相关度计算 |
2.3 本章小结 |
第3章 HITS网页排序算法改进策略 |
3.1 网页排序算法研究 |
3.1.1 网页排序算法对比分析 |
3.1.2 HITS算法分析 |
3.2 引入时间因素的HITS算法改进策略 |
3.2.1 HITS算法优缺点分析 |
3.2.2 针对红枣类主题网页的HITS算法改进策略 |
3.3 针对红枣“主题漂移”现象的HITS算法的改进策略 |
3.3.1 Shark-Search算法研究 |
3.3.2 Shark-Search算法优缺点分析 |
3.3.3 Shark-Search算法和HITS算法的融合改进策略 |
3.3.4 融合算法在系统的具体应用流程 |
3.4 算法性能评判标准 |
3.5 融合算法性能对比实验与结果分析 |
3.6 本章小结 |
第4章 基于Redis的 Bloom Filters去重算法 |
4.1 红枣链接去重研究 |
4.1.1 链接重复的影响 |
4.1.2 链接去重算法对比分析 |
4.1.3 链接提取过程 |
4.2 基于Redis的 Bloom Filters去重技术研究 |
4.2.1 Redis数据库研究 |
4.2.2 Bloom Filters算法研究 |
4.2.3 Bloom Filters的实现 |
4.3 基于Redis的 Bloom Filters红枣URL去重实验设计 |
4.4 基于Redis的 Bloom Filters红枣URL去重实验 |
4.4.1 红枣URL去重流程设计 |
4.4.2 红枣URL去重实验数据获取 |
4.4.3 红枣URL去重实验对比与结果分析 |
4.5 本章小结 |
第5章 红枣主题网络爬虫系统设计与分析 |
5.1 红枣主题网络爬虫系统设计 |
5.1.1 红枣主题网络爬虫系统架构设计 |
5.1.2 系统技术路线 |
5.1.3 实验的软硬件环境 |
5.1.4 种子链接的选取 |
5.2 实验常用函数 |
5.3 红枣网页爬取过程 |
5.4 爬取实验结果展示 |
5.5 应用新算法系统与传统索引效果对比 |
5.6 本章小结 |
第6章 总结与展望 |
6.1 工作总结 |
6.2 未来展望 |
参考文献 |
致谢 |
作者简介 |
(2)基于粒子群优化算法的卷积神经网络解决在谷歌广告关键字搜索中的应用(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景及意义 |
1.2 研究目的 |
1.3 目前问题和解决方案 |
1.4 论文框架 |
2 相关研究工作综述 |
2.1 关于Google Ads的关键字选择 |
2.2 粒子群优化算法 |
2.2.1 单目标粒子群优化算法 |
2.2.2 多目标粒子群优化算法 |
2.3 卷积神经网络 |
2.4 粒子群优化卷积神经网络 |
2.5 自然语言处理——词嵌入 |
2.5.1 Word2Vec |
2.5.2 Glove |
2.5.3 Fasttext |
2.6 不平衡数据集处理 |
2.6.1 不平衡数据集解决方案 |
2.6.2 不平衡分类指标 |
2.7 本章小结 |
3 数据处理及卷积神经网络的改进 |
3.1 引言 |
3.2 关键字选择的方法 |
3.2.1 使用词嵌入 |
3.2.2 选择语料库 |
3.2.3 数据不平衡问题 |
3.2.4 改进CNN |
3.3 实验 |
3.3.1 数据介绍 |
3.3.2 选择语料库和词嵌入类型 |
3.3.3 不平衡数据处理方法 |
3.3.4 改进的CNN的参数选择 |
3.3.5 分析实验结果及结论 |
3.4 本章小结 |
4 单目标粒子群优化改进的卷积神经网络 |
4.1 引言 |
4.2 设计方法 |
4.3 实验 |
4.3.1 参数选择 |
4.3.2 实验结果 |
4.3.3 对比其他先进算法 |
4.4 实验结论 |
4.5 本章小结 |
5 多目标粒子群优化改进的卷积神经网络 |
5.1 引言 |
5.2 设计方法 |
5.3 实验 |
5.3.1 参数选择 |
5.3.2 实验结果 |
5.3.3 对比其他先进算法 |
5.4 实验结论 |
5.5 本章小结 |
6 总结与展望 |
参考文献 |
个人简历、在学期间发表的学术论文与研究成果 |
致谢 |
(3)算法的法律规制研究(论文提纲范文)
中文摘要 |
abstract |
绪论 |
一、选题的背景和意义 |
二、研究现状 |
三、论文的基本框架 |
四、研究方法 |
第一章 算法应用的主要场景及规制困境 |
一、算法的广泛应用与争议 |
(一)新闻推荐场景 |
(二)搜索引擎排序 |
(三)电子商务领域 |
(四)个人信用评分 |
(五)司法裁判领域 |
二、算法的独特性质 |
(一)算法的不透明性 |
(二)算法的有限自主性 |
(三)算法的难以问责性 |
三、传统路径难以进行有效规制 |
(一)自我规制路径缺乏内在动力 |
(二)市场规制无力对抗垄断局面 |
(三)伦理规制难以有效融入算法 |
第二章 法律规制算法的法理证成 |
一、算法应用产生的社会风险 |
(一)算法歧视加剧社会不公 |
(二)算法权力形成算法统治 |
(三)深度伪造消解社会信任 |
二、算法决策对个人的不利影响 |
(一)算法分析侵害数据主体隐私权 |
(二)算法规训妨碍个人的自由意志 |
(三)算法学习加剧数字鸿沟的发展 |
三、法律规制算法的理论基础 |
(一)法律与科技的法理思考 |
(二)厘清算法的法律与法律的算法 |
(三)算法的法律属性探究 |
第三章 法律规制模式的反思与预设 |
一、我国规制算法的模式与不足 |
(一)数据保护的相关立法 |
(二)算法规制的直接条款 |
(三)当前规制模式的不足 |
二、域外规制算法的经验及局限 |
(一)以数据保护为中心的欧盟方案 |
(二)以算法责任为中心的美国路径 |
(三)欧美规制算法路径的比较分析 |
三、法律规制算法的应然选择 |
(一)以法律治理归化技术治理 |
(二)将风险防范作为规制目标 |
(三)将科技伦理作为内在指引 |
第四章 法律规制体系的系统构建 |
一、算法应用前的审查监督 |
(一)完善算法分级分类制度 |
(二)算法的透明度及其边界 |
(三)建立健全算法监督机制 |
二、算法应用中的法律保障 |
(一)明晰数据权属的界定 |
(二)赋予数据主体数据可携权 |
(三)加强对被遗忘权的保护 |
三、算法应用后的法律问责 |
(一)算法的可解释性 |
(二)算法解释权的概念及证成 |
(三)构建合理的法律问责体系 |
第五章 未来展望:以数字人权引领算法规制 |
一、人类生存状态的数字化重塑 |
二、算法技术背景下的数字人权 |
(一)数字人权中的自由命题 |
(二)数字人权中的平等命题 |
(三)数字人权中的安全命题 |
三、数字人权的保护机制 |
(一)将人权理念融入算法开发 |
(二)强化算法的道德习得能力 |
(三)提升数字弱势群体的参与 |
(四)培育数字素养与算法认知 |
结论 |
参考文献 |
作者简介及攻读博士学位期间发表的学术成果 |
后记 |
(4)搜索引擎伦理失范评价研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景及研究意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究综述 |
1.2.1 关于信息伦理学的研究综述 |
1.2.2 关于搜索引擎伦理规范的研究综述 |
1.2.3 关于搜索引擎伦理失范的研究综述 |
1.2.4 关于伦理失范评价的研究综述 |
1.3 研究内容 |
1.4 研究方法 |
1.5 研究的创新点 |
2 理论基础 |
2.1 搜索引擎基本概念 |
2.1.1 搜索引擎的涵义 |
2.1.2 搜索引擎的社会责任 |
2.2 搜索引擎伦理相关概念 |
2.2.1 信息伦理 |
2.2.2 计算机伦理与网络伦理 |
2.2.3 搜索引擎伦理 |
2.2.4 搜索引擎伦理失范 |
3 搜索引擎伦理失范的表现及原因 |
3.1 搜索引擎伦理失范的表现 |
3.1.1 搜索偏向 |
3.1.2 侵犯用户权利 |
3.1.3 信息污染 |
3.2 搜索引擎伦理失范的原因 |
4 搜索引擎伦理失范评价模型 |
4.1 搜索引擎伦理失范评价指标的筛选 |
4.1.1 搜索引擎伦理失范评价指标体系的设计原则 |
4.1.2 文献梳理 |
4.1.3 专家访谈 |
4.2 指标权重的计算 |
4.3 评价步骤 |
4.3.1 确定指标集 |
4.3.2 确定评价等级 |
4.3.3 确定权重向量 |
4.3.4 进行一级评价和综合评价 |
4.3.5 确定等级 |
5 基于调查问卷的搜索引擎伦理失范评价实证研究 |
5.1 调查问卷基本情况分析 |
5.1.1 问卷信度分析 |
5.1.2 问卷效度分析 |
5.2 Baidu搜索引擎伦理失范评价 |
5.3 360搜索引擎伦理失范评价 |
5.4 Google搜索引擎伦理失范评价 |
5.5 Bing搜索引擎伦理失范评价 |
5.6 建议 |
6 结论与展望 |
6.1 研究结论 |
6.2 研究展望 |
6.2.1 研究的不足 |
6.2.2 研究的方向 |
参考文献 |
附录A 搜索引擎伦理失范评价指标体系专家访谈问卷 |
附录B 搜索引擎伦理失范评价指标体系赋权专家调查问卷 |
附录C 搜索引擎伦理失范程度调查问卷 |
个人简历、在学期间发表的学术论文与研究成果 |
致谢 |
(5)搜索竞价广告关键字的选择及匹配方式优化策略(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景 |
1.2 研究问题 |
1.3 研究内容及意义 |
1.4 论文研究结构 |
1.5 研究方法 |
2 文献综述 |
2.1 搜索竞价广告的预算策略 |
2.2 关键字竞价策略 |
2.3 关键字选择策略 |
2.4 关键字匹配方式 |
2.5 总结 |
3 关键字选择及匹配方式优化模型 |
3.1 目标函数 |
3.2 约束条件 |
3.3 关键字选择及匹配方式优化模型 |
4 模型求解 |
4.1 整数规划的常用解法 |
4.2 基于分支定界的优化算法 |
5 实验验证 |
5.1 实验数据来源 |
5.2 实验过程及结果分析 |
5.3 实验总结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
(6)针对计算机学科资源的垂直搜索引擎的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题来源及意义 |
1.2 国内外研究现状 |
1.3 研究内容 |
1.4 文章结构 |
第二章 基本理论 |
2.1 技术概述 |
2.2 垂直搜索引擎技术 |
2.3 网络爬虫技术 |
2.4 分词技术 |
2.5 索引技术 |
2.6 Lucene研究 |
2.7 本章小结 |
第三章 搜索引擎优化研究 |
3.1 采集模块的优化 |
3.2 文本分类与分词的优化 |
3.3 面向用户的优化 |
3.4 本章小结 |
第四章 针对计算机学科资源的垂直搜索引擎设计 |
4.1 针对计算机学科资源的垂直搜索引擎的功能与目标 |
4.2 总体设计 |
4.3 数据采集模块设计 |
4.4 数据预处理和索引模块设计 |
4.5 本章小结 |
第五章 实验数据和运行测试 |
5.1 实验环境 |
5.2 爬虫原始数据集 |
5.3 搜索功能实现 |
5.5 爬虫程序测试 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
个人简介 |
(7)垂直搜索引擎中PageRank改进算法的研究与应用(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 搜索引擎的发展历程 |
1.2.1 一般搜索引擎的现状 |
1.2.2 垂直搜索引擎概述 |
1.3 搜索引擎中算法实现的研究现状 |
1.3.1 PAGERANK算法的研究现状 |
1.3.2 HITS算法 |
1.4 本文主要的研究内容 |
1.5 论文结构 |
第二章 垂直搜索引擎及PAGERANK算法研究 |
2.1 垂直搜索引擎工作原理 |
2.1.1 网络爬虫模块 |
2.1.2 爬虫策略 |
2.1.3 索引模块 |
2.1.4 搜索模块 |
2.2 垂直搜索中的索引技术 |
2.2.1 索引技术 |
2.2.2 逆排序索引 |
2.2.3 加权索引WEB页面 |
2.3 PAGERANK在搜索引擎中的排序要素 |
2.4 基于PAGERANK算法页面排序算法 |
2.4.1 调用PAGERANK算法必要条件 |
2.4.2 PAGERANK算法介绍 |
2.4.3 PAGERANK算法缺陷 |
2.5 针对PAGERANK算法主题漂移问题的研究 |
2.6 本章小结 |
第三章 PAGERANK算法改进 |
3.1 主题关键字与网页文本内容相识度计算 |
3.1.1 词义相似性计算 |
3.1.2 一般文本相识性分析 |
3.1.3 文本相似性因子分析 |
3.2 模糊数据集因子分析 |
3.2.1 基本概念 |
3.2.2 统一化算法的相识性计算 |
3.3 文本相似因子和模糊数据集因子的PAGERANK改进算法 |
3.4 测试实验 |
3.4.1 抓取工具 |
3.4.2 实验抓取页面 |
3.4.3 实验结果分析 |
3.5 本章小结 |
第四章 PAGERANK改进算法在垂直搜索引擎中的应用 |
4.1 改进算法的垂直搜索引擎设计 |
4.1.1 系统体系结构 |
4.1.2 系统功能介绍 |
4.2 垂直搜索引擎模块设计与实现 |
4.2.1 查询预处理模块 |
4.2.2 数据处理模块 |
4.2.3 分词模块 |
4.2.4 索引模块 |
4.2.5 搜索模块 |
4.3 系统实现及性能分析 |
4.3.1 系统实现分析 |
4.3.2 系统性能分析 |
4.4 本章小结 |
第五章 总结与展望 |
5.1 全文总结 |
5.2 展望 |
参考文献 |
致谢 |
(8)消费者角度下竞价排名模式对百度品牌的影响(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 研究现状与创新 |
1.2.1 竞价排名的定义和产生背景 |
1.2.2 国内研究述评 |
1.2.3 国外研究述评 |
1.2.4 评析和创新之处 |
1.3 研究思路与方法 |
1.3.1 研究思路 |
1.3.2 研究方法 |
2 百度竞价排名模式背景介绍 |
2.1 相关资料简介 |
2.2 百度竞价排名模式运作流程 |
2.3 百度竞价排名相关负面报道 |
3 百度竞价排名简介及存在问题分析 |
3.1 竞价排名模式存在的问题——基于问卷调查 |
3.1.1 调查过程 |
3.1.2 调查对象的基本特征 |
3.1.3 消费者对竞价排名模式的态度分析 |
3.2 竞价排名模式存在的问题 |
3.2.1 竞价排名模式对百度用户搜索体验的影响 |
3.2.2 竞价排名推广链接产品及服务质量问题 |
3.2.3 竞价排名推广链接潜藏违法犯罪可能性 |
3.3 本章小结 |
4 竞价排名模式对百度品牌的影响分析 |
4.1 消费者与品牌关系 |
4.2 百度竞价排名模式对百度品牌的影响 |
4.2.1 品牌满意度 |
4.2.2 品牌忠诚度 |
4.2.3 品牌美誉度 |
4.2.4 品牌形象 |
4.3 本章小结 |
5 竞价排名问题的原因分析和对策建议 |
5.1 竞价排名出色的盈利能力是问题产生的根本原因 |
5.2 竞价排名模式缺陷是问题产生的内部原因 |
5.2.1 竞价排名模式行业准入标准低 |
5.2.2 竞价排名审核机制不完善 |
5.2.3 竞价排名缺乏用户投诉追责机制 |
5.3 缺乏监督是竞价排名模式存在问题的外部原因 |
5.4 对策和建议 |
5.5 本章小结 |
6.结论 |
参考文献 |
附录: 调查问卷 |
个人简介 |
导师简介 |
致谢 |
(9)预算约束条件下亚马逊关键字投资组合研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景 |
1.2 研究意义 |
1.3 本文的研究内容 |
2 文献综述 |
2.1 广告关键字的国内外研究 |
2.2 投资组合的国内外研究 |
2.3 总结 |
3 亚马逊关键字广告的背景 |
3.1 亚马逊广告概述 |
3.2 亚马逊广告的竞价原理 |
4 基于投资组合理论的关键字投资组合模型 |
4.1 马科维茨投资组合模型介绍 |
4.2 结合亚马逊平台的投资组合模型适用性分析 |
4.3 基于投资组合理论的关键字投资组合模型 |
4.4 亚马逊关键字投资组合算例 |
5 Amazon广告的关键字投资组合实证研究 |
5.1 实证分析步骤 |
5.2 数据来源 |
5.3 ROI的算法和样本数据筛选 |
5.4 实证结果 |
5.5 关键字投资组合模型有效性检验 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
附录 |
(10)元搜索技术在涉藏舆情监控系统中的应用研究(论文提纲范文)
摘要 |
abstract |
第一章 绪言 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内同类型系统研究现状 |
1.3 目前舆情信息采集存在的问题 |
1.4 论文研究内容 |
1.5 论文组织结构 |
1.6 本章小结 |
第二章 元搜索和论文采用的相关技术 |
2.1 元搜索引擎 |
2.1.1 元搜索引擎 |
2.1.2 元搜索引擎的分类 |
2.1.3 元搜索引擎的体系结构 |
2.2 元搜索结果的整理 |
2.2.1 元搜索引擎的消重技术 |
2.2.2 元搜索引擎的排序技术 |
2.3 元搜索成员引擎的调度策略 |
2.4 论文涉及的相关技术及标准 |
2.4.1 基于Nutch平台的信息采集技术 |
2.4.2 聚类算法 |
2.4.3 TFIDF框架 |
2.4.4 WordNet介绍 |
2.5 论文研究的关键问题分析 |
2.6 本章小结 |
第三章 涉藏舆情系统中涉藏舆情采集器设计 |
3.1 涉藏舆情采集器 |
3.1.1 涉藏舆情采集器建设背景目标 |
3.1.2 涉藏舆情采集器设计 |
3.1.3 涉藏舆情采集器功能结构 |
3.2 指标管理模块 |
3.3 搜索请求模块 |
3.4 特征向量生成模块的设计 |
3.5 搜索结果聚类模块的设计 |
3.6 结果整合模块的设计 |
3.6.1 基于URL、标题和摘要的网页去重 |
3.6.2 记录排序 |
3.7 快照采集设计 |
3.8 本章小结 |
第四章 元搜索引擎结果的聚类算法研究 |
4.1 聚类概述 |
4.1.1 文本聚类的概念 |
4.1.2 搜索结果聚类的研究现状及问题 |
4.2 基于语义相似度的元搜索引擎结果聚类 |
4.2.1 预处理 |
4.2.2 网页的VSM表示 |
4.2.3 基于WordNet的词项语义相似度计算及降维 |
4.2.3.1 同义词集的相似度 |
4.2.3.2 词项之间的相似度 |
4.2.4 网页的相似度计算 |
4.2.5 实例验证 |
4.2.6 聚类和聚类标签 |
4.3 本章小结 |
第五章 涉藏舆情采集器系统实现与测试 |
5.1 开发环境 |
5.2 舆情指标管理实现 |
5.3 成员搜索引擎管理实现 |
5.4 成员调度策略实现 |
5.5 结果整合实现 |
5.5.1 记录去重 |
5.5.2 记录排序 |
5.6 涉藏舆情采集器实现 |
5.6.1 涉藏舆情信息采集器静态结构 |
5.6.2 涉藏舆情信息采集器动态结构 |
5.7 涉藏舆情采集器测试 |
5.7.1 验证目的 |
5.7.2 实例验证方法 |
5.8 本章小结 |
第六章 结论与展望 |
6.1 论文研究成果 |
6.2 工作展望 |
参考文献 |
致谢 |
附录:攻读学位期间发表的论文情况 |
四、搜索引擎中的广告关键字(论文参考文献)
- [1]面向红枣信息资源的爬虫技术研究[D]. 杨广召. 塔里木大学, 2021(08)
- [2]基于粒子群优化算法的卷积神经网络解决在谷歌广告关键字搜索中的应用[D]. 杨昊天. 郑州大学, 2020(02)
- [3]算法的法律规制研究[D]. 姜野. 吉林大学, 2020(08)
- [4]搜索引擎伦理失范评价研究[D]. 万珊珊. 郑州大学, 2020(02)
- [5]搜索竞价广告关键字的选择及匹配方式优化策略[D]. 张彪. 华中科技大学, 2019(01)
- [6]针对计算机学科资源的垂直搜索引擎的设计与实现[D]. 李延鑫. 宁夏大学, 2019(02)
- [7]垂直搜索引擎中PageRank改进算法的研究与应用[D]. 王露. 云南大学, 2017(05)
- [8]消费者角度下竞价排名模式对百度品牌的影响[D]. 杨彩云. 北京林业大学, 2017(04)
- [9]预算约束条件下亚马逊关键字投资组合研究[D]. 高俊. 华中科技大学, 2017(04)
- [10]元搜索技术在涉藏舆情监控系统中的应用研究[D]. 赵相儒. 上海交通大学, 2016(03)