一、一种混合型垃圾邮件过滤系统的研究与设计(论文文献综述)
吴爽[1](2021)在《网络时代科学活动的变革研究》文中提出随着互联网技术的进步,科学交流不断获得新的工具和平台,传统的科学活动正面临更开放的环境,并可能引发整个科学系统的变革。Science 2.0让个体研究走向在线协作,使成果交流变成互动探索,成果刊布也由纸媒传播走向即时在线,全面提升了科学交流的时效性和广泛性。科学活动因互联网的发展正在发生一系列重大变革,传统的科学运行机制也逐步面临新的挑战,包括:科学活动过程出现新变化、科学成果发布呈现新趋势、科学成果传播面临新问题,科学评价机制迎接新挑战。进入互联网时代,科研主体走向了多元化的线上研究模式。一方面,网络时代开创了基于大数据的协同研发的新模式。大小科学的在线重构使得知识和信息实现广泛的交融,网络所搭建的共建和共享平台不仅实现了大科学项目资源和平台的共享,同时,分散在各地的小科学实验装置和数据也被系统地集成和聚合。此外,专门的数字馆藏还有云存储的出现不仅有助于解决海量数据存储的新难题,云计算管理技术与深度学习相关软件的开发也为大数据的在线并行分析和智能处理提供了新路径。这一科研模式的转变促使在线协作成为常态,有利于在海量数据中发现和挖掘新的知识和规律,有利于科学研究从部分走向整体,同时加强了学科的交叉和融合。另一方面,网络时代引领人类科学活动走向即时交流与全面协作的新时代。多元化的网络互动式平台将促使科学走向广泛而密集的合作,尤其是在线平台使众多学者的即时交互成为可能,这就意味着科学家可以通力合作,潜能得到最大的发挥,从而更高效地推动科学的进步。同时,在线科研的众包模式将最大化激发公众全面参与科研创新的热情。总之,网络实现人与人、人与信息、人与仪器的相互关联使科学活动走向全面开放与合作。在网络时代,科学成果发布平台的多样性和发布内容的丰富性逐渐推动学术出版走向开放、高质、高效,基于网络本体的成果发布方式将成为未来科学交流的核心。首先,网络预发布平台已在一些学科渐成新规,不仅对论文成果发表的时效性有质的提升,同时解决了纸质预印本的众多技术难题,对传统首发权的确认机制发起了挑战。其次,开放获取期刊打破了传统科技期刊的垄断僵局,将在实践模式和运营机制上推动出版体系的变革和重塑。社交网络平台的盛行和盗版网站的搅局更是扰乱了现有发表规则和格局,倒逼出版商积极适应开放获取的新形势。这些都将促成所有学术成果实现免费开放与共享,从而进一步突破传统交流体系的障碍。最后,网络技术的提升会促使科学交流体系的各个功能的在线重构,网络本体发布的新模式不仅意味着科研全程的在线呈现,人人皆可随时随地发表,同时,也要时时都能得到评论和反馈,又有精准、迅速的过滤机制和个性化的推荐服务。基于网络的发表模式和传播方式仍在摸索当中,但我们已经遇到了开放获取的路径偏差、优先权的判定疑难、评审机制的频频失效等难题。第一,开放获取在实践知识共享的理念过程中更着重于免费阅读文献导致其在制度设计、服务路径和运营模式方面都面临着困难,所以有必要重新审视科学出版体系的各个功能及其价值,包括:权威的筛选机制、持续的认证过程,和对读者提供个性化的搜索引擎服务,从而在技术变迁中实现这些功能和服务的优化升级,构筑更加合理、高效、健康的学术出版体系。第二,科学活动全面开放、即时共享,由此必将引发科学发现优先权和知识产权的一系列新问题。首先是优先权的判定将由以科研成果为主转向关注整个研究过程,随着科研主体的不断变化、科研过程的全面开放,优先权归属面临新的判定难题,需要重新考虑划分标准和判定规则;其次是优先权确认机制的变化,由于科研成果发布方式从传统媒介向在线网络转移,传统的以纸质媒介为主要依据的优先权确认机制亟待更新。第三,科学信息的自由发布和科研的全程在线必然导致现有过滤机制遭受全面危机。一方面,网络同行评审机制依然作为评判在线科研成果价值的主要手段,但要充分利用网络的即时性和有效性对其改造升级。另一方面,科学信息呈现多元化已经超过了传统过滤器的范围。实现信息流聚合和过滤的前提是面向整个科研流程的生态系统的构建,在此基础上,结合替代指标体系和定性化评论,从而提供个性化的搜索引擎服务,使得科学信息得到高效地利用。基于传统出版体系所构建的科学评价体系和奖励机制使科学难以实现媒体转换历史惯性的突破。传统学术评价体系依然局限在对论文的成果鉴定方面,不仅如此,正以一种扭曲的科研生态价值导向阻碍着科学朝向更开放、更多元的交流文化而发展。所以打造一个适应网络环境的评价体系势在必行。替代计量学旨在多元科学度量标准的开发和应用,不仅评价对象多元化,可以识别并衡量学术成果的新形式,同时影响力的范围也被拓展了,除了全面衡量学术影响力,还包括科学成果对整个社会影响的潜力。不过作为促进开放科学的关键因素,现阶段的发展依然还集中在论文级别的影响力的架构,并未真正开启向开放科学的过渡评价指标的构建,还需要以开放科学愿景和框架进行补充。随着替代指标的开发和成熟,势必就要改变激励结构,纠正失调的激励机制。通过全面地考虑研究人员的产出,我们将走向一个更有用和更灵活的学术交流系统,这也是未来科学活动走向更加开放、进行全程协作的基础。
赵俊生,候圣,王鑫宇,尹玉洁[2](2020)在《基于集成学习的图像垃圾邮件过滤方法》文中研究指明目前的图像垃圾邮件过滤技术,大都采用国际上通用的垃圾图像数据集作为训练集,与中国国内图像垃圾邮件的图像特点不一致,图像数据缺乏实时更新,且分类器单一,过滤效果难以保证。针对该问题,在建立国内垃圾邮件图像数据库的基础上,首先提取图像的颜色、纹理和形状特征,再经K-NN分类算法优选出HSV颜色直方图特征对不同分类器进行训练、测试和性能比较,提出将基于粗糙集的K-NN算法、Naive Bayes算法和SVM算法构成的3种基分类器相结合,并基于串行迭代提升的方法形成集成学习的强分类器。该方法可以实现对国内图像垃圾邮件的有效过滤,使图像垃圾邮件过滤的准确率和召回率同时得到提升,分别为97.3%和96.1%,误判率降低到了2.7%。
王鹿[3](2020)在《基于贝叶斯分类的垃圾邮件过滤技术研究》文中进行了进一步梳理随着互联网技术的飞速发展,电子邮件以方便、快捷、环保等优点成为人们日常生活工作中不可或缺的一部分。但与此同时,垃圾邮件的出现对用户造成了严重的影响,给社会带来了极大的财产损失和安全威胁,因此研究垃圾邮件过滤技术具有重要意义。本文在基于目前现有的理论和研究基础之上,对垃圾邮件过滤方法进行了系统的介绍,针对当前朴素贝叶斯算法过滤垃圾邮件时尚且存在的不足进行了一定的改进。主要研究内容如下:(1)深入研究反垃圾邮件相关技术,包括邮件的预处理、文本表示模型、特征提取等等。着重研究了朴素贝叶斯分类算法的原理及其来源,并分析它在文本分类方面的优缺点。(2)分析随机森林算法的原理以及在特征选择方面的优势,提出使用随机森林结合朴素贝叶斯的分类算法。针对垃圾邮件过滤系统中普遍存在的维数灾难的问题,通过随机森林特征选择过滤掉邮件集中基尼不纯度为0的特征词,由朴素贝叶斯算法计算出特征选择后的测试邮件的后验概率,得出测试邮件所属类别。(3)提出基于树结构的朴素贝叶斯分类算法。针对朴素贝叶斯算法在分类前期的训练阶段大量消耗系统和网络资源,严重影响分类效率的问题,提出使用树结构代替算法中原本使用的数组来维护训练样本中特征词出现的次数;针对朴素贝叶斯算法在邮件样本属性个数较多时,分类效果较差的问题,对特征词条件概率进行开方处理。(4)通过设计的邮件过滤系统对过滤算法进行分类性能测试。实验结果表明,结合了随机森林的朴素贝叶斯算法较原有算法在分类性能上效果更好;基于树结构的朴素贝叶斯算法较原有算法在邮件样本训练过程中耗时明显减少,随着样本的不断增加,训练耗时也只是缓慢增长,通过选取合适的开方次数z值,来降低垃圾邮件的误判率,使得改进后的算法在垃圾邮件过滤方面具有更好的效果。
黄鹤[4](2019)在《基于深度学习的垃圾邮件过滤方法研究》文中提出随着互联网相关应用的快速发展,广告技术的进步和电子邮件的普及,越来越多的垃圾邮件充斥着我们的生活。如何高效的区分垃圾邮件的研究也逐渐成为了热门课题。因自然语言在结构上有着很强的前后相关性,而且对于中文邮件直接转化成向量会有过高的维度产生,影响最后分类的准确性。基于内容和基于电子邮件源的识别技术现在是常用的两种垃圾邮件过滤方法。例如贝叶斯模型文本识别等就是基于内容的识别技术。白名单与黑名单机制、关键词匹配的是基于邮件来源的技术。电子邮件的数量增加可观、样式层出不穷,基于规则的方法不仅需要对邮件特征规则库进行不断的更新,同时还需要大量的人力。基于内容的方法当前已经取得令人可喜的成效,但随着科技的发展,现在垃圾邮件的制造者们开始大量的使用图像垃圾邮件,然后肆意的进行传播。这种方式的垃圾邮件更加难以检测且消耗的网络宽带也更大。论文主要分析总结当前常用的垃圾邮件的过滤方法,选择基于深度学习的分类算法作为本文研究的重点,建立垃圾邮件过滤模型。这之中具体工作以及贡献包括如下:1.本章设计了一种基于Skip-gram的CNNs-Highway邮件过滤模型(SGCH)。由于以前的词表示方法主要是独热编码(One-hot),但这样做的缺点是维度过高且数据稀疏,对于垃圾邮件过滤,单词之前和之后的语义信息不能很好地保留。目前,词嵌入(word embedding)可以有效地保留词汇语法和语义信息的词向量转换。本文提出的方法将基于词嵌入中Skip-gram模型将词分布式的映射到一个低维空间中,解决传统的One-hot编码词向量维度过高问题,然后结合不同卷积核的CNNs和Highway网络的级联网络,进行文本特征提取,最后在不同的中英文邮件数据集上进实验,证明其有效性。2.本章设计了一种基于深度卷积神经网络(DCNN)和双向GRU网络的垃圾邮件过滤模型(DCNN-BiGRU)。卷积神经网络可以很好的学习研究对象的局部特征,但同时存在其固有缺点,无法学习序列之间的关系。而循环神经网络则相反,在学习序列之间的关系方面有着不俗表现,但是对研究对象的局部信息却不是很敏感。为了弥补二者之间的缺陷,本文提出了改进的深度卷积神经网络和双向GRU网络,最后在CCERT中文邮件数据集上进行实验,证明其有效性。3.本章设计了一种基于决策级融合的垃圾邮件过滤方法。第1、2两个方法都对文本型垃圾邮件过滤技术的改进。然而,近年来,一些垃圾邮件的制造者利用图像承载着垃圾信息,从而进行大量的传播。单一的某一种模态邮件检测,其缺点是不能对邮件的所有信息进行全面的分析。本文基于前二个邮件文本的过滤方法并结合图像分类技术,提出了基于决策级融合的多模态架构模型,并在本文和图像混合的垃圾邮件数据库进行实验,证明其有效性。
徐丹丹[5](2019)在《个性化垃圾邮件过滤的扩展研究》文中提出由于兴趣、爱好的不同,不同用户对垃圾邮件的定义可能存在巨大差异,这是一般化邮件过滤器面临的窘境,因此实现个性化垃圾邮件过滤成为目前邮件过滤领域研究的重要课题。同时,特定用户在不同时间段,兴趣点也会发生变化,会使其重新定义对垃圾邮件的过滤标准,所以检测用户兴趣点是否发生变化也是个性化过滤的关键任务。本文针对特定用户邮箱的错滤情况,对个性化过滤技术进行扩展研究,重点关注如何在动态环境下,结合用户的兴趣特征,降低邮件错滤率,并实现自动修正。主要工作和创新点如下:(1)为了缓解现实情况下网络用户邮箱的错滤程度,本文提出了一种基于客户端的个性化邮件再过滤方法。该方法基于多任务学习理论,使得收件箱和垃圾箱过滤器借鉴彼此的特征描述,“互相学习,分开过滤”,缓解类不平衡问题。本文提出邮件数据流中的“广义虚漂移”概念,同时设计多窗口框架,结合重要性加权的方法以达到动态环境自适应的效果。(2)通常情况下,相同集体(实验室、俱乐部或公司)环境中的用户收到的邮件存在一定的相关性,因此本文提出在集体环境下的个性化邮件再过滤方法。当完全个性化邮件过滤器学到的信息有限时,利用相关性数据,可有效增加其信息量,提高过滤精度。在用户隐私保护的状态下,由用户自主放出主观意识下的垃圾邮件,组成“集体垃圾箱”,设置同集体环境下用户共享垃圾邮件,并基于上一项工作实现个性化过滤。(3)通过在多个公开数据集上与多个现有经典垃圾邮件过滤方法作比较,证明了本文过滤模型的优越性。同时对比集体环境与个体环境下过滤器的性能差异,验证了集体环境下可显着提高过滤器的可预见性。
罗阳[6](2018)在《基于多模态的邮件标识方法及应用》文中研究说明近年来,垃圾邮件制造者为了避开垃圾邮件过滤器的检测,将文本垃圾信息嵌入到图像中,然后将图像附着到邮件正文中进行传播。传统的垃圾邮件过滤器所使用的邮件标识方法大部分是针对文本型邮件的机器学习和模式识别算法,它们无法有效处理这类文本图像混合型垃圾邮件。因此,研究如何对这类邮件进行有效地标识具有极其重要的意义。本文将多模态方法与深度学习技术相结合,对邮件中的文本和图像两种模态的信息进行融合处理,实现了对文本图像混合型邮件的有效标识。本文的主要工作如下:首先,设计了两种多模态架构:基于模型融合的多模态深度学习架构MMAMF和基于特征融合的多模态深度学习架构MMA-FF。在MMA-MF架构中,设计了相互独立的两个神经网络模型CLstmNN和MSK-CNN来分别对邮件的文本和图像进行分类,并设计了一个模型融合网络,利用文本和图像的分类结果对该网络进行训练来学习模型之间的融合规则;在MMA-FF架构中,分别提取邮件的图像特征和文本特征并进行融合,然后通过深度学习技术对模型进行端到端的训练从而获得邮件的文本图像融合特征表示。通过在三类邮件数据集上进行模型训练与测试,并与现有的一些邮件标识方法进行对比,实验结果表明本文的方法能够大幅提升文本图像混合型邮件的识别效果,并在总体上改善了现有方法的识别性能。最后,设计并实现了一套垃圾邮件过滤系统。该系统采用Master-Slave分布式架构,集成了包括多模态深度学习架构MMA-MF在内的多种垃圾邮件过滤技术,实现了对海量邮件的快速扫描和精确识别。系统测试表明,该系统具有较高的邮件识别速率和识别准确率。
代立华[7](2017)在《级联型图像垃圾邮件过滤系统设计》文中提出随着互联网的普及,越来越多的电子邮件从过去单一的文字模式转变为现在的混合图文模式。传统的垃圾邮件过滤方法并不能对其有效分辨,为此人们从提取邮件中的图像特征和文本信息等方面进行了研究,虽取得了一定的成绩,但没有达到理想的效果。目前针对图像垃圾邮件过滤的方法主要有以下缺点:基于图像文本信息并结合传统垃圾邮件进行过滤的方法受图像分辨率和其它干扰因素影响较大,并且执行效率不高;基于图像元数据特征的过滤方法,由于图像文件的元数据信息与图像内容之间没有关联,使得邮件中的图像不具有区分性,因此误判率会较高;基于图像本身特征的过滤方法,该方法通过提取图像特征并结合机器学习算法或其它算法进行分类,虽具备一定的实时性和稳定性,但是单一的图像特征对不同类型图像的过滤性能仍然不太理想。针对上述情况,本文提出基于SIFT算法和卷积神经网络提取图像融合特征,对级联型图像垃圾邮件过滤系统展开研究和设计,主要工作如下:(1)基于SIFT算法提取图像特征,使用K-MEANS算法构建词袋模型并形成词频直方图。使用CIFAR-10数据集对选取的卷积神经网络进行预训练,待网络收敛后,再用SPAM ARCHIVE标准图像库对网络进行训练。网络最终收敛后,将网络最后的分类器层替换为全连接层,构成基于卷积神经网络的特征提取器,全连接层的输出即为卷积神经网络提取的特征。词频直方图和基于卷积神经网络提取的特征做线性组合,获得“SIFT-CNN融合特征”。相比于传统的SIFT特征,“SIFT-CNN融合特征”的计算复杂度较高,但对于图像具有更好的表达能力。(2)基于“SIFT-CNN融合特征”,利用SVM算法对图像进行分类;使用标准图像库测试该方法的分类效果,经过多次实验,最终确定一种分类准确率较高的核函数和惩罚参数;(3)基于小波变换对图像进行二值化,然后通过使用OCR提取图像中的文本信息,基于改进型KNN算法将文本信息与所构建的敏感词库相对比,从而将垃圾邮件进一步的细分为广告类、非法类和其它;相比于一般的KNN算法,改进型KNN算法不仅可以保障算法精度,还可以提高效率。在MATLAB2014A和VS2013的混合编程环境下,使用SPAM ARCHIVE标准图像库对系统进行训练和测试,通过不断优化系统性能,获得了一个较高分类准确率和较快分类速度的级联型过滤系统。本文设计的过滤系统能精确有效地分辨图像垃圾邮件,为以后研究和设计图像垃圾邮件过滤系统提供参考;本文提出的“SIFT-CNN融合特征”为以后研究垃圾图像的特征提供借鉴。
张树华[8](2017)在《基于内容和用户标识的混合型垃圾弹幕识别与过滤研究》文中提出随着互联网的不断发展和推进,网络信息技术的快速发展为电影、电视剧、综艺节目等视频内容创作开启了一个崭新时代。网络在线视频已经在人们观看视频过程中占据了重要地位,成为大众视频消费的主流。“弹幕”因其高互动性和娱乐性开始进入人们的视野,弹幕是指用户在视频网站上观看视频时,可以直接将评论发送并显示在屏幕上方的一种显示方式。在国内最早使用弹幕技术的是动漫圈内的视频吐槽网站Acfun(A站)和bilibili(B站),随着弹幕的发展,弹幕也不再仅仅使用在弹幕视频网站中,如今,国内弹幕应用虽然火爆,但是国内弹幕文化和技术的整体发展时间较短,当前针对弹幕的研究还相对匮乏,对弹幕的有效管理与研究还较少。本文以提高用户的弹幕使用体验为目的,探讨对弹幕文本的识别与处理,提出一种新的基于内容和用户身份标识的混合型垃圾弹幕识别算法,对已有算法进行改进,以更好的引导我国弹幕文化的积极发展,改善用户在使用与观看弹幕时的用户体验,提高网站的用户使用度和黏性,绿化弹幕使用环境。本文针对弹幕文本特征进行分析,对比以往垃圾文本识别研究中较多涉及的邮件以及短信等文本类型,总结出弹幕文本的自身特征,结合其自身特性以进一步加深垃圾弹幕识别的研究。结合弹幕文本自身特点,本文以基于内容的文本分类算法和基于用户身份标识的分类算法为基础展开研究,在已有研究基础上提出一种新的基于以上两种文本分类算法相结合的混合型垃圾弹幕识别算法,并据此进行垃圾弹幕识别与过滤。本文利用从土豆网热播电视剧《琅琊榜》中爬取的弹幕数据作为数据来源进行试验分析,以验证本文提出算法模型的表现效果。通过实验研究可以看出,本文提出改进算法能够有效提高垃圾弹幕识别的准确性。
袁赛杰[9](2017)在《基于图像特征及OCR的垃圾图像过滤方法研究》文中研究表明随着互联网的蓬勃发展,电子邮件成为人们日常交流的重要工具。人们在通过电子邮件接收大量有用信息的同时,也会接收到很多广告、色情、欺诈、木马甚至是反动的内容,这些不良内容占用了大量的网络资源、增加了用户风险、降低了用户体验,属于垃圾邮件。目前,垃圾邮件由文本型逐渐发展为图像型和图像文本混合型,以往针对文本的垃圾邮件过滤方法研究较多,而针对图像的垃圾邮件过滤方法仍不尽人意。本文主要针对垃圾邮件中的垃圾图像过滤技术进行研究。本文设计了一种两层垃圾图像过滤方法,通过利用图像底层特征和OCR识别两种途径逐级筛选垃圾图像,在提高检出率的同时降低了误检率。根据采用的特征类型,该方法分为基于特征的过滤层和基于内容的过滤层。前者为第一层过滤,属于粗分类,利用图像的底层特征初步筛选出垃圾图像;后者为第二层过滤,属于细分类,利用垃圾图像中识别的文本内容来提取关键词并进行垃圾类别的分类。在基于特征的过滤层中,本文提出了基于置信度分析的KNN过滤方法。首先分析垃圾图像和正常图像的颜色、梯度以及HOG等图像底层特征;然后分析各特征KNN分类结果及置信度分布,通过置信度实现多特征分类结果的融合,降低误识率。在基于内容的过滤层中,本文首先设计了垃圾图像中文本的检测、分割和识别方法,针对垃圾图像中文本倾斜问题设计了基于傅立叶和投影的单字分割方法;然后提出了融入相对词频的卡方检验方法用于提取文本中的关键词特征,降低了低频词被选为特征的概率;最后设计了基于SVM及先验语料库的短文本分类方法,将垃圾图像进一步分类为犯罪、教育、保险和商品促销等几类。采用SPAM公共图像集和搜集整理的图像集上进行了实验分析和比较,结果表明本文两层垃圾图像过滤方法获得了比较理想的准确率和误识率。
刘艳洋[10](2015)在《图像型垃圾邮件过滤系统的研究》文中研究说明随着计算机网络技术的发展和电子邮件应用的普及,垃圾邮件制造者常利用图像型垃圾邮件发送广告、色情、欺诈信息及反动思想等不良内容牟取利益。同文本型垃圾邮件相比,图像型垃圾邮件更难以检测,同时占用更多的网络资源,甚至会给社会安全埋下隐患。现有的图像型垃圾邮件过滤系统不尽人意,所以仍有必要开展图像型垃圾邮件过滤技术的研究。本文研究并设计了一个级联型邮件过滤系统,降低了图像型邮件错误分类的可能性。图像型垃圾邮件过滤技术主要包括邮件图像的特征提取和分类识别两大部分,因此分别从这两方面介绍本文所设计的多层邮件过滤系统。(1)第一层粗分类:利用图像的底层特征,并结合支持向量机(SVM)实现粗分类得到第一层过滤系统,使大多数正常邮件图像被识别出来。在此过滤系统中,分别对比了颜色特征、梯度特征、LBP特征后,并提出新的融合特征即梯度—LBP的融合特征,利用SVM分类器此特征可以得到更高的准确率。(2)第二层精分类:选择更加精细的图像特征,基于SIFT特征和GIST特征构造词袋模型(Bags of words),引入并改进局部敏感哈希算法(LSH),实现精分类得到第二层过滤系统。在此过滤系统中,比较了LSH算法改进前后的计算复杂度和分类准确率。并提出一种新的文本定位方法,能够很好的定位到垃圾邮件图像中的文本区域。该方法结合Adaboost算法利用表示形式简单和计算速度快的haar特征实现。(3)第三层进一步分类:利用文字识别软件(OCR)提取垃圾邮件图像中的文本信息,并与敏感词库进行比对,实现最后一步分类得到第三层过滤系统。在MATLAB和VS2008的混合编程环境下,使用标准图像库Spam Archive和作者利用互联网和电子邮箱搜集的垃圾图像以及人工构造的垃圾图像进行训练和测试,并分析了每层过滤系统的性能,结果表明级联过滤系统获得了较高的准确率。
二、一种混合型垃圾邮件过滤系统的研究与设计(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、一种混合型垃圾邮件过滤系统的研究与设计(论文提纲范文)
(1)网络时代科学活动的变革研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景和意义 |
1.2 文献综述及研究问题 |
1.2.1 网络时代科学活动整体的变革 |
1.2.2 网络时代科研模式的变革 |
1.2.3 网络时代基于大数据科研方式的变革 |
1.2.4 网络时代出版模式趋势分析 |
1.2.5 开放共享背景下科学活动面临系列问题 |
1.3 研究内容、方法与可能的创新点 |
1.3.1 研究内容 |
1.3.2 研究方法 |
1.3.3 可能的创新之处 |
第2章 从Science 1.0到Science 2.0 |
2.1 小科学与大科学 |
2.1.1 从小科学时代到大科学时代 |
2.1.2 科学发展对信息载体需求的变化 |
2.2 信息载体变革与Science 2.0的提出 |
2.2.1 纸媒到Web 2.0: 载体发展过程存在阶段性质变 |
2.2.2 载体的质变对科学活动产生重要的影响 |
2.2.3 网络逐渐已经成为科学活动的主流载体 |
2.3 Science 2.0时代科学活动新特征 |
2.3.1 使个体研究走向在线协作 |
2.3.2 使成果交流走向全程探索 |
2.3.3 由纸媒传播走向即时在线 |
2.4 小结 |
第3章 网络时代科学活动过程的新变化 |
3.1 网络时代科研主体的新变化 |
3.1.1 独立主体内涵的丰富 |
3.1.2 不同主体联系的增强 |
3.1.3 协作主体交流的拓展 |
3.1.4 创造主体格局的突破 |
3.2 网络时代数据处理的新演化 |
3.2.1 数据采集走向自动化 |
3.2.2 数据存取实现即时化 |
3.2.3 数据分析呈现协同化 |
3.2.4 数据处理尝试智能化 |
3.3 小结 |
第4章 网络时代科学成果发布的新趋向 |
4.1 科学成果发布的新舞台:网络预发布平台的建立与推广 |
4.1.1 纸媒预发表的瓶颈 |
4.1.2 网络预发布平台的建立——以物理学arXiv为例 |
4.1.3 网络预发布平台的推广——以PeerJ Preprints和bioRxiv为例 |
4.1.4 网络预发布平台与期刊共存 |
4.2 科学成果发布的新途径: 开放获取期刊的出现和发展 |
4.2.1 开放获取期刊旨在打破访问权限 |
4.2.2 开放获取期刊的发展步履维艰 |
4.2.3 开放获取期刊是新希望还是乌托邦? |
4.2.4 开放获取期刊的未来: 资本和价值的共生 |
4.3 科学成果发布的新模式: 基于网络本体成果发布的探索 |
4.3.1 去中心化: 人人皆可随时发表 |
4.3.2 去期刊化: 随时随地皆可发表 |
4.3.3 未来: 一条微博可能就是你的学术成果 |
4.3.4 科学评价和认可机制的再造 |
4.4 小结 |
第5章 网络时代科学成果传播的新问题 |
5.1 开放获取的功与过 |
5.1.1 需与传统商业期刊出版体系相抗衡 |
5.1.2 在与资本不断斡旋中出现偏差 |
5.1.3 在对传统功能地解构中不断重构 |
5.2 传播方式的“是”与“非” |
5.2.1 在网上分享自己的论文也算侵权? |
5.2.2 Sci-Hub存在本身就是价值 |
5.2.3 出版商的权利比分享研究的利益更重要? |
5.3 谁来确认优先权 |
5.3.1 科研主体多元化所导致的优先权归属难题 |
5.3.2 科研过程开放化所造成的优先权判定疑难 |
5.3.3 信息载体的升级导致科学创意及成果发布方式的变化 |
5.3.4 成果发布渠道的多样化导致优先权确认机制的变化 |
5.4 在线科学信息价值的判定疑难 |
5.4.1 传统同行评审机制频繁失效导致判定失真 |
5.4.2 传播方式多样化导致依据出版的评判标准失效 |
5.4.3 传播内容多样性亟待建立新的过滤机制 |
5.4.4 网络时代的过滤机制由谁重构: 从同行评审走向全面过滤 |
5.5 小结 |
第6章 网络时代科学评价机制的新挑战 |
6.1 默顿理想的背离 |
6.1.1 “普遍主义”遭破坏 |
6.1.2 “公有性”被侵犯 |
6.1.3 “无私利性”的缺失 |
6.2 科学计量评价的新机遇: 替代计量学 |
6.2.1 矫正传统评价机制带来的“马太效应” |
6.2.2 推动论文评价指标走向“多元即时透明” |
6.2.3 构建面向科研全程的个人学术影响力评价体系 |
6.3 科学奖励机制的新内容: 基于科研产品的全面认定 |
6.3.1 从科研成果走向科研产品 |
6.3.2 最大限度地激发集体在科研全程地全面合作 |
6.3.3 从个体成果认定到产品认证集成 |
6.4 小结 |
第7章 网络时代科学活动的变革与应对 |
7.1 科学活动在线化与科学协作创新的演变 |
7.2 成果发布网络化与在线交流系统的构建 |
7.3 信息动态交互与优先权和过滤机制的再造 |
7.4 评价方式变化与科学社会运行机制的调整 |
7.5 在危机与变革中走向科学活动新常态 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的其他研究成果 |
(2)基于集成学习的图像垃圾邮件过滤方法(论文提纲范文)
1 引言 |
2 图像特征 |
2.1 HSV颜色直方图特征 |
(1)HSV颜色空间。 |
(2)HSV颜色直方图。 |
(3)HSV应用领域。 |
(4)HSV颜色直方图特征提取。 |
2.2 颜色矩特征 |
(1) 颜色矩特征表示。 |
(2) 颜色矩特征提取。 |
2.3 纹理特征 |
(1) 纹理特征表示。 |
(2) 纹理特征提取。 |
2.4 形状特征 |
(1) 形状特征表示。 |
(2) 形状特征提取。 |
3 K-NN分类器及集成学习过滤器模型设计 |
3.1 K-NN分类器设计 |
3.2 集成学习过滤器模型设计 |
(1)训练数据的权值分布初始化,如式(13)所示: |
(2)k=1,2,…,M(个体分类器个数M=3): |
(3)构建基本分类器的线性组合,如式(19)所示: |
(4)得到最终强分类器,如式(20)所示: |
4 实验结果分析 |
4.1 不同特征作用于K-NN分类器的比较分析 |
4.2 HSV颜色直方图特征在不同分类算法中的比较分析 |
5 结束语 |
(3)基于贝叶斯分类的垃圾邮件过滤技术研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 课题背景及意义 |
1.2 邮件过滤技术国内外研究现状 |
1.2.1 基于黑名单的过滤技术 |
1.2.2 基于规则的过滤技术 |
1.2.3 基于内容统计的过滤技术 |
1.3 论文研究内容 |
1.4 论文组织结构 |
第二章 反垃圾邮件相关技术研究 |
2.1 邮件的基本结构 |
2.2 邮件主要模块的选取 |
2.3 邮件的预处理 |
2.3.1 英文邮件的预处理 |
2.3.2 中文邮件的预处理 |
2.4 文本表示模型 |
2.4.1 布尔模型 |
2.4.2 概率模型 |
2.4.3 向量空间模型 |
2.5 特征提取 |
2.6 贝叶斯分类技术 |
2.6.1 贝叶斯定理 |
2.6.2 贝叶斯分类器 |
2.6.3 朴素贝叶斯算法 |
2.6.4 常见的朴素贝叶斯扩展算法 |
2.7 本章小结 |
第三章 基于随机森林的朴素贝叶斯算法垃圾邮件过滤研究 |
3.1 随机森林算法 |
3.1.1 决策树 |
3.1.2 构建组合分类器方法 |
3.1.3 随机森林 |
3.2 朴素贝叶斯融合随机森林的过滤算法研究 |
3.3 基于随机森林的朴素贝叶斯算法垃圾邮件过滤模型 |
3.4 本章小结 |
第四章 基于树结构的朴素贝叶斯算法垃圾邮件过滤研究 |
4.1 树结构思想 |
4.2 敏感度分析 |
4.3 基于树结构的朴素贝叶斯算法 |
4.4 树结构朴素贝叶斯算法垃圾邮件过滤模型 |
4.5 本章小结 |
第五章 系统的设计与实现及实验结果分析 |
5.1 系统总体设计 |
5.2 过滤系统主要模块设计 |
5.3 过滤系统实现 |
5.4 实验结果及分析 |
5.4.1 评价标准 |
5.4.2 训练部分对比 |
5.4.3 测试部分对比 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读硕士学位期间发表的学术论文及取得的相关科研成果 |
致谢 |
(4)基于深度学习的垃圾邮件过滤方法研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.1.1 垃圾邮件的定义 |
1.1.2 垃圾邮件的危害 |
1.2 课题国内外研究现状 |
1.3 论文的结构 |
第二章 邮件文本分类方法 |
2.1 电子邮件工作原理 |
2.1.1 电子邮件的标准格式和遵循的协议 |
2.1.2 电子邮件在网络中的传输 |
2.2 文本分类简介 |
2.3 文本预处理 |
2.3.1 非法字符的过滤 |
2.3.2 分词 |
2.3.3 去除停用词 |
2.3.4 替换相关词 |
2.3.5 词向量方法研究 |
2.4 常用垃圾邮件分类技术 |
2.4.1 Bayes分类模型 |
2.4.2 Decision Tree分类模型 |
2.4.3 SVM分类模型 |
2.4.4 FastText分类模型 |
2.4.5 CNN分类模型 |
2.4.6 RNN分类模型 |
2.4.7 LSTM与 GRU分类模型 |
2.5 本章小结 |
第三章 基于Skip-gram的 CNNs-Highway邮件过滤模型 |
3.1 引言 |
3.2 相关概念与算法模型 |
3.2.1 Word embedding |
3.2.2 模型架构 |
3.2.3 模型训练 |
3.3 实验结果有分析 |
3.3.1 实验环境 |
3.3.2 数据集及评价指标 |
3.3.3 实验结果分析 |
3.4 本章小结 |
第四章 基于DCNN-BiGRU的邮件过滤模型 |
4.1 引言 |
4.2 相关概念与算法模型 |
4.2.1 DCNN-BiGRU模型 |
4.2.2 模型架构 |
4.2.3 模型训练 |
4.3 实验结果与分析 |
4.3.1 实验环境 |
4.3.2 数据集及评价指标 |
4.3.3 实验结果分析 |
4.4 本章小结 |
第五章 基于数据融合的垃圾邮件过滤模型 |
5.1 引言 |
5.2 相关概念与算法模型 |
5.2.1 基于决策级融合的架构模型 |
5.2.2 模型架构 |
5.2.3 模型训练 |
5.3 实验结果与分析 |
5.3.1 实验环境 |
5.3.2 数据集及评价指标 |
5.3.3 实验结果分析 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 本文工作总结 |
6.2 工作展望 |
参考文献 |
附录1 攻读硕士学位期间撰写的论文 |
致谢 |
(5)个性化垃圾邮件过滤的扩展研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 课题研究背景和研究意义 |
1.1.1 课题研究背景 |
1.1.2 课题研究意义 |
1.2 国内外研究现状 |
1.2.1 一般化过滤与个性化过滤 |
1.2.2 基于协议过滤 |
1.2.3 基于内容过滤 |
1.3 本文的主要研究工作 |
1.4 本文的内容安排 |
第二章 动态环境下的个性化垃圾邮件技术回顾 |
2.1 动态环境自适应的相关研究 |
2.1.1 动态环境的概念漂移问题 |
2.1.2 动态环境下的类不平衡问题 |
2.1.3 动态环境自适应算法 |
2.2 垃圾邮件过滤相关研究 |
2.2.1 邮件的组成及其架构 |
2.2.2 邮件的文本特征选择策略 |
2.2.3 邮件的文本向量化策略 |
2.3 动态环境下个性化垃圾邮件过滤方法 |
2.3.1 增量学习IL |
2.3.2 半监督学习SSL |
2.3.3 集成学习EL |
2.4 本章小结 |
第三章 基于客户端的个性化邮件再过滤研究 |
3.1 研究背景与动机 |
3.2 基于客户端的个性化邮件再过滤系统 |
3.2.1 基于规则过滤 |
3.2.2 广义虚漂移 |
3.2.3 多任务学习 |
3.2.4 结合重要性加权的多窗口框架 |
3.3 实验及结果分析 |
3.3.1 实验设置 |
3.3.2 实验结果分析 |
3.4 本章小结 |
第四章 集体环境下的个性化邮件再过滤研究 |
4.1 研究背景与动机 |
4.2 集体环境下的个性化邮件再过滤系统 |
4.2.1 集体垃圾箱的建立 |
4.2.2 垃圾邮件的共享及再过滤 |
4.2.3 模型的选择:ELM和 OS-ELM |
4.3 实验及结果分析 |
4.3.1 实验设置 |
4.3.2 实验结果分析 |
4.4 本章小结 |
第五章 总结与展望 |
5.1 工作总结 |
5.2 未来展望 |
参考文献 |
致谢 |
在学期间的研究成果及发表的学术论文 |
(6)基于多模态的邮件标识方法及应用(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题研究背景与意义 |
1.2 邮件标识方法国内外研究现状 |
1.2.1 传统邮件标识方法的发展历程 |
1.2.2 基于深度学习的邮件标识方法研究现状 |
1.2.3 基于多模态的邮件标识方法研究现状 |
1.3 本文研究内容与主要工作 |
1.4 本文的结构安排 |
第二章 相关理论和技术基础 |
2.1 电子邮件原理 |
2.1.1 电子邮件工作原理 |
2.1.2 电子邮件的传输协议 |
2.1.3 电子邮件的格式协议 |
2.2 邮件标识方法基础 |
2.2.1 文本型邮件标识方法简介 |
2.2.2 图像型邮件标识方法简介 |
2.3 深度学习技术基础 |
2.3.1 反向传播算法 |
2.3.2 卷积神经网络 |
2.3.3 循环神经网络 |
2.4 自然语言处理相关理论 |
2.4.1 文本分词技术 |
2.4.2 词嵌入 |
2.5 本章小结 |
第三章 基于多模态的邮件标识方法研究 |
3.1 相关背景与动机 |
3.2 一种基于模型融合的多模态架构 |
3.2.1 基础架构设计 |
3.2.2 文本分类深度网络模型设计 |
3.2.3 图像分类深度网络模型设计 |
3.2.4 多模态模型融合 |
3.2.5 网络训练方式 |
3.3 一种基于特征融合的多模态架构 |
3.3.1 基础架构设计 |
3.3.2 多模态特征学习 |
3.3.3 网络优化方法 |
3.3.4 网络训练方式 |
3.4 实验设计与实验结果 |
3.4.1 对比实验设计 |
3.4.2 实验数据 |
3.4.3 评价指标 |
3.4.4 实验结果分析 |
3.5 本章小结 |
第四章 垃圾邮件过滤系统设计与实现 |
4.1 系统设计 |
4.1.1 系统简介 |
4.1.2 系统硬件架构设计与部署 |
4.1.3 系统软件架构 |
4.1.4 系统工作流程 |
4.1.5 数据库设计 |
4.2 系统实现 |
4.2.1 Master配置管理模块 |
4.2.2 Master任务管理模块 |
4.2.3 Slave系统配置模块 |
4.2.4 Slave邮件过滤模块 |
4.3 性能测试 |
4.3.1 评价指标 |
4.3.2 测试数据 |
4.3.3 测试环境 |
4.3.4 测试结果与分析 |
4.4 本章小结 |
第五章 总结与展望 |
5.1 全文总结 |
5.2 后续工作展望 |
致谢 |
参考文献 |
(7)级联型图像垃圾邮件过滤系统设计(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 论文的研究背景与选题意义 |
1.2 国外研究现状 |
1.3 国内研究现状 |
1.4 论文的主要内容及结构安排 |
第二章 图像垃圾邮件和过滤技术介绍 |
2.1 图像垃圾邮件的定义 |
2.2 图像垃圾邮件的种类 |
2.3 图像垃圾邮件的特征 |
2.4 图像垃圾邮件的演进 |
2.5 图像垃圾邮件的构造方法 |
2.6 现有图像垃圾邮件过滤方法 |
2.7 图像垃圾邮件标准数据库 |
2.8 本章小结 |
第三章 级联型图像垃圾邮件过滤系统的设计 |
3.1 系统拓扑图 |
3.2 系统各部分功能介绍 |
3.3 基于SIFT特征构建词袋模型 |
3.3.1 提取图像SIFT特征 |
3.3.2 基于K-means构造词袋模型 |
3.3.2.1 K-means算法介绍 |
3.3.2.2 词袋模型介绍 |
3.3.2.3 基于权值分布的视觉直方图计算 |
3.4 基于SIFT和卷积神经网络的融合特征提取算法 |
3.4.1 卷积神经网络 |
3.4.2 SIFT-CNN-基于SIFT和卷积神经网络的融合特征 |
3.4.2.1 基于LeNet网络结构的SIFT-CNN特征提取 |
3.4.2.2 基于Network in Network结构的子块滤波器设计 |
3.4.2.3 基于级联子块滤波器的SIFT-CNN特征提取 |
3.5 使用SVM进行训练和识别 |
3.6 基于OCR和KNN最邻近算法的过滤系统 |
3.6.1 系统功能介绍 |
3.6.2 图像垃圾邮件文本信息提取 |
3.6.2.1 基于小波变换的图像二值化 |
3.6.2.2 提取文本信息和构造敏感词库 |
3.6.3 基于改进的KNN算法对垃圾图象进行分类 |
3.6.3.1 基本概念 |
3.6.3.2 改进KNN算法 |
3.7 总结 |
第四章 级联型图像垃圾邮件过滤系统实现和性能分析 |
4.1 级联型图像垃圾邮件过滤系统实现 |
4.2 基于SIFT-CNN特征和SVM过滤系统的实验结果与性能分析 |
4.2.1 基于SIFT特征的词频分布直方图实验 |
4.2.2 卷积神经网络的预训练实验 |
4.2.2.1 LeNet网络的预训练实验 |
4.2.2.2 Network in Network卷积神经网络网络的预训练实验 |
4.2.3 SIFT-CNN特征提取的实验 |
4.2.4 SVM参数优化实验 |
4.3 基于OCR和KNN算法的过滤系统实验结果与性能分析 |
4.4 系统的总体性能分析 |
4.5 本章小结 |
结论 |
参考文献 |
致谢 |
个人简历、在学期间的研究成果及发表的学术论文 |
(8)基于内容和用户标识的混合型垃圾弹幕识别与过滤研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景与研究意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 研究问题与研究方法 |
1.2.1 研究问题 |
1.2.2 研究方法 |
1.3 研究创新 |
1.4 研究主要内容与技术路线 |
1.4.1 主要内容 |
1.4.2 技术路线 |
2 国内外相关研究 |
2.1 弹幕的相关研究 |
2.1.1 弹幕表现特征及弹幕文化相关研究 |
2.1.2 弹幕传播媒介相关研究 |
2.1.3 弹幕分析技术相关研究 |
2.2 垃圾文本识别研究 |
2.2.1 文本分类算法角度相关研究 |
2.2.2 文本类型角度相关研究 |
2.2.3 基于身份标识的垃圾文本识别技术 |
2.3 本章小结 |
3 模型构建 |
3.1 引言 |
3.2 文本预处理 |
3.2.1 数据抽样 |
3.2.2 中文分词研究 |
3.3 特征选取 |
3.3.1 卡方检验 |
3.3.2 信息增益 |
3.3.3 互信息 |
3.3.4 期望交叉熵 |
3.4 基于内容的朴素贝叶斯分类器构建 |
3.4.1 弹幕文本特点 |
3.4.2 垃圾弹幕特点 |
3.4.3 基于内容的朴素贝叶斯分类器 |
3.5 基于身份标识的贝叶斯模型构建 |
3.6 基于贝叶斯的混合型弹幕分类 |
3.7 贝叶斯识别的反馈学习 |
3.7.1 增量式学习 |
3.7.2 重新学习 |
3.7.3 混合型贝叶斯算法的反馈学习 |
3.8 本章小结 |
4 实验分析及算法评价 |
4.1 实验环境 |
4.2 实验数据集 |
4.3 实验分析评价指标 |
4.4 实验测试集选取方法 |
4.5 实验过程设计 |
4.6 实验过程与结论 |
4.6.1 预处理 |
4.6.2 对比实验过程及结果 |
5 主要结论及研究展望 |
5.1 主要结论 |
5.2 后续研究展望 |
致谢 |
参考文献 |
附录一:部分json原始数据 |
附录二:解析json原始数据 |
附录三:贝叶斯核心算法实现 |
附录四:作者在读期间发表的学术论文及参加的科研项目 |
(9)基于图像特征及OCR的垃圾图像过滤方法研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景和选题意义 |
1.2 国内外研究现状 |
1.3 研究内容及主要结构 |
2 垃圾图像过滤技术概述 |
2.1 垃圾图像及其分类 |
2.2 垃圾图像的特性 |
2.3 垃圾图像过滤研究现状 |
2.3.1 基于图像内容特征的过滤方法 |
2.3.2 基于文本内容的图像过滤方法 |
2.4 垃圾图像的数据集 |
2.5 本章小结 |
3 基于改进的图像特征融合方法的过滤 |
3.1 图像特征提取 |
3.1.1 颜色特征 |
3.1.2 梯度特征 |
3.1.3 HOG特征 |
3.2 垃圾图像分类识别算法 |
3.2.1 AdaBoost算法 |
3.2.2 KNN算法 |
3.3 改进的特征融合算法 |
3.3.1 特征决策的先后顺序 |
3.3.2 阈值的选定 |
3.4 本章小结 |
4 结合短文本分类的基于OCR的过滤方法 |
4.1 文本检测 |
4.1.1 颜色空间转换 |
4.1.2 边缘检测 |
4.1.3 形态学运算 |
4.1.4 连通域过滤 |
4.2 文本识别 |
4.2.1 基于傅立叶的倾斜矫正 |
4.2.2 统一背景的二值化 |
4.2.3 基于投影的单字分割 |
4.2.4 OCR识别 |
4.3 文本特征提取 |
4.3.1 TF-IDF |
4.3.2 卡方检验 |
4.3.3 LDA主题模型 |
4.3.4 改进的文本特征提取方法 |
4.4 文本分类SVM算法 |
4.5 本章小结 |
5 多层过滤系统的设计与实现 |
5.1 系统总体设计框图 |
5.2 粗分类过滤系统 |
5.2.1 基于特征的过滤系统框架 |
5.2.2 基于特征的过滤系统的实验结果 |
5.3 细分类过滤系统 |
5.3.1 基于内容的过滤系统框架 |
5.3.2 基于内容的过滤系统的实验结果 |
5.4 本章小结 |
6 总结和展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
(10)图像型垃圾邮件过滤系统的研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 论文的研究背景与选题意义 |
1.2 国内外研究现状 |
1.3 论文的主要内容及结构安排 |
2 图像型垃圾邮件过滤概述 |
2.1 图像型垃圾邮件的定义 |
2.2 图像型垃圾邮件的种类 |
2.3 图像型垃圾邮件的特征 |
2.4 现有图像型垃圾邮件过滤方法 |
2.5 图像型垃圾邮件数据库 |
2.6 本章小结 |
3 图像型垃圾邮件的特征提取 |
3.1 基于图像底层的特征提取 |
3.1.1 颜色特征 |
3.1.2 梯度特征 |
3.1.3 LBP 特征 |
3.1.4 融合特征 |
3.2 构造基于 SIFT 的词袋模型 |
3.2.1 SIFT 特征 |
3.2.2 词袋模型 |
3.3 GIST 特征 |
3.3.1 Gabor 小波概述 |
3.3.2 GIST 特征提取 |
3.4 文本区域定位与特征提取 |
3.4.1 现有文本区域定位方法 |
3.4.2 本文文本区域定位方法 |
3.5 本章小结 |
4 图像型垃圾邮件的分类 |
4.1 SVM 算法 |
4.2 最近邻算法 |
4.3 相似性检索算法 |
4.3.1 LSH 算法 |
4.3.2 改进的 LSH 算法 |
4.4 Adaboost 算法 |
4.4.1 弱分类器的训练过程 |
4.4.2 强分类器的训练过程 |
4.4.3 级联分类器的训练过程 |
4.5 本章小结 |
5 多层垃圾邮件过滤系统总体设计 |
5.1 系统总体设计框图 |
5.2 第一层过滤系统 |
5.2.1 第一层过滤系统框架 |
5.2.2 第一层过滤系统的实验结果与性能分析 |
5.3 第二层过滤系统 |
5.3.1 第二层过滤系统框架 |
5.3.2 第二层过滤系统的实验结果与性能分析 |
5.4 第三层过滤系统 |
5.4.1 第三层过滤系统框架 |
5.4.2 第三层过滤系统的实验结果与性能分析 |
5.5 文本区域定位的实验结果 |
5.6 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读硕士期间发表学术论文情况 |
致谢 |
四、一种混合型垃圾邮件过滤系统的研究与设计(论文参考文献)
- [1]网络时代科学活动的变革研究[D]. 吴爽. 中国科学技术大学, 2021(09)
- [2]基于集成学习的图像垃圾邮件过滤方法[J]. 赵俊生,候圣,王鑫宇,尹玉洁. 计算机工程与科学, 2020(06)
- [3]基于贝叶斯分类的垃圾邮件过滤技术研究[D]. 王鹿. 上海工程技术大学, 2020(04)
- [4]基于深度学习的垃圾邮件过滤方法研究[D]. 黄鹤. 南京邮电大学, 2019(02)
- [5]个性化垃圾邮件过滤的扩展研究[D]. 徐丹丹. 南京航空航天大学, 2019(02)
- [6]基于多模态的邮件标识方法及应用[D]. 罗阳. 电子科技大学, 2018(09)
- [7]级联型图像垃圾邮件过滤系统设计[D]. 代立华. 福州大学, 2017(05)
- [8]基于内容和用户标识的混合型垃圾弹幕识别与过滤研究[D]. 张树华. 杭州电子科技大学, 2017(02)
- [9]基于图像特征及OCR的垃圾图像过滤方法研究[D]. 袁赛杰. 南京理工大学, 2017(07)
- [10]图像型垃圾邮件过滤系统的研究[D]. 刘艳洋. 辽宁工业大学, 2015(06)