王靖亚 作品数:54 被引量:150 H指数:7 供职机构: 中国人民公安大学 更多>> 发文基金: 国家社会科学基金 公安部应用创新计划 公安部公安理论及软科学研究计划项目 更多>> 相关领域: 自动化与计算机技术 政治法律 文化科学 动力工程及工程热物理 更多>>
平面空间时空轨迹快速聚类算法研究 被引量:2 2015年 针对现有聚类分析算法对平面空间时空轨迹进行聚类的不足,提出了基于区域的快速聚类方法。借助先验知识确定输入参数,使用符合现实情况的切比雪夫距离或曼哈顿距离度量点间距离以划分聚类簇,区分人的各个常驻地点;使用区域叠加的概念度量点的密度,确定簇的质心以获得每个常驻地点的中心坐标;在保证算法复杂度的前提下确定簇的边缘点,标注人在每个常驻地点的活动范围。相比现有算法,该算法更适用于时空轨迹数据分析。 刘翔 王斌君 王靖亚 贺滢睿关键词:聚类 复杂度 公安信息化信息安全指标体系研究 被引量:6 2008年 公安信息化过程中必须要对信息安全加以关注。从组织体系、信息安全建设、信息安全策略、运行安全控制、信息安全培训和涉密信息管理六个方面,可以制定相应的指标体系用于客观评价公安信息化信息安全状态,并可根据指标体系对具体部门的信息安全水平进行测评,据此采取相应策略,维护公安信息系统的安全。 王靖亚 黄明 巩荣关键词:信息安全 公安信息化 指标体系 基于快速凸包的目标车辆动态围堵算法 被引量:2 2020年 为了以最小代价快速抓捕逃逸的目标车辆,利用凸包和图论的方法研究了目标车辆的动态围堵问题。对传统凸包算法进行改进,基于快速凸包算法形成了节点数最少的完全包围圈;将警力调度问题转化为加权二分图匹配问题,并求出耗时最少的警力调度结果,最后形成具体的围堵方案。改进后的快速凸包算法结合警力调度算法能在相对较短时间内对逃逸车辆完成围堵。 赵弘杨 王靖亚关键词:图匹配 基于背景重构与边缘相关短文本特征选择方法 被引量:1 2016年 为了解决短文本对象特征空间稀疏性与背景缺失造成的精确分类困难与语义混淆问题,提出一种背景补偿与边缘相关计算的特征选择方法.通过提取并利用文本间存在的关联性建立小样本簇背景特征集,重构特征空间,并结合边缘相关性分析确定最终的特征集.过程可分为2个阶段:1)基于词矢量语义量化模型计算特征词的背景相关性;2)将测试文本重组特征空间,并进行边缘性相关计算.提出的短文本特征选择方法,可以在保持原始特征空间性质与结构的前提下,强化特征空间紧凑性,减少冗余性,降低特征维度.在Reuters-21578和NewsGroup标准语料集上的实验证明,提出的方法比传统的文档频率、信息增益、互信息等方法更有效,针对两个标准的数据集,其在典型的分类器上运行表现强于一般特征选择方法. 张海涛 王斌君 王靖亚关键词:期望交叉熵 融合注意力和裁剪机制的通用文本分类模型 2023年 针对当前分类模型通常仅对一种长度文本有效,而在实际场景中长短文本大量混合存在的问题,提出了一种基于混合神经网络的通用型长短文本分类模型(GLSTCM-HNN)。首先,利用BERT(Bidirectional Encoder Representations from Transformers)对文本进行动态编码;然后,使用卷积操作提取局部语义信息,并构建双通道注意力机制(DCATT)对关键文本区域增强;同时,使用循环神经网络(RNN)捕获全局语义信息,并建立长文本裁剪机制(LTCM)来筛选重要文本;最后,将提取到的局部和全局特征进行融合降维,并输入到Softmax函数里以得到类别输出。在4个公开数据集上的对比实验中,与基线模型(BERT-TextCNN)和性能最优的对比模型(BERT)相比,GLSTCMHNN的F1分数至多分别提升了3.87和5.86个百分点;在混合文本上的两组通用性实验中,GLSTCM-HNN的F1分数较已有研究提出的通用型模型——基于Attention的改进CNN-BiLSTM/BiGRU混联文本分类模型(CBLGA)分别提升了6.63和37.22个百分点。实验结果表明,所提模型能够有效提高文本分类任务的准确性,并具有在与训练数据长度不同的文本上以及在长短混合文本上分类的通用性。 崔雨萌 王靖亚 刘晓文 闫尚义 陶知众关键词:文本分类 云服务的内部威胁及其控制研究 被引量:1 2015年 云服务的兴起,使云安全问题也备受关注。一方面海量数据存储在云端,另一方面用户对数据的完整性、保密性和可用性有更高要求。云服务提供商为了确保客户的数据安全,不仅需要面对外部威胁,也要应对具有同样破坏力的内部威胁。在外部威胁已经引起广泛关注的今天,由于对内部威胁的忽视,使内部威胁成为主要攻击模式之一。很多提供云服务的企业并未对此问题有充分认识。同时在云服务模式下,以往的安全策略必然不能解决新形势下、新架构下的内部威胁。文章介绍了云服务背景下的内部威胁,提出了解决内部威胁的控制模型和控制流程,并对内部威胁评估、行政控制、技术控制、监控以及响应进行了详细阐述,以期为解决云服务背景下的内部威胁提供帮助。 贺滢睿 王靖亚关键词:云服务 面向中文文本分类的词级对抗样本生成方法 被引量:15 2020年 针对基于深度学习方法的中文文本分类模型的鲁棒性问题,文章提出一种词级黑盒对抗样本生成方法CWordAttacker。该算法采用定向词删除评分机制,能够在模型内部细节未知的情况下定位显著影响分类结果的关键词,并使用繁体、拼音替换等多种攻击策略生成与原句语义一致的对抗样本,可完成定向和非定向两种攻击模式。在情感、垃圾短信和新闻分类数据集上针对LSTM、TextCNN和带注意力的CNN模型进行测试的结果表明:CWordAttacker能够以较小的扰动大幅度降低靶机模型准确率。 仝鑫 王罗娜 王润正 王靖亚关键词:自然语言处理 中文文本分类 基于机器学习的手写签名鉴别技术综述 2021年 手写签名鉴别是应用最广泛的生物认证技术之一,由于其具备的高效性、可靠性和低成本等优点,该技术在行政、金融以及刑事司法鉴定等领域中都扮演着重要的角色。本文在阐述手写签名鉴别技术基本概念的基础上,对该领域常用的公开数据集和评估指标进行简介,对多种主流基于机器学习的手写签名鉴别方法进行分析和讨论,并提出该领域的挑战与发展方向。 张长琳 仝鑫 王靖亚关键词:手写签名鉴别 算法结构对其性能的影响研究 2005年 本文的目的在于探讨算法结构对其性能的影响,在解决同一问题时,通过对不同结构的算法性能进行分析、比较,得出了不同的算法结构其性能大不相同的结论. 王靖亚关键词:系统资源 计算机操作留痕的侦查和反侦查 2009年 操作留痕是系统提供给用户的用于提高操作效率的功能,该功能即可以用来进行破案侦查,也可以通过对操作留痕的分析,判断或找出操作者的蛛丝马迹,同样的方法如果被别有用心的人使用,也会暴露用户的隐私。本文对常见的操作留痕问题以及消除操作留痕的方法进行了讨论。 王靖亚关键词:侦查 反侦查