2025年9月15日
星期一
|
欢迎来到上海浦东图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
张敬之
作品数:
1
被引量:8
H指数:1
供职机构:
南京大学计算机科学与技术系计算机软件新技术国家重点实验室
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
潘金贵
南京大学计算机科学与技术系计算...
耿桦
南京大学计算机科学与技术系计算...
高强
南京大学计算机科学与技术系计算...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
信息抽取
1篇
后缀树
1篇
WEB信息
1篇
WEB信息抽...
1篇
抽取
机构
1篇
南京大学
作者
1篇
高强
1篇
耿桦
1篇
潘金贵
1篇
张敬之
传媒
1篇
计算机科学
年份
1篇
2007
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于重复模式的Web信息抽取
被引量:8
2007年
网页中的大量数据记录往往以重复的HTML结构进行有规律的组织,从而形成一致的表现形式。根据这一特征,本文给出一种基于重复模式的Web内容抽取方法。通过使用一种叫做后缀树的数据结构,分析页面结构中所包含的重复模式,进而从模式的实例中抽取出对应的数据记录。
高强
张敬之
耿桦
潘金贵
关键词:
WEB信息抽取
后缀树
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张