基于爬虫和WPF技术的藏文命名实体数据集半自动构建器设计

李甜华; 央啦; 杨文艺; 春燕<sup>*</sup>

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于爬虫和WPF技术的藏文命名实体数据集半自动构建器设计

作者：李甜华; 央啦; 杨文艺; 春燕^*

来源：现代计算机(专业版), 2023, 29(21): 93-97.

摘要

近年来自然语言处理发展较为迅速，自然语言的处理离不开大量的、高质量的数据集。藏文语言处理是自然语言处理的一个重要应用。但公开的藏文数据集获取难度高，为提高自建藏文命名实体数据集，对藏文命名实体数据集半自动构建器进行了研究，包含爬虫部分和拆分部分，并提出了一种基于滑动窗口的命名实体匹配算法。其中，爬虫部分通过应用十分成熟稳定的八爪鱼采集器创建任务实现。拆分部分使用WPF技术设计操作界面，采用C#编程语言实现拆分算法。

收藏分享被引浏览

更新时间：2024-03-18 11:14

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号