摘要
[目的/意义]针对我国汉藏双语用户在网络信息搜寻中的语码转换现象,对汉藏双语查询式的构造进行研究,为汉藏双语用户和搜索引擎提供语码转换搜索场景下的搜索策略与检索系统优化建议。[方法/过程]采用受控用户实验的方法,采集语码转换情境下汉藏双语用户的查询式,对双语查询式集进行文本分析、聚类分析,获取汉藏语码转换情境下的查询式构造特征,归纳查询重构模式。[结果/结论]对比汉-藏与藏-汉语码转换方向,发现用户在语码转换前后的查询式长度、语法复杂度与语义相似度上均体现出明显的差异。汉藏双语语码转换的查询重构表现出偏离、邻近、扩展与简缩4种模式。
- 单位