针对文本数据权属模糊不清、内容隐私容易泄露等问题,提出了一种隐私保护的文本数据确权方法。通过改进相似哈希(Simhash)算法,结合关键词和上下文特征生成数字指纹,提升相似文本检测效果。基于数字指纹和身份信息构造数字水印,嵌入原始文本作为所有权证明。利用区块链可靠记录文本数据权属信息,设计智能合约计算文本相似度,提高确权效率。实验结果及分析表明,该方法能够在保护内容隐私的同时有效检测相似文本,支持数据所有权的追溯及验证。