摘要

声音是人类获取信息的重要来源,对声音内容进行自动分析和理解具有重要意义.本文介绍声音的基本知识,从信号、听觉感受、声音特性等3个角度对声音进行分类,阐明各个分类之间的关系,明确基于一般音频/环境声的计算机听觉技术的研究对象和学科位置.之后,介绍计算机听觉技术的基本概念、原理、研究课题和技术框架.作者全面总结了计算机听觉技术在各个领域中:包括医疗卫生,安全保护,交通运输、仓储,制造业,农、林、牧、渔业,水利、环境和公共设施管理业,建筑业,其他采矿业、日常生活、身份识别、军事等的典型应用.分类总结了各领域计算机听觉应用中现有典型文献的基本原理、技术路线.最后总结计算机听觉领域存在的各方面问题,并展望未来发展趋势.