摘要

文章研究探索了如何使用文档分解(文档结构研究),文档标记(具有可扩展标记语言(XML),超文本标记语言(HML)和可伸缩矢量图形(SVG),以及多方面的分类机制。文档内容提取是通过计算机编程(使用Java)实现的。在这项研究中开发的文档信息自动提取技术证明:作为信息提供者,可以使信息用户(包括工程师)以更易于访问的方式制作文档内容。

  • 单位
    南方电网调峰调频发电有限公司