上海人工智能实验室开源:智能数据提取工具MinerU发布

6个月前发布AI俱乐部
3 0 0
上海人工智能实验室开源:智能数据提取工具MinerU发布的封面图

在2024年的WAIC(世界人工智能大会)上,由上海人工智能实验室OpenDataLab主导的一项名为MinerU的大规模多模态文档理解工具正式对外发布。该工具旨在为人工智能领域提供强大的文档处理能力,助力AI应用更好地理解和利用知识。

MinerU是一个综合性的、高质量的通用文档智能工具箱,它集成了文档内容的提取、分析、理解等多种功能。不仅支持常见的非扫描文档,还能够处理包含复杂表格、图表的PDF文档,甚至能够识别Markdown格式的内容。此外,它还支持多种版面分析技术和超过40种语言的光学字符识别(OCR),能够无缝处理epub、mobi、docx等多种格式,并支持将这些格式的内容转换为Markdown。

MinerU包含了两个核心模块:Magic-PDF和Magic-Doc。Magic-PDF专注于PDF文档的处理,能够将PDF文档转换为Markdown格式,支持提取PDF文档中的表格,并且能够识别文档的结构和层级关系,方便用户理解文档的内容。Magic-Doc则侧重于通用文档的智能处理,可以处理各种常见的文档类型,例如论文、报告、书籍等,并支持对文档进行分段、提取摘要、生成目录等操作。

总而言之,MinerU提供的PDF文档解析能力涵盖了PDF文档的通用内容提取、复杂版面的分析、关键信息的抽取以及PDF文档结构的理解等多个方面。它还整合了一系列先进的深度学习模型,如LayoutLMv3、YOLOv8、UniMERNet和PaddleOCR,以提升各种文档场景下的文档理解能力。

MinerU的发布,旨在为AI应用提供一个全面而强大的文档理解工具,从而降低人工智能在文档处理方面的技术门槛,促进相关领域的研究和应用。

项目体验地址:

https://modelscope.cn/studios/OpenDataLab/MinerU

项目开源地址:

https://github.com/opendatalab/MinerU/

MinerU 开源模型(PDF-Extract-Kit):

https://modelscope.cn/models/OpenDataLab/PDF-Extract-Kit

© 版权声明:
本文地址:https://aidh.net/kuaixun/v6e4liub

暂无评论

none
暂无评论...