ispras/dedoc
概要
Dedoc is a library (service) for automate documents parsing and bringing to a uniform format. It automatically extracts content, logical structure, tables, and meta information from textual electronic documents. (Parse document; Document content extraction; Logical structure extraction; PDF parser; Scanned document parser; DOCX parser; HTML parser
リポジトリ情報
| スター数 | ★ 648 |
|---|---|
| フォーク数 | 51 |
| 言語 | Python |
| ライセンス | Apache-2.0 |
| 作成日 | 2020/12/7 |
| 最終更新 | 2026/3/4 |
| Issue数 | 6 |
トピック
docdocument-analysisdocument-content-extractiondocumentsdocxdocx-parserexcelhtmlhtml-parserlogical-structure-extractionocrodtpdfpdf-parserscanned-documentstable-of-contentstable-recognitiontxt
関連サービス
このOSSの運用に役立つサービス