PaddleOCR MCP Server

Official

Overview Schema Related Servers Score Discussions

PaddleOCR
docs
datasets

table_datasets.md•1.92 KiB

--- comments: true typora-copy-images-to: images --- # 表格识别数据集这里整理了常用表格识别数据集，持续更新中，欢迎各位小伙伴贡献数据集～ ## 数据集汇总 | 数据集名称 |图片下载地址| PPOCR标注下载地址 | |---|---|---| | PubTabNet |<https://github.com/ibm-aur-nlp/PubTabNet>| jsonl格式，可直接用[pubtab_dataset.py](https://github.com/PaddlePaddle/PaddleOCR/blob/main/ppocr/data/pubtab_dataset.py)加载 | | 好未来表格识别竞赛数据集 |<https://ai.100tal.com/dataset>| jsonl格式，可直接用[pubtab_dataset.py](https://github.com/PaddlePaddle/PaddleOCR/blob/main/ppocr/data/pubtab_dataset.py)加载 | | WTW中文场景表格数据集 |<https://github.com/wangwen-whu/WTW-Dataset>| 需要进行转换后才能用[pubtab_dataset.py](https://github.com/PaddlePaddle/PaddleOCR/blob/main/ppocr/data/pubtab_dataset.py)加载 | ## 1. PubTabNet数据集 - **数据简介**：PubTabNet数据集的训练集合中包含50万张图像，验证集合中包含0.9万张图像。部分图像可视化如下所示。 <div align="center"> <img src="./images/table_PubTabNet_demo/PMC524509_007_00.png" width="500"> <img src="./images/table_PubTabNet_demo/PMC535543_007_01.png" width="500"> </div> - **说明**：使用该数据集时，需要遵守[CDLA-Permissive](https://cdla.io/permissive-1-0/)协议。 ## 2. 好未来表格识别竞赛数据集 - **数据简介**：好未来表格识别竞赛数据集的训练集合中包含1.6万张图像。验证集未给出可训练的标注。 <div align="center"> <img src="./images/table_tal_demo/1.jpg" width="500"> <img src="./images/table_tal_demo/2.jpg" width="500"> </div> ## 3. WTW中文场景表格数据集 - **数据简介**：WTW中文场景表格数据集包含表格检测和表格数据两部分数据，数据集中同时包含扫描和拍照两张场景的图像。 ![img](./images/20210816_210413.gif)

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/PaddlePaddle/PaddleOCR'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

table_datasets.md•1.92 KiB