性能超越 GPT-4o 及 Qwen2.5-VL，百度超輕量小模型 PP-OCRv5 Blog 持續(xù)登頂 Hugging Face 熱度第一

拉風(fēng)的極客2025/09/18

摘要

近日，百度在海外官方賬號介紹了最新輕量級文字識別模型 PP-OCRv5。

近日，百度在海外官方賬號介紹了最新輕量級文字識別模型 PP-OCRv5。該模型僅 0.07B 參數(shù)，以千分之一參數(shù)量實(shí)現(xiàn)與 700 億參數(shù)大模型相媲美的 OCR 精度。在多項(xiàng) OCR 場景測試中，PP-OCRv5 的表現(xiàn)超越 GPT-4o、Qwen2.5-VL-72B 等通用視覺大模型。最新信息顯示，飛槳團(tuán)隊(duì)發(fā)布的技術(shù) Blog 已連續(xù)一周登頂 Hugging Face 博客熱度榜首，受到開發(fā)者社區(qū)的廣泛關(guān)注。

Blog 指出，在 OCR 場景中，通用視覺大模型（VLM）在精確文本定位和邊框精度上仍面臨挑戰(zhàn)，同時(shí)容易帶來高計(jì)算開銷和「幻覺」輸出。相較于 VLM，PP-OCRv5 采用了模塊化雙階段檢測與識別方案，能夠?qū)崿F(xiàn)輕量高效推理與更精準(zhǔn)的文本邊界框輸出。

Benchmark 數(shù)據(jù)顯示，PP-OCRv5 在 Printed Chinese、Printed English、Handwritten English 等核心任務(wù)上與百億級大模型 Qwen2.5-VL-72B 精度持平甚至更優(yōu)；在 Handwritten Chinese、Chinese Pinyin 等復(fù)雜場景中，仍穩(wěn)居前列，表現(xiàn)出強(qiáng)泛化能力。

作為百度飛槳團(tuán)隊(duì)推出的全場景文字識別模型，PP-OCRv5 是業(yè)界首個(gè)單模型支持 5 種文字類型的超輕量級（<100M）開源模型，且支持復(fù)雜手寫體識別，可廣泛應(yīng)用于教育行業(yè)的試卷作業(yè)批改、醫(yī)療行業(yè)的病歷數(shù)字化、法律行業(yè)的合同筆錄數(shù)字化等多場景業(yè)務(wù)需求。

2025 年 5 月，飛槳團(tuán)隊(duì)推出 PaddleOCR 3.0 版本，文字識別方案 PP-OCRv5 與通用文檔解析方案 PP-StructureV3，以及原生支持文心大模型 4.5 的智能文檔理解方案 PP-ChatOCRv4 共同構(gòu)成其三大特色能力。自 2020 年開源以來，PaddleOCR 累計(jì)下載量突破 900 萬，被超過 5.9k 開源項(xiàng)目直接或間接使用，是 GitHub 社區(qū)中唯一一個(gè) Star 數(shù)超過 50k 的中國 OCR 項(xiàng)目。

百度飛槳文字識別模型 PP-OCRv5

馬上登錄

亚洲av无码1区2区久久,台湾佬综合网,首页人妻中文字幕,天堂网在线.www资源,丝袜中出制服人妻美腿

性能超越 GPT-4o 及 Qwen2.5-VL，百度超輕量小模型 PP-OCRv5 Blog 持續(xù)登頂 Hugging Face 熱度第一

最新文章

亚洲av无码1区2区久久,台湾佬综合网,首页人妻中文字幕,天堂网在线.www资源,丝袜 中出 制服 人妻 美腿

最新文章

亚洲av无码1区2区久久,台湾佬综合网,首页人妻中文字幕,天堂网在线.www资源,丝袜中出制服人妻美腿